Inhoudsopgave:
De hoeveelheid big data neemt enorm toe met de dag. Van 2500 exabytes in 2012 zal big data naar verwachting toenemen tot 40.000 exabytes in 2020. Daarom is dataopslag een serieuze uitdaging die alleen de cloudinfrastructuur aankan. De cloud is een populaire optie geworden, vooral vanwege de enorme opslagcapaciteit en gebruiksvoorwaarden die de abonnee geen verplichtingen opleggen. Cloudopslag kan worden aangeboden in de vorm van abonnementen en diensten die een vooraf bepaalde periode duren. Daarna is er geen verplichting van de zijde van de klant om het te vernieuwen.
Het opslaan van big data in de cloud opent echter nieuwe beveiligingsuitdagingen die niet kunnen worden geconfronteerd met beveiligingsmaatregelen die zijn genomen voor reguliere, statische data. Hoewel big data geen nieuw concept is, begint de verzameling en het gebruik ervan pas de laatste jaren snel te groeien. In het verleden waren big data-opslag en analyse beperkt tot alleen grote bedrijven en de overheid die zich de infrastructuur konden veroorloven die nodig was voor data-opslag en mining. Een dergelijke infrastructuur was eigendom van en niet blootgesteld aan algemene netwerken. Big data is nu echter goedkoop beschikbaar voor alle soorten ondernemingen via de openbare cloudinfrastructuur. Als gevolg hiervan zijn nieuwe, geavanceerde beveiligingsbedreigingen ontstaan en deze blijven zich vermenigvuldigen en evolueren.
Beveiligingsproblemen in gedistribueerde programmeerkaders
Gedistribueerde programmeerkaders verwerken big data met parallelle reken- en opslagtechnieken. In dergelijke frameworks kunnen niet-geverifieerde of gewijzigde mappers - die grote taken verdelen in kleinere subtaken, zodat de taken kunnen worden geaggregeerd om een definitieve output te creëren - gegevens compromitteren. Defecte of gewijzigde werkknooppunten - die invoer van de mapper nodig hebben om de taken uit te voeren - kunnen gegevens compromitteren door op datacommunicatie tussen de mapper en andere werkknooppunten te tikken. Rogue werkknooppunten kunnen ook kopieën van legitieme werkknooppunten maken. Het feit dat het uiterst moeilijk is om malafide mappers of knooppunten in een dergelijk enorm kader te identificeren, maakt het waarborgen van gegevensbeveiliging nog een grotere uitdaging.