Inhoudsopgave:
Definitie - Wat betekent Big Data?
Big data verwijst naar een proces dat wordt gebruikt wanneer traditionele datamining- en verwerkingstechnieken de inzichten en betekenis van de onderliggende data niet kunnen achterhalen. Gegevens die ongestructureerd of tijdgevoelig of gewoon erg groot zijn, kunnen niet worden verwerkt door relationele database-engines. Dit type gegevens vereist een andere verwerkingsaanpak, big data genaamd, die massale parallelliteit gebruikt op direct beschikbare hardware.
Techopedia legt Big Data uit
Simpel gezegd weerspiegelt big data de veranderende wereld waarin we leven. Hoe meer dingen veranderen, hoe meer de veranderingen worden vastgelegd en vastgelegd als data. Neem het weer als voorbeeld. Voor een weersvoorspeller is de hoeveelheid wereldwijd verzamelde gegevens over lokale omstandigheden aanzienlijk. Logisch gezien zou het logisch zijn dat lokale omgevingen regionale effecten dicteren en regionale effecten dicteren wereldwijde effecten, maar het kan heel andersom zijn. Op de een of andere manier weerspiegelen deze weergegevens de kenmerken van big data, waar real-time verwerking nodig is voor een enorme hoeveelheid gegevens, en waar het grote aantal ingangen door machines kan worden gegenereerd, persoonlijke waarnemingen of externe krachten zoals zonnevlekken.
Het verwerken van dergelijke informatie illustreert waarom big data zo belangrijk is geworden:
- De meeste gegevens die nu worden verzameld, zijn ongestructureerd en vereisen een andere opslag en verwerking dan die in traditionele relationele databases.
- De beschikbare rekenkracht is enorm, wat betekent dat er meer mogelijkheden zijn om big data te verwerken.
- Het internet heeft gedemocratiseerde gegevens, waardoor de beschikbare gegevens gestaag toenemen en tegelijkertijd steeds meer onbewerkte gegevens worden geproduceerd.
Gegevens in onbewerkte vorm hebben geen waarde. Gegevens moeten worden verwerkt om waardevol te zijn. Hierin ligt echter het inherente probleem van big data. Is het verwerken van gegevens van een native objectindeling tot een bruikbaar inzicht de enorme kapitaalkosten waard? Of zijn er gewoon te veel gegevens met onbekende waarden om de gok te rechtvaardigen om deze met big data-tools te verwerken? De meesten van ons zijn het erover eens dat het kunnen voorspellen van het weer waarde zou hebben, de vraag is of die waarde opweegt tegen de kosten van het verwerken van alle real-time gegevens in een weerbericht waarop kan worden gerekend.