Huis trends 6 Grote mythen over het beheer van big data

6 Grote mythen over het beheer van big data

Inhoudsopgave:

Anonim

In mei 2014 publiceerde Forrester Research twee rapporten met bepaalde conclusies over de hype rond big data. Het onderzoeksbureau ondervroeg meer dan 250 leidinggevenden op het gebied van marketing en bedrijfsontwikkeling. Volgens de auteurs van het rapport is de retoriek van big data altijd hoog, en verkopers van technologie zijn producten aan het aanprijzen met wat ongelooflijke claims lijken te zijn.


Gartner is het eens met Forrester Research; substantiële hype omringt big data. In het rapport van september 2014 ontkracht Gartner vijf van de grootste datamythes, en Gartner-analisten geven hun mening over wat er niet wordt begrepen over big data en de manipulatie ervan. Dus wat zijn de grootste mythen van big data? Laten we eens kijken.

Mythe: iedereen loopt voor op big data.

Gartner zegt dat de belangstelling voor big data altijd hoog is. Desondanks heeft 13 procent van de ondervraagden werkende systemen. De reden: de meeste bedrijven moeten nog uitzoeken hoe ze elke waarde kunnen onttrekken aan grote gegevensopslagplaatsen. Hier is het onderzoek van Gartner optimistischer dan het Forrester-rapport, waaruit bleek dat slechts 9 procent van de deelnemers aan het onderzoek zei dat ze van plan waren het volgende jaar big-data-technologie te implementeren. (Big data heeft veel te bieden. Meer informatie over 5 echte problemen die big data kunnen oplossen.)

Mythe: we hebben zoveel gegevens; we hoeven ons geen zorgen te maken over elk klein datafoutje.

Gartner maakt zich zorgen over een mens die wij hebben: "We hebben zoveel, het weinige dat slecht is, doet er niet toe." Ted Friedman, vice-president en vooraanstaand analist bij Gartner gelooft dat dit de verkeerde manier is om naar de situatie te kijken.


"In werkelijkheid, hoewel elke individuele fout een veel kleinere impact heeft op de hele dataset dan wanneer er minder gegevens waren, zijn er meer fouten dan voorheen omdat er meer gegevens zijn, " zei Friedman. "Daarom blijft de algehele impact van gegevens van slechte kwaliteit op de hele gegevensset hetzelfde."


Friedman voegt nog een reden tot bezorgdheid toe. Big-data-opname omvat vaak gegevens van buiten het bedrijf, die daarom van onbekende structuur en oorsprong zijn. Dit verhoogt het potentieel voor fouten.

Mythe: big data-technologie elimineert de noodzaak voor data-integratie.

Er zijn twee belangrijke strategieën voor gegevensanalyse die kunnen worden toegepast op big data: "schema bij schrijven" of "schema bij lezen". Tot voor kort was het schema bij het schrijven de enige methode die werd gebruikt. Schema bij lezen is de huidige rage in databasebeheer. In tegenstelling tot schema on write, waarvoor een gestructureerd formaat vereist is, worden gegevens in de ruwe indeling in schema's bij het lezen van databases geladen. Vervolgens buigen ontwikkelaars - met behulp van ongestructureerde databaseplatforms zoals Hadoop - de ongelijksoortige gegevens naar een bruikbaar formaat. Schema bij lezen heeft duidelijke voordelen, maar, zoals Gartner vermeldt, op een gegeven moment moet gegevensintegratie plaatsvinden.

Mythe: Het gebruik van een datawarehouse voor geavanceerde analyses is zinloos.

De tijd besteden aan het creëren van een datawarehouse lijkt voor veel informatiebeheerders zinloos, vooral wanneer nieuw vastgelegde gegevens verschillen van die in het datawarehouse. Gartner waarschuwt echter opnieuw dat zelfs geavanceerde data-analyse datawarehouses en nieuwe data zal gebruiken, wat betekent dat data-integrators:

  • Verfijn nieuwe gegevenstypen om ze geschikt te maken voor analyse
  • Bepaal welke gegevens relevant zijn en het vereiste niveau van gegevenskwaliteit
  • Bepaal hoe de gegevens moeten worden geaggregeerd
  • Begrijp dat het verfijnen van gegevens op andere plaatsen dan het datawarehouse kan gebeuren

Mythe: Datameren zullen het datawarehouse vervangen.

Datameren zijn opslagplaatsen van ongelijksoortige gegevens, in tegenstelling tot datawarehouses waar gegevens in een gestructureerd formaat zijn. Het creëren van een datameer kost weinig inspanning vooraf (het is niet nodig om de gegevens te formatteren) in vergelijking met datawarehouses, en daarom zijn datameren interessant.


Gartner benadrukt dat het niet het punt is om over de gegevens te beschikken - de vastgelegde gegevens kunnen manipuleren voor weloverwogen besluitvorming is het punt. Bovendien is het gebruik van (enigszins onbewezen) datameren om de besluitvorming te vergemakkelijken problematisch.


"Datawarehouses hebben al de mogelijkheden om een ​​breed scala aan gebruikers in een organisatie te ondersteunen, " zei Nick Heudecker, onderzoeksdirecteur bij Gartner. "Leiders op het gebied van informatiebeheer hoeven niet te wachten op datameren." (Meer informatie over het adopteren van big data in 7 dingen die u moet weten over big data vóór adoptie.)

Big Data Works - Nieuwe methoden voor gegevensmanipulatie mogelijk niet

De reden dat Gartner zei "grootste datafytieën" in plaats van "big-datafytieën" wordt duidelijk na het lezen van het rapport. Gartner is niet wantrouwend over big data. Gartner is wantrouwend voor degenen die vinden dat de nieuwere methoden voor het manipuleren van big data klaar zijn voor 'prime time'.

6 Grote mythen over het beheer van big data