Q:
Meer is niet altijd beter. Hoe kunnen organisaties de ruis in hun gegevens verminderen om gerichte, nauwkeurige analyses te realiseren?
EEN:Met de big data-systemen is een van de grote vragen voor bedrijven hoe ze deze projecten doelgericht en efficiënt kunnen houden. Veel van de tools en bronnen die zijn gebouwd voor big data zijn gebouwd om grote hoeveelheden informatie op te zuigen in een breed net. Ze zijn niet altijd zo attent om die gegevens te verfijnen en eenvoudig te houden. Er zijn echter enkele best practices in de branche om meer gerichte en bruikbare big data-projecten te creëren.
Een pijler van een gerichte big data-aanpak is het gebruik van de juiste softwaretools en middelen. Niet alle analyses en big data-systemen zijn hetzelfde. Sommige kunnen overtollige of irrelevante gegevens effectiever filteren en bedrijven toestaan zich te concentreren op de essentiële feiten die bepalend zijn voor hun kernprocessen en -activiteiten.
Een ander groot deel hiervan betreft mensen. Voordat ze betrokken raken bij een big data-project, en terwijl ze leverancierssoftware zoeken, implementatie nastreven en anderen trainen, moet een centrale groep mensen de leiding hebben over het proces en ook onderzoeks- en brainstormtaken delegeren. Dit kan van een big data-benadering een precieze, chirurgische methode maken die het bedrijf zal verbeteren zonder te topzwaar te worden en dagelijkse activiteiten te verstoren.
Taakgroepen of andere kerngroepen kunnen bijvoorbeeld gaan zitten en in detail kijken naar de manier waarop de implementatie zal worden uitgevoerd, hoe het bedrijf de gegevenssets zal gaan evalueren, hoe ze accounts gaan indexeren, wat voor soort papier of digitale presentaties die ze zullen gebruiken om die informatie te verspreiden, hoe ze nuttige rapporten kunnen maken, enz. Deze details beschermen het bedrijf tegen een opgeblazen big data.
Naarmate bedrijven meer leveranciersdiensten gaan verwerven, meer big data kraken en IT-architecturen complexer maken, hebben ze geleerd om de meest gevoelige gegevens van al het andere te scheiden.
Een manier om dit te doen is een gelaagd systeem te maken. Een kerngegevensset met klant-ID's en geschiedenis kan bijvoorbeeld worden bewaard in een speciaal onderhouden database onder een bepaald cloud-beveiligingscontract of op locatie. Andere gegevenssets kunnen zich in minder gespecialiseerde gegevensomgevingen bevinden, hetzij omdat ze minder gevoelig zijn voor datalekken, of omdat ze minder direct relevant zijn voor de analyses die het bedrijf uitvoert. Tiered of multi-level systemen zorgen voor kosteneffectieve big data-implementatie.
Dit zijn enkele van de manieren waarop bedrijven slim worden om big data op de juiste manier te krijgen. In plaats van alleen maar gegevens op te zuigen die ze kunnen verzamelen, behandelen ze bepaalde gegevenssets als het meest kritisch om met de minste inspanning de meeste bedrijfsinformatie te krijgen.