Inhoudsopgave:
Definitie - Wat betekent ongestructureerde gegevens?
Ongestructureerde gegevens vertegenwoordigen alle gegevens die geen herkenbare structuur hebben. Het is ongeorganiseerd en ruw en kan niet-tekstueel of tekstueel zijn. E-mail is bijvoorbeeld een mooie illustratie van ongestructureerde tekstuele gegevens. Het bevat tijd, datum, ontvanger en afzender details en onderwerp, etc., maar een e-mail body blijft ongestructureerd. Ongestructureerde gegevens kunnen ook worden geïdentificeerd als los gestructureerde gegevens, waarbij de gegevensbronnen een structuur omvatten, maar niet alle gegevens in een gegevensverzameling dezelfde structuur volgen.
In klantgerichte bedrijven kunnen de gegevens in ongestructureerde vorm worden onderzocht om relatiemarketing en klantrelatiebeheer (CRM) te verbeteren. Aangezien apps voor sociale media, zoals Facebook en Twitter, mainstream worden, zal ongestructureerde gegevensontwikkeling waarschijnlijk de voortgang van gestructureerde gegevens overtreffen.
Techopedia legt ongestructureerde gegevens uit
Ongestructureerde gegevens verwijzen naar gegevens die een vorm volgen die minder geordend is dan items zoals spreadsheetpagina's, databasetabellen of andere lineaire of geordende gegevenssets. In feite is de term "gegevensset" nuttig omdat deze wordt geassocieerd met gegevens die zich in nette, toegankelijke arrays bevinden, zonder extra inhoud, en die zijn gekoppeld of getagd in een specifieke structuur.
Andere voorbeelden van ongestructureerde tekstuele gegevens zijn Word-documenten, PowerPoint-presentaties, expresberichten, samenwerkingssoftware, documenten, boeken, berichten op sociale media en medische dossiers. Niet-tekstuele ongestructureerde gegevens worden meestal gemaakt in media, zoals MP3-audiobestanden, JPEG-afbeeldingen en Flash-videobestanden, enz.
Ongestructureerde gegevens bevatten meestal geen vooraf gedefinieerd gegevensmodel en komen mogelijk niet goed overeen met relationele tabellen. Ongestructureerde gegevens zijn meestal tekstzwaar. Het kan echter cijfers en datums bevatten, evenals feiten. Dit leidt tot onduidelijkheden die moeilijk te identificeren zijn met conventionele softwareprogramma's.
De opslag van enorme hoeveelheden ongestructureerde gegevens die binnen een onderneming worden gegenereerd, kan bij slecht beheer leiden tot hogere kosten. Gegevens in papieren documenten of in een elektronisch formaat moeten worden gescand om een zoekapplicatie ideeën te laten ontleden, afhankelijk van de woorden die in bepaalde contexten worden gebruikt. Dit staat bekend als enterprise of semantisch zoeken.