Inhoudsopgave:
Definitie - Wat betekent Extractie?
Extractie is het proces waarbij relevante informatie uit gegevensbronnen in een specifiek patroon wordt afgeleid voor gebruik in een datawarehouse-omgeving. Extractie voegt betekenis toe aan de gegevens en is de eerste stap van het datatransformatieproces. Extractie haalt alleen bepaalde gegevens die passen bij een voorwaarde of categorie uit een enorme verzameling gegevens uit verschillende bronnen.
Techopedia legt Extractie uit
In een datawarehousingomgeving moet een enorme verzameling gegevens afkomstig van verschillende structuren en ongestructureerde bronnen worden verwerkt, getransformeerd en opgeslagen om zinvolle conclusies en voorspellingen af te leiden. De gegevens die afkomstig zijn van de primaire bronnen moeten op een systematische manier in het gegevensopslagsysteem worden geïmporteerd, waardoor de verschillende bewerkingen op gegevens eenvoudig kunnen worden uitgevoerd. Dit proces wordt extractie genoemd. Extractie voegt structuur toe aan anders ongestructureerde gegevens door bepaalde regels te volgen. Hier volgen enkele van de technieken die worden gebruikt bij het extraheren van gegevens:
- Patroonaanpassing
- Op tafel gebaseerde aanpak
- Tekstanalyse