Inhoudsopgave:
Definitie - Wat betekent Data Preprocessing?
Gegevensverwerking is een dataminingtechniek waarbij onbewerkte gegevens worden omgezet in een begrijpelijk formaat. Gegevens uit de echte wereld zijn vaak onvolledig, inconsistent en / of ontbreken in bepaald gedrag of trends, en bevatten waarschijnlijk veel fouten. Gegevensverwerking is een bewezen methode om dergelijke problemen op te lossen. Gegevensverwerking verwerkt onbewerkte gegevens voor verdere verwerking.
Data preprocessing wordt gebruikt database-gestuurde applicaties zoals klantrelatiebeheer en op regels gebaseerde applicaties (zoals neurale netwerken).
Techopedia legt Data Preprocessing uit
Gegevens doorlopen een aantal stappen tijdens de voorbewerking:
- Gegevens opschonen: gegevens worden opgeschoond door processen zoals het invullen van ontbrekende waarden, het gladmaken van de lawaaierige gegevens of het oplossen van de inconsistenties in de gegevens.
- Gegevensintegratie: gegevens met verschillende weergaven worden samengevoegd en conflicten binnen de gegevens worden opgelost.
- Datatransformatie: gegevens zijn genormaliseerd, geaggregeerd en gegeneraliseerd.
- Gegevensreductie: deze stap is bedoeld om een verminderde weergave van de gegevens in een gegevensmagazijn te presenteren.
- Gegevensdiscretisatie: impliceert de reductie van een aantal waarden van een continu kenmerk door het bereik van kenmerkintervallen te delen.