Huis databases Wat is kennisontdekking in databases (kdd)? - definitie van techopedia

Wat is kennisontdekking in databases (kdd)? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent Knowledge Discovery in Databases (KDD)?

Kennisontdekking in databases (KDD) is het proces waarbij nuttige kennis uit een verzameling gegevens wordt ontdekt. Deze veel gebruikte dataminingtechniek is een proces dat gegevensvoorbereiding en -selectie, gegevensreiniging, het opnemen van voorkennis over gegevenssets en het interpreteren van nauwkeurige oplossingen uit de waargenomen resultaten omvat.

Belangrijke toepassingsgebieden van KDD zijn marketing, fraudedetectie, telecommunicatie en productie.

Techopedia verklaart Knowledge Discovery in Databases (KDD)

Traditioneel werden datamining en kennisontdekking handmatig uitgevoerd. Naarmate de tijd verstreek, werd de hoeveelheid gegevens in veel systemen groter dan de grootte van een terabyte en kon deze niet langer handmatig worden onderhouden. Bovendien wordt het voor het succesvolle bestaan ​​van elk bedrijf als essentieel beschouwd om onderliggende patronen in gegevens te ontdekken. Als gevolg hiervan werden verschillende softwaretools ontwikkeld om verborgen gegevens te ontdekken en aannames te doen, die deel uitmaken van kunstmatige intelligentie.

Het KDD-proces heeft de afgelopen 10 jaar zijn hoogtepunt bereikt. Het herbergt nu veel verschillende benaderingen van ontdekking, waaronder inductief leren, Bayesiaanse statistieken, semantische query-optimalisatie, kennisverwerving voor expertsystemen en informatietheorie. Het uiteindelijke doel is om kennis op hoog niveau te extraheren uit gegevens op laag niveau.

KDD omvat multidisciplinaire activiteiten. Dit omvat gegevensopslag en -toegang, algoritmen schalen naar enorme gegevenssets en interpretatieresultaten. Het data-opschonings- en gegevenstoegangsproces van datawarehousing vergemakkelijkt het KDD-proces. Kunstmatige intelligentie ondersteunt ook KDD door empirische wetten te ontdekken door experimenten en observaties. De patronen die in de gegevens worden herkend, moeten geldig zijn voor nieuwe gegevens en een zekere mate van zekerheid hebben. Deze patronen worden beschouwd als nieuwe kennis. Stappen die betrokken zijn bij het gehele KDD-proces zijn:

  1. Identificeer het doel van het KDD-proces vanuit het perspectief van de klant.
  2. Begrijp de betrokken toepassingsdomeinen en de vereiste kennis
  3. Selecteer een doelgegevensset of subset van gegevensmonsters waarop detectie wordt uitgevoerd.
  4. Reinig en preprocess gegevens door strategieën te bepalen om ontbrekende velden te verwerken en de gegevens te wijzigen volgens de vereisten.
  5. Vereenvoudig de gegevenssets door ongewenste variabelen te verwijderen. Analyseer vervolgens handige functies die kunnen worden gebruikt om de gegevens weer te geven, afhankelijk van het doel of de taak.
  6. Koppel KDD-doelen aan dataminingmethoden om verborgen patronen te suggereren.
  7. Kies datamining-algoritmen om verborgen patronen te ontdekken. Dit proces omvat het bepalen welke modellen en parameters geschikt kunnen zijn voor het algehele KDD-proces.
  8. Zoeken naar interessante patronen in een bepaalde representatievorm, waaronder classificatieregels of bomen, regressie en clustering.
  9. Essentiële kennis uit de gedolven patronen interpreteren.
  10. Gebruik de kennis en neem het op in een ander systeem voor verdere actie.
  11. Documenteer het en maak rapporten voor geïnteresseerde partijen.
Wat is kennisontdekking in databases (kdd)? - definitie van techopedia