Huis audio Wat is k-betekent clustering? - definitie van techopedia

Wat is k-betekent clustering? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent K-Means Clustering?

K-betekent clustering is een eenvoudig leerproces zonder toezicht dat wordt gebruikt om clusteringproblemen op te lossen. Het volgt een eenvoudige procedure voor het classificeren van een gegeven gegevensverzameling in een aantal clusters, gedefinieerd door de letter "k", die vooraf is vastgelegd. De clusters worden vervolgens gepositioneerd als punten en alle observaties of gegevenspunten worden geassocieerd met de dichtstbijzijnde cluster, berekend, aangepast en vervolgens begint het proces opnieuw met behulp van de nieuwe aanpassingen totdat een gewenst resultaat is bereikt.

K-betekent clustering heeft toepassingen in zoekmachines, marktsegmentatie, statistieken en zelfs astronomie.

Techopedia verklaart K-Means Clustering

K-betekent clustering is een methode die wordt gebruikt voor clusteranalyse, met name in datamining en statistieken. Het beoogt een reeks observaties in een aantal clusters (k) te verdelen, resulterend in de verdeling van de gegevens in Voronoi-cellen. Het kan worden beschouwd als een methode om erachter te komen tot welke groep een bepaald object echt behoort.

Het wordt voornamelijk in de statistiek gebruikt en kan op bijna elke studietak worden toegepast. In marketing kan het bijvoorbeeld worden gebruikt om verschillende demografische gegevens van mensen te groeperen in eenvoudige groepen die het gemakkelijker maken voor marketeers om zich te richten. Astronomen gebruiken het om enorme hoeveelheden astronomische gegevens te doorzoeken; omdat ze niet elk object één voor één kunnen analyseren, hebben ze een manier nodig om statistisch interessante punten te vinden voor observatie en onderzoek.

Het algoritme:

  1. K-punten worden in de objectgegevensruimte geplaatst die de eerste groep zwaartepunten vertegenwoordigt.
  2. Elk object of gegevenspunt wordt toegewezen aan de dichtstbijzijnde k.
  3. Nadat alle objecten zijn toegewezen, worden de posities van de k centroids opnieuw berekend.
  4. Stap 2 en 3 worden herhaald totdat de posities van de zwaartepunten niet meer bewegen.
Wat is k-betekent clustering? - definitie van techopedia