Inhoudsopgave:
Definitie - Wat betekent Unlabeled Data?
Niet-gelabelde gegevens zijn een aanduiding voor gegevens die niet zijn gelabeld met labels die kenmerken, eigenschappen of classificaties identificeren. Gegevens zonder label worden meestal gebruikt in verschillende vormen van machine learning.
Techopedia verklaart Unlabeled Data
Bij typen machine learning, genaamd machine-learning zonder toezicht, werkt het machine learning-programma door sets van niet-gelabelde gegevens te evalueren. Omdat de gegevens geen labels hebben, moet het machine learning-programma elk gegevensstuk identificeren op basis van zijn eigenschappen en kenmerken.
Een van de beste manieren om dit uit te leggen, is door de metafoor van de fruitschaal te gebruiken. Stel dat het machine learning-programma leert drie verschillende soorten fruit te identificeren - bananen, druiven en appels. Als de gegevens in de initiële trainingsset zijn gelabeld, werkt het machine learning-programma vanuit dat perspectief en worden opeenvolgende afbeeldingen aan een van die drie categorieën gekoppeld.
Als echter geen van de gegevens stukjes zijn gelabeld met de drie fruitnamen - bananen, druiven en appels - moet het machine learning-programma werken door elke afbeelding te evalueren en te kijken naar kenmerken zoals kleur - geel, rood of paars - vormen - lang en dun, rond of geclusterd - en andere kenmerken.
Uit dit voorbeeld is het gemakkelijk om te zien hoe gelabelde gegevens veel eenvoudigere mogelijkheden bieden om algoritmen voor machine learning te gebruiken voor beslissingsresultaten. Geavanceerde, niet-gecontroleerde machine learning-programma's die omgaan met niet-gelabelde gegevens kunnen echter ook verbluffend nauwkeurige en precieze resultaten opleveren.
