Q:
Wat is het verschil tussen begeleid, niet-begeleid en semi-begeleid leren?
EEN:Het belangrijkste verschil tussen begeleid en niet-gecontroleerd leren bij machine learning is het gebruik van trainingsgegevens.
Begeleid leren maakt gebruik van voorbeeldgegevens om te laten zien hoe 'juiste' gegevens eruit zien. De gegevens zijn gestructureerd om de uitgangen van gegeven ingangen te tonen.
Een machine learning-algoritme dat fruit classificeert, kan afbeeldingen van fruit zoals appels, bananen, druiven en sinaasappels als inputs hebben en de namen van deze fruitsoorten als outputs.
Een voorbeeld uit de praktijk zijn de Bayesiaanse spamfilters in e-mailprogramma's. Deze filters zijn getraind met voorbeelden van e-mails die als spam worden beschouwd. Het spamfilter kan vervolgens zoeken naar bepaalde zinnen die voorkomen in e-mails die voorkomen in spam-e-mails en deze naar een map met spam verplaatsen.
Het is alsof je een mens laat zien hoe hij een nieuwe taak moet uitvoeren. Aan een persoon die gegevens invoert, kunnen voorbeelden van de gegevens worden getoond in een indeling die het bedrijf wil en vervolgens wordt verwacht deze te volgen.
Programma's voor machinaal leren die begeleid leren gebruiken, itereren vele malen met de trainingsgegevens. De resultaten kunnen indrukwekkend zijn als het echt op gang komt. Het Gmail-spamfilter van Google is zeer nauwkeurig omdat er zoveel gebruikers zijn die het trainen.
Leren zonder toezicht heeft geen voorafgaande trainingsgegevens. In ons voorbeeld van fruitclassificatie kan een algoritme alleen afbeeldingen van fruit worden getoond en verteld om ze te classificeren.
Ongecontroleerd leren heeft toepassingen in marktonderzoek door koopgedrag van klanten te leren, of veiligheid door hackpatronen te volgen.
Semi-begeleid leren probeert een middenpositie in te nemen door sommige gegevens te labelen. De appel en sinaasappel kunnen bijvoorbeeld worden geƫtiketteerd in het fruitclassificatieprogramma, maar de banaan en de druiven zijn dat niet.
Wanneer een van deze algoritmen moet worden gebruikt, is afhankelijk van het type gegevens dat wordt gebruikt. Sommige taken hebben stabiele patronen, zoals creditcardfraude of spamberichten. Begeleid leren is geschikt voor dit soort taken. Netwerkaanvallen zijn onvoorspelbaar en onbewaakte of semi-begeleide leermethoden kunnen beter geschikt zijn.