Q:
Waarom is een verwarringmatrix nuttig in ML?
EEN:Er zijn een aantal manieren om te praten over waarom een verwarringmatrix waardevol is bij machine learning (ML) - maar een van de eenvoudigste manieren is om uit te leggen dat de verwarringmatrix een gegevensvisualisatiebron is.
Met een verwarringmatrix kunnen kijkers in één oogopslag de resultaten zien van het gebruik van een classifier of ander algoritme. Door een eenvoudige tabel te gebruiken om analytische resultaten te tonen, brengt de verwarringmatrix in wezen uw resultaten samen in een beter verteerbare weergave.
De verwarringmatrix gebruikt specifieke terminologie om resultaten te rangschikken. Er zijn echte positieven en echte negatieven, evenals valse positieven en valse negatieven. Voor een meer gecompliceerde verwarringmatrix of een op basis van vergelijkingsclassificatie, kunnen deze waarden worden weergegeven als werkelijke en voorspelde klassen voor twee afzonderlijke objecten.
Ongeacht de semantische terminologie zijn de resultaten gegroepeerd in een vierkante (of rechthoekige) tabel.
Deze weergave maakt het eenvoudiger voor analisten om te zien hoe accuraat een algoritme was bij het classificeren van resultaten. (Lees nieuwe generatoren laten moderne algoritmen werken aan ASCII-kunst.)
Het nut van de verwarringmatrix heeft te maken met de complexiteit van ML-projecten en ook met de manier waarop informatie wordt opgemaakt en aan gebruikers wordt geleverd. Stel je een reeks lineaire resultaten voor, inclusief valse positieven, valse negatieven, echte positieven en echte negatieven. (Lees Machine Learning 101.)
Een gebruiker zou al die lineaire resultaten in een grafiek moeten zetten om te begrijpen hoe het algoritme werkte en hoe nauwkeurig het was. Met de verwarringmatrix wordt deze informatie eenvoudig gepresenteerd in een krachtig visueel model.
Stel bijvoorbeeld dat de machine wordt gevraagd om 20 afbeeldingen te classificeren, waarvan vijf fruit en vijf groenten. Als een verwarringmatrix de volgende inhoud bevat (van linksboven met de klok mee): 7, 5, 3, 5, dan toont de matrix dat zeven correct werden geïdentificeerd als groenten, terwijl drie correct werden geclassificeerd als fruit.
De andere 10, zoals weergegeven, zijn resultaten waarbij het programma de afbeelding niet correct kon identificeren.
De verwarringmatrix zal nuttig zijn in allerlei ML-analyses. Door deze bron te observeren, kunnen gebruikers uitzoeken hoe ze problemen als dimensionaliteit en overfitting kunnen aanpakken en andere manieren om een algoritme te optimaliseren.