Huis Het-Business Wat is kruisvalidatie? - definitie van techopedia

Wat is kruisvalidatie? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent kruisvalidatie?

Kruisvalidatie is een techniek die wordt gebruikt om te beoordelen hoe de resultaten van statistische analyse generaliseren naar een onafhankelijke gegevensset. Kruisvalidatie wordt grotendeels gebruikt in instellingen waar het doel voorspelling is en het is noodzakelijk om de nauwkeurigheid van de prestaties van een voorspellend model te schatten. De belangrijkste reden voor het gebruik van kruisvalidatie in plaats van conventionele validatie is dat er onvoldoende gegevens beschikbaar zijn om ze in afzonderlijke trainings- en testsets te verdelen (zoals bij conventionele validatie). Dit resulteert in een verlies van test- en modelleringscapaciteit.

Cross-validatie wordt ook wel rotatieschatting genoemd.

Techopedia verklaart Cross-Validation

Voor een voorspellingsprobleem wordt een model over het algemeen voorzien van een gegevensset met bekende gegevens, de trainingsgegevensset genoemd, en een set onbekende gegevens waartegen het model wordt getest, bekend als de testgegevensset. Het doel is om een ​​gegevensset te hebben om het model in de trainingsfase te testen en vervolgens inzicht te geven in hoe het specifieke model zich aanpast aan een onafhankelijke gegevensset. Een ronde van validatie omvat het partitioneren van gegevens in complementaire subsets en vervolgens het uitvoeren van analyses op één subset. Hierna wordt de analyse gevalideerd op andere subsets (testsets). Om de variabiliteit te verminderen, worden veel ronden van kruisvalidatie uitgevoerd met behulp van veel verschillende partities en vervolgens wordt een gemiddelde van de resultaten genomen. Kruisvalidatie is een krachtige techniek bij het schatten van de modelprestatietechniek.

Wat is kruisvalidatie? - definitie van techopedia