Huis audio Hoe kunnen bedrijven willekeurige bosmodellen gebruiken voor voorspellingen?

Hoe kunnen bedrijven willekeurige bosmodellen gebruiken voor voorspellingen?

Anonim

Q:

Hoe kunnen bedrijven willekeurige bosmodellen gebruiken voor voorspellingen?

EEN:

Bedrijven gebruiken vaak willekeurige bosmodellen om voorspellingen te doen met machine-leerprocessen. Het willekeurige forest gebruikt meerdere beslissingsbomen om een ​​meer holistische analyse van een gegeven gegevensset te maken.

Een enkele beslisboom werkt op basis van het scheiden van een bepaalde variabele of variabelen volgens een binair proces. Bij het beoordelen van gegevenssets met betrekking tot een set auto's of voertuigen, zou een enkele beslissingsboom elk afzonderlijk voertuig op gewicht kunnen sorteren en classificeren, waarbij ze worden onderverdeeld in zware of lichte voertuigen.

Het willekeurige forest bouwt voort op het beslissingsboommodel en maakt het geavanceerder. Experts praten over willekeurige bossen als "stochastische discriminatie" of de "stochastische gokmethode" voor gegevens die zijn toegepast op multidimensionale ruimtes. Stochastische discriminatie is vaak een manier om de analyse van datamodellen te verbeteren, verder dan wat een enkele beslisboom kan doen.

Kort gezegd creëert een willekeurig forest veel individuele beslissingsbomen die werken aan belangrijke variabelen waarop een bepaalde gegevensset is toegepast. Een belangrijke factor is dat in een willekeurig forest de gegevensset en variabele analyse van elke beslissingsboom doorgaans overlappen. Dat is belangrijk voor het model, omdat het willekeurige bosmodel de gemiddelde resultaten voor elke beslissingsboom neemt en deze in een gewogen beslissing verwerkt. In wezen neemt de analyse alle stemmen van verschillende beslissingsbomen en bouwt een consensus op om productieve en logische resultaten te bieden.

Een voorbeeld van het productief gebruiken van een willekeurig bosalgoritme is beschikbaar op de R-bloggersite, waar schrijfster Teja Kodali het voorbeeld neemt van het bepalen van de wijnkwaliteit door factoren zoals zuurgraad, suiker, zwaveldioxide-niveaus, pH-waarde en alcoholgehalte. Kodali legt uit hoe een random forest-algoritme een kleine willekeurige subset van functies voor elke afzonderlijke boom gebruikt en vervolgens de resulterende gemiddelden gebruikt.

Met dit in gedachten, zullen bedrijven die willekeurige algoritmen voor het leren van bosmachines willen gebruiken voor voorspellende modellen, eerst de voorspellende gegevens isoleren die moeten worden samengevat in een reeks producties, en deze vervolgens toepassen op het willekeurige bosmodel met behulp van een bepaalde set van training gegevens. Machine learning-algoritmen nemen die trainingsgegevens mee en werken daarmee verder dan de beperkingen van hun oorspronkelijke programmering. In het geval van willekeurige bosmodellen leert de technologie om meer geavanceerde voorspellende resultaten te vormen met behulp van die individuele beslissingsbomen om zijn willekeurige bosconsensus op te bouwen.

Een manier waarop dit kan worden toegepast op bedrijven is om verschillende producteigenschapsvariabelen te nemen en een willekeurig forest te gebruiken om potentiële klantbelangen aan te geven. Als er bijvoorbeeld bekende klantinteressefactoren zijn, zoals kleur, grootte, duurzaamheid, draagbaarheid of iets anders waar klanten interesse in hebben getoond, kunnen die attributen in de datasets worden ingevoerd en worden geanalyseerd op basis van hun eigen unieke impact voor multifactor analyse.

Hoe kunnen bedrijven willekeurige bosmodellen gebruiken voor voorspellingen?