Huis Ontwikkeling Wat is een Markov-beslissingsproces (MDP)? - definitie van techopedia

Wat is een Markov-beslissingsproces (MDP)? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent Markov Decision Process (MDP)?

Een Markov-beslissingsproces (MDP) is iets dat professionals een 'discreet tijdstochastisch controleproces' noemen. Het is gebaseerd op wiskunde ontwikkeld door de Russische academicus Andrey Markov in de late 19e en vroege 20e eeuw.

Techopedia verklaart Markov Decision Process (MDP)

Een manier om een ​​Markov-besluitvormingsproces en bijbehorende Markov-ketens uit te leggen, is dat dit elementen zijn van de moderne speltheorie die zijn gebaseerd op eenvoudiger wiskundig onderzoek door de Russische wetenschapper van honderd jaar geleden. De beschrijving van een Markov-besluitvormingsproces is dat het een scenario bestudeert waarin een systeem zich in een bepaalde set staten bevindt en naar een andere staat gaat op basis van de beslissingen van een beslisser.

Een Markov-keten als model toont een reeks gebeurtenissen waarbij de waarschijnlijkheid van een bepaalde gebeurtenis afhangt van een eerder bereikte toestand. Professionals kunnen het hebben over een "telbare toestandsruimte" bij het beschrijven van het Markov-beslissingsproces - sommigen associëren het idee van het Markov-beslissingsmodel met een "random walk" -model of een ander stochastisch model op basis van waarschijnlijkheden (het random walk-model, vaak geciteerd op Wall Street, modelleert de beweging van een eigen vermogen naar boven of naar beneden in een context van marktwaarschijnlijkheid).

Over het algemeen worden Markov-besluitvormingsprocessen vaak toegepast op enkele van de meest geavanceerde technologieën waaraan professionals tegenwoordig werken, bijvoorbeeld in robotica, automatisering en onderzoeksmodellen.

Wat is een Markov-beslissingsproces (MDP)? - definitie van techopedia