Huis audio Wat is een gedeeltelijk waarneembaar markov-beslissingsproces (pomdp)? - definitie van techopedia

Wat is een gedeeltelijk waarneembaar markov-beslissingsproces (pomdp)? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent gedeeltelijk waarneembaar Markov-besluitvormingsproces (POMDP)?

Een gedeeltelijk waarneembaar Markov-beslissingsproces (POMPD) is een Markov-beslissingsproces waarbij de agent de onderliggende toestanden in het model niet rechtstreeks kan waarnemen. Het Markov-beslissingsproces (MDP) is een wiskundig raamwerk voor het modelleren van beslissingen die een systeem met een reeks staten tonen en acties aan de beslisser bieden op basis van die staten.

De POMPD bouwt voort op dat concept om te laten zien hoe een systeem de uitdagingen van beperkte observatie aankan.

Techopedia verklaart gedeeltelijk waarneembaar Markov-besluitvormingsproces (POMDP)

In het gedeeltelijk waarneembare Markov-beslissingsproces, omdat de onderliggende staten niet transparant zijn voor de agent, is een concept dat een 'geloofsstaat' wordt genoemd, nuttig. De geloofsstaat biedt een manier om om te gaan met de dubbelzinnigheid die inherent is aan het model.

De POMPD is nuttig bij het leren van versterkingen, waarbij een systeem het MPD- of POMPD-model kan doorlopen met behulp van wat bekend is om een ​​duidelijker beeld te krijgen van waarschijnlijkheidsresultaten.

Wat is een gedeeltelijk waarneembaar markov-beslissingsproces (pomdp)? - definitie van techopedia