Table des matières:
- Définition - Que signifie le processus de décision de Markov (MDP)?
- Techopedia explique le processus de décision de Markov (MDP)
Définition - Que signifie le processus de décision de Markov (MDP)?
Un processus de décision de Markov (MDP) est quelque chose que les professionnels appellent un «processus de contrôle stochastique à temps discret». Il est basé sur les mathématiques mises au point par l'universitaire russe Andrey Markov à la fin du 19e et au début du 20e siècles.
Techopedia explique le processus de décision de Markov (MDP)
Une façon d'expliquer un processus de décision de Markov et les chaînes de Markov associées est que ce sont des éléments de la théorie des jeux modernes basés sur des recherches mathématiques plus simples effectuées par le scientifique russe il y a une centaine d'années. La description d'un processus de décision de Markov est qu'il étudie un scénario dans lequel un système se trouve dans un ensemble donné d'états et passe à un autre état en fonction des décisions d'un décideur.
Une chaîne de Markov en tant que modèle montre une séquence d'événements où la probabilité d'un événement donné dépend d'un état précédemment atteint. Les professionnels peuvent parler d'un «espace d'état dénombrable» dans la description du processus de décision de Markov - certains associent l'idée du modèle de décision de Markov à un modèle de «marche aléatoire» ou à un autre modèle stochastique basé sur des probabilités (le modèle de marche aléatoire, souvent cité sur Wall Street, modélise le mouvement d'une action vers le haut ou vers le bas dans un contexte de probabilité de marché).
En général, les processus décisionnels de Markov sont souvent appliqués à certaines des technologies les plus sophistiquées sur lesquelles les professionnels travaillent aujourd'hui, par exemple dans les modèles de robotique, d'automatisation et de recherche.