Table des matières:
Définition - Que signifie Q-learning?
Q-learning est un terme pour une structure d'algorithme représentant l'apprentissage par renforcement sans modèle. En évaluant la politique et en utilisant la modélisation stochastique, Q-learning trouve la meilleure voie à suivre dans un processus de décision de Markov.
Techopedia explique Q-learning
La composition technique de l'algorithme Q-learning implique un agent, un ensemble d'états et un ensemble d'actions par état.
La fonction Q utilise des pondérations pour différentes étapes en conjonction avec un facteur de remise afin d'évaluer les récompenses.
Bien que cela puisse sembler être une idée simple, le Q-learning est d'une importance primordiale dans de nombreux types de modèles d'apprentissage par renforcement et d'apprentissage en profondeur. L'un des meilleurs exemples est celui où le Q-learning approfondi est utilisé pour aider les programmes d'apprentissage automatique à apprendre des stratégies de jeu dans divers types de jeux vidéo, par exemple, dans les jeux Atari des années 1980. Ici, un réseau de neurones convolutionnels prélève des échantillons de jeu afin d'élaborer un modèle stochastique qui aidera l'ordinateur à mieux jouer au jeu au fil du temps.
Le Q-learning a un potentiel abondant pour aider à faire progresser l'intelligence artificielle et l'apprentissage automatique.




