Qu'est-ce que l'apprentissage par renforcement? - définition de techopedia

2025

Table des matières:

Définition - Que signifie l'apprentissage par renforcement?
Techopedia explique l'apprentissage par renforcement

Définition - Que signifie l'apprentissage par renforcement?

L'apprentissage par renforcement, dans le contexte de l'intelligence artificielle, est un type de programmation dynamique qui forme des algorithmes à l'aide d'un système de récompense et de punition.

Un algorithme ou agent d'apprentissage par renforcement apprend en interagissant avec son environnement. L'agent reçoit des récompenses en effectuant correctement et des pénalités pour mauvaise exécution. L'agent apprend sans intervention d'un humain en maximisant sa récompense et en minimisant sa pénalité.

Techopedia explique l'apprentissage par renforcement

L'apprentissage par renforcement est une approche de l'apprentissage automatique qui s'inspire de la psychologie comportementaliste. Cela ressemble à la façon dont un enfant apprend à effectuer une nouvelle tâche. L'apprentissage par renforcement contraste avec d'autres approches d'apprentissage automatique en ce sens que l'algorithme n'est pas explicitement informé de la manière d'exécuter une tâche, mais qu'il résout le problème seul.

En tant qu'agent, qui pourrait être une voiture autonome ou un programme jouant aux échecs, interagit avec son environnement, reçoit un état de récompense en fonction de ses performances, comme conduire à destination en toute sécurité ou gagner une partie. À l'inverse, l'agent reçoit une pénalité pour mauvaise exécution, comme sortir de la route ou subir un échec et mat.

Au fil du temps, l'agent prend des décisions pour maximiser sa récompense et minimiser sa pénalité en utilisant la programmation dynamique. L'avantage de cette approche de l'intelligence artificielle est qu'elle permet à un programme d'IA d'apprendre sans qu'un programmeur ne précise comment un agent doit effectuer la tâche.