Q:
Comment le concept d'équilibre peut-il éclairer les projets d'apprentissage automatique?
UNE:En général, un équilibre informera l'apprentissage automatique en cherchant à stabiliser les environnements d'apprentissage automatique et à créer des résultats avec un mélange compatible de composants déterministes et probabilistes.
Les experts décrivent un «équilibre» comme une situation où les acteurs rationnels d'un système d'apprentissage automatique parviennent à un consensus sur une action stratégique - en particulier, l'équilibre de Nash dans la théorie des jeux implique que deux ou plusieurs de ces acteurs rationnels consolident leurs stratégies en reconnaissant qu'aucun joueur ne profite de changer une stratégie particulière si les autres joueurs ne changent pas la leur.
Téléchargement gratuit: apprentissage automatique et pourquoi c'est important |
Une démonstration particulièrement populaire et simple de l'équilibre de Nash implique une matrice simple où deux joueurs choisissent chacun un résultat binaire.
Ce qui précède est une façon assez technique de décrire l'équilibre et son fonctionnement. Une manière beaucoup plus informelle d'illustrer le concept d'équilibre, en particulier l'exemple ci-dessus de deux acteurs rationnels ayant chacun un choix binaire, consiste à réfléchir à ce que vous pourriez appeler le scénario "marcher l'un vers l'autre dans le couloir du lycée".
Supposons que deux personnes marchent dans des directions différentes dans un couloir de lycée (ou tout autre type de zone), qui ne peut accueillir que deux personnes dans le sens de la largeur. Les deux voies ouvertes sont les résultats binaires. Si les deux acteurs rationnels choisissent des résultats binaires différents qui n'entrent pas en conflit, ils se passeront l'un l'autre et se diront bonjour. S'ils choisissent deux résultats binaires contradictoires - ils marchent dans le même espace, et l'un d'eux devra céder.
Dans l'exemple ci-dessus, si les deux acteurs rationnels choisissent les deux résultats compatibles et non conflictuels, le consensus général est que ni l'un ni l'autre ne gagne en modifiant sa stratégie - dans ce cas, ses directions de marche - si l'autre personne ne change pas la leur.
Ce qui précède constitue un équilibre qui peut être modélisé dans n'importe quelle construction d'apprentissage automatique donnée. Compte tenu de cet exemple simple, le résultat sera toujours les deux acteurs rationnels coopérant, ou en d'autres termes, deux personnes se croisant.
L'inverse pourrait être appelé un «déséquilibre» - si les deux acteurs rationnels choisissent des résultats contradictoires, comme mentionné, l'un d'eux devra céder. Cependant, le programme ML modélisant cela pourrait être jeté dans une boucle infinie si les deux décident de céder - un peu comme deux personnes qui se déplacent pour essayer de s'accommoder mutuellement et continuent de marcher vers la collision.
Des équilibres comme celui ci-dessus seront généralement utilisés dans l'apprentissage automatique pour créer un consensus et stabiliser les modèles. Les ingénieurs et les développeurs rechercheront les scénarios et les situations qui bénéficient des équilibres, et travailleront pour changer ou gérer ceux qui ne le font pas. En regardant des exemples du monde réel qui correspondent à des équilibres ML, il est facile de voir comment ce type d'analyse dans un système d'apprentissage automatique est particulièrement instructif pour comprendre comment modéliser le comportement humain en créant des acteurs et des agents rationnels. Ce n'est qu'un excellent exemple de la façon dont un équilibre peut être utilisé pour faire des progrès dans l'application des systèmes d'apprentissage automatique.