Table des matières:
- Définition - Que signifie le problème d'apprentissage de la valeur?
- Techopedia explique le problème de l'apprentissage de la valeur
Définition - Que signifie le problème d'apprentissage de la valeur?
Le problème de l'apprentissage de la valeur est un problème fondamental spécifique dans le développement des technologies d'apprentissage automatique et d'intelligence artificielle qui aborde la différence entre les humains et les ordinateurs, et les façons dont ils pensent.
En un mot, le problème de l'apprentissage de la valeur est basé sur la difficulté pour les ordinateurs de comprendre ce qu'il faut "valoriser" (en termes de données et de politique) et comment agir dans un réseau d'apprentissage automatique, et comment les programmeurs peuvent optimiser la façon dont le programme agit pour correspondre à leurs intentions d'origine lorsqu'ils l'ont créé.
Techopedia explique le problème de l'apprentissage de la valeur
La clé du problème de l'apprentissage des valeurs est qu'il est extrêmement important pour les programmeurs de pouvoir créer des programmes d'apprentissage automatique qui respectent les valeurs souhaitées. Cependant, le catch-22 est que les valeurs ne peuvent pas être explicitement énoncées de manière à entraver l'apprentissage du programme lui-même.
Les gens parlent parfois de la «convergence» des technologies d'apprentissage automatique comme de la concentration réussie sur les données de valeur, mais le problème de l'apprentissage de valeur est à certains égards un peu différent. C'est l'idée qu'il doit y avoir un moyen fondamental de montrer au programme d'apprentissage automatique ce qui est souhaité, plutôt que de simplement l'exprimer, ce qui est une façon déterministe d'exécuter ML.
Par exemple, prenez cet article sur le problème d'apprentissage de la valeur qui suggère que les programmes d'apprentissage automatique pourraient avoir un ensemble de stockage d'entrées montrant des réponses humaines positives aux stimuli. En lisant ces types d'adresses au problème de l'apprentissage de la valeur, il devient clair qu'il y a un écart majeur dans l'apprentissage automatique qui n'est pas facile à corriger - essentiellement - comment les gens créent-ils des machines qui peuvent vraiment penser comme des gens? Une autre façon d'expliquer cela est que le problème de l'apprentissage de la valeur va au cœur de notre façon de penser en tant qu'êtres humains et de la façon dont nos pensées ne sont pas toujours basées sur une entrée par cœur.
Pour les ordinateurs, modéliser notre intuition, notre instinct, nos inclinations sociales et nos valeurs éthiques les plus profondes est un défi de taille, même lorsque les ordinateurs peuvent apprendre à jouer aux échecs de manière humaine, ou nous devancer pour résoudre des problèmes mathématiques difficiles. Les professionnels peuvent s'attendre à ce que le programme d'apprentissage de la valeur continue d'être au cœur du développement des technologies d'apprentissage automatique.
