Q:
Quel est un moyen simple de décrire le biais et la variance dans l'apprentissage automatique?
UNE:Il existe un certain nombre de façons compliquées de décrire le biais et la variance dans l'apprentissage automatique. Beaucoup d'entre eux utilisent des équations mathématiques complexes et montrent à travers des graphiques comment des exemples spécifiques représentent différentes quantités de biais et de variance.
Voici un moyen simple de décrire le biais, la variance et le compromis biais / variance dans l'apprentissage automatique.
À la base, le biais est une simplification excessive. Il peut être important d'ajouter à la définition du biais une certaine hypothèse ou erreur supposée.
Si un résultat très biaisé n'était pas erroné - s'il s'agissait de l'argent - il serait très précis. Le problème est que le modèle simplifié contient une erreur, il n'est donc pas dans l'oeil de boeuf - l'erreur significative continue d'être répétée ou même amplifiée pendant que le programme d'apprentissage automatique fonctionne.
La définition simple de la variance est que les résultats sont trop dispersés. Cela conduit souvent à une surcomplexité du programme et à des problèmes entre les ensembles de test et de formation.
Une variance élevée signifie que de petits changements créent de grands changements dans les extrants ou les résultats.
Une autre façon de décrire simplement la variance est qu'il y a trop de bruit dans le modèle et qu'il devient donc plus difficile pour le programme d'apprentissage automatique d'isoler et d'identifier le signal réel.
Ainsi, l'un des moyens les plus simples de comparer le biais et la variance est de suggérer que les ingénieurs en apprentissage automatique doivent tracer une ligne fine entre trop de biais ou de simplification excessive, et trop de variance ou de surcomplexité.
Une autre façon de bien représenter ce problème consiste à utiliser un graphique à quatre quadrants montrant toutes les combinaisons de variance élevée et faible. Dans le quadrant faible biais / faible variance, tous les résultats sont rassemblés dans un cluster précis. Dans un résultat à biais élevé / faible variance, tous les résultats sont rassemblés dans un groupe inexact. Dans un résultat à faible biais / forte variance, les résultats sont dispersés autour d'un point central qui représenterait un cluster précis, tandis que dans un résultat à biais élevé / forte variance, les points de données sont à la fois dispersés et collectivement inexacts.