Table des matières:
Définition - Que signifie le sur-ajustement?
Dans les statistiques et l'apprentissage automatique, le sur-ajustement se produit lorsqu'un modèle essaie de prédire une tendance des données trop bruyantes. Le sur-ajustement est le résultat d'un modèle trop complexe avec trop de paramètres. Un modèle surajusté est inexact car la tendance ne reflète pas la réalité des données.
Techopedia explique le sur-ajustement
Un modèle surajusté est un modèle avec une ligne de tendance qui reflète les erreurs dans les données avec lesquelles il est formé, au lieu de prédire avec précision les données invisibles. Ceci est mieux vu visuellement avec un graphique de points de données et une ligne de tendance. Un modèle surajusté montre une courbe avec des points supérieurs et inférieurs, tandis qu'un modèle correctement ajusté montre une courbe lisse ou une régression linéaire.
Le problème principal du sur-ajustement est que le modèle a effectivement mémorisé les points de données existants plutôt que d'essayer de prédire à quel point les points de données seraient invisibles.
Le sur-ajustement résulte généralement d'un nombre excessif de points d'entraînement. Il existe un certain nombre de techniques que les chercheurs en apprentissage automatique peuvent utiliser pour atténuer le sur-ajustement, y compris la validation croisée, la régularisation, l'arrêt précoce, l'élagage, les prieurs bayésiens, l'abandon et la comparaison de modèles.