Table des matières:
Définition - Que signifie la validation croisée?
La validation croisée est une technique utilisée pour évaluer comment les résultats de l'analyse statistique se généralisent à un ensemble de données indépendant. La validation croisée est largement utilisée dans les contextes où la cible est la prédiction et il est nécessaire d'estimer la précision des performances d'un modèle prédictif. La principale raison de l'utilisation de la validation croisée plutôt que de la validation conventionnelle est qu'il n'y a pas suffisamment de données disponibles pour les diviser en ensembles de formation et de test séparés (comme dans la validation conventionnelle). Il en résulte une perte de capacité de test et de modélisation.
La validation croisée est également connue sous le nom d'estimation de rotation.
Techopedia explique la validation croisée
Pour un problème de prédiction, un modèle est généralement fourni avec un ensemble de données de données connues, appelé ensemble de données d'apprentissage, et un ensemble de données inconnues par rapport auxquelles le modèle est testé, appelé ensemble de données de test. L'objectif est d'avoir un ensemble de données pour tester le modèle dans la phase de formation, puis de fournir un aperçu de la façon dont le modèle spécifique s'adapte à un ensemble de données indépendant. Un cycle de validation croisée comprend le partitionnement des données en sous-ensembles complémentaires, puis l'analyse sur un sous-ensemble. Après cela, l'analyse est validée sur d'autres sous-ensembles (ensembles de tests). Pour réduire la variabilité, de nombreux cycles de validation croisée sont effectués à l'aide de nombreuses partitions différentes, puis une moyenne des résultats est prise. La validation croisée est une technique puissante dans l'estimation de la technique de performance du modèle.
