Table des matières:
Définition - Que signifient les données de formation?
L'idée d'utiliser des données de formation dans des programmes d'apprentissage automatique est un concept simple, mais il est également très fondamental pour le fonctionnement de ces technologies. Les données de formation sont un ensemble initial de données utilisées pour aider un programme à comprendre comment appliquer des technologies comme les réseaux de neurones pour apprendre et produire des résultats sophistiqués. Il peut être complété par des ensembles de données ultérieurs appelés ensembles de validation et de test.
Les données d'entraînement sont également appelées ensemble d'entraînement, ensemble de données d'apprentissage ou ensemble d'apprentissage.
Techopedia explique les données de formation
L'ensemble de formation est le matériel par lequel l'ordinateur apprend à traiter les informations. L'apprentissage automatique utilise des algorithmes - il imite les capacités du cerveau humain à prendre diverses entrées et à les peser, afin de produire des activations dans le cerveau, dans les neurones individuels. Les neurones artificiels reproduisent une grande partie de ce processus avec des programmes d'apprentissage machine et de réseau de neurones qui fournissent des modèles très détaillés du fonctionnement de nos processus de pensée humaine.
Dans cet esprit, les données d'entraînement peuvent être structurées de différentes manières. Pour les arbres de décision séquentiels et ces types d'algorithmes, il s'agirait d'un ensemble de texte brut ou de données alphanumériques qui sont classées ou manipulées d'une autre manière. En revanche, pour les réseaux de neurones convolutifs liés au traitement d'image et à la vision par ordinateur, l'ensemble d'apprentissage est souvent composé d'un grand nombre d'images. L'idée est que, parce que le programme d'apprentissage automatique est si complexe et si sophistiqué, il utilise une formation itérative sur chacune de ces images pour finalement pouvoir reconnaître des caractéristiques, des formes et même des sujets tels que des personnes ou des animaux. Les données de formation sont absolument essentielles au processus - elles peuvent être considérées comme la «nourriture» que le système utilise pour fonctionner.