Accueil l'audio Qu'est-ce que l'analyse en composantes principales (PCA)? - définition de techopedia

Qu'est-ce que l'analyse en composantes principales (PCA)? - définition de techopedia

Table des matières:

Anonim

Définition - Que signifie l'analyse en composantes principales (ACP)?

L'analyse en composantes principales (ACP) est une technique utilisée pour identifier un plus petit nombre de variables non corrélées appelées composantes principales à partir d'un plus grand ensemble de données. La technique est largement utilisée pour mettre l'accent sur la variation et capturer des motifs forts dans un ensemble de données. Inventée par Karl Pearson en 1901, l'analyse en composantes principales est un outil utilisé dans les modèles prédictifs et l'analyse exploratoire des données. L'analyse en composantes principales est considérée comme une méthode statistique utile et utilisée dans des domaines tels que la compression d'image, la reconnaissance faciale, les neurosciences et l'infographie.

Techopedia explique l'analyse des composants principaux (PCA)

L'analyse des composants principaux facilite l'exploration et la visualisation des données. Il s'agit d'une technique non paramétrique simple pour extraire des informations d'ensembles de données complexes et déroutants. L'analyse des composants principaux se concentre sur le montant de la variance maximale avec le moins de composants principaux. L'un des avantages distincts associés à l'analyse des composants principaux est qu'une fois que les modèles sont trouvés dans les données concernées, la compression des données est également prise en charge. On utilise l'analyse en composantes principales pour éliminer le nombre de variables ou lorsqu'il y a trop de prédicteurs par rapport au nombre d'observations ou pour éviter la multicolinéarité. Elle est étroitement liée à l'analyse corrélationnelle canonique et utilise la transformation orthogonale afin de convertir l'ensemble d'observations contenant des variables corrélées en un ensemble de valeurs appelées composantes principales. Le nombre de composantes principales utilisées dans l'analyse des composantes principales est inférieur ou égal au nombre moindre d'observations. L'analyse des composants principaux est sensible à la mise à l'échelle relative des variables utilisées à l'origine.

L'analyse en composantes principales est largement utilisée dans de nombreux domaines tels que les études de marché, les sciences sociales et dans les industries où de grands ensembles de données sont utilisés. La technique peut également aider à fournir une image de dimension inférieure des données originales. Un effort minimal est nécessaire dans le cas de l'analyse des composants principaux pour réduire un ensemble de données complexe et déroutant en un ensemble d'informations utiles simplifiées.

Qu'est-ce que l'analyse en composantes principales (PCA)? - définition de techopedia