Accueil Dans les nouvelles Pourquoi une matrice de confusion est-elle utile dans l'apprentissage automatique?

Pourquoi une matrice de confusion est-elle utile dans l'apprentissage automatique?

Anonim

Q:

Pourquoi une matrice de confusion est-elle utile en ML?

UNE:

Il existe un certain nombre de façons d'expliquer pourquoi une matrice de confusion est utile dans l'apprentissage automatique (ML) - mais l'une des façons les plus simples consiste à expliquer que la matrice de confusion est une ressource de visualisation de données.

Une matrice de confusion permet aux téléspectateurs de voir en un coup d'œil les résultats de l'utilisation d'un classificateur ou d'un autre algorithme. En utilisant un simple tableau pour afficher les résultats analytiques, la matrice de confusion se résume essentiellement à vos résultats dans une vue plus digestible.

La matrice de confusion utilise une terminologie spécifique pour organiser les résultats. Il y a de vrais positifs et de vrais négatifs, ainsi que de faux positifs et de faux négatifs. Pour une matrice de confusion plus compliquée ou basée sur une classification de comparaison, ces valeurs peuvent être représentées comme étant des classes réelles et prédites pour deux objets distincts.

Quelle que soit la terminologie sémantique, les résultats sont regroupés dans un tableau carré (ou rectangulaire).

Cette vue permet aux analystes de voir plus facilement la précision d'un algorithme dans la classification des résultats. (Lire Les nouveaux générateurs mettent les algorithmes modernes au service de l'art ASCII.)

L'utilité de la matrice de confusion est liée à la complexité des projets ML, ainsi qu'à la manière dont les informations sont formatées et fournies aux utilisateurs. Imaginez une chaîne de résultats linéaires comprenant de faux positifs, de faux négatifs, de vrais positifs et de vrais négatifs. (Lire Machine Learning 101.)

Un utilisateur devrait tabuler tous ces résultats linéaires dans un graphique pour comprendre le fonctionnement de l'algorithme et sa précision. Avec la matrice de confusion, ces informations sont simplement présentées dans un puissant modèle visuel.

Par exemple, supposons que la machine soit invitée à classer 20 images, dont cinq sont des fruits et cinq des légumes. Si une matrice de confusion contient le contenu suivant (en haut à gauche dans le sens des aiguilles d'une montre): 7, 5, 3, 5, alors la matrice montre que sept ont été correctement identifiés comme légumes, tandis que trois ont été correctement classés comme fruits.

Les 10 autres, tels que représentés, sont des résultats où le programme n'a pas réussi à identifier correctement l'image.

La matrice de confusion sera utile dans toutes sortes d'analyses ML. En observant cette ressource, les utilisateurs peuvent comprendre comment gérer des problèmes tels que la dimensionnalité et le surajustement, et d'autres façons d'optimiser un algorithme.

Pourquoi une matrice de confusion est-elle utile dans l'apprentissage automatique?