J'utilise une matrice de confusion pour vérifier les performances de mon classificateur.
J'utilise Scikit-Learn, je suis un peu confus. Comment interpréter le résultat de
from sklearn.metrics import confusion_matrix
>>> y_true = [2, 0, 2, 2, 0, 1]
>>> y_pred = [0, 0, 2, 2, 0, 2]
>>> confusion_matrix(y_true, y_pred)
array([[2, 0, 0],
[0, 0, 1],
[1, 0, 2]])
Comment puis-je décider si ces valeurs prédites sont bonnes ou non.
predictive-models
prediction
confusion-matrix
user3378649
la source
la source
Réponses:
La matrice de confusion est un moyen de tabuler le nombre d'erreurs de classification, c'est-à-dire le nombre de classes prédites qui se sont retrouvées dans une mauvaise classe de classification basée sur les vraies classes.
Alors que sklearn.metrics.confusion_matrix fournit une matrice numérique, je trouve plus utile de générer un `` rapport '' en utilisant ce qui suit:
ce qui se traduit par:
Cela nous permet de voir que:
y_true
ety_pred
, à partir des sous - totaux « Tous »Cette méthode fonctionne également pour les étiquettes de texte, et pour un grand nombre d'échantillons dans l'ensemble de données peut être étendu pour fournir des rapports de pourcentage.
La sortie est alors:
où les chiffres représentent maintenant le pourcentage (plutôt que le nombre de cas) des résultats qui ont été classés.
Bien noter, que la
sklearn.metrics.confusion_matrix
sortie peut être visualisée directement en utilisant:la source
AssertionError: arrays and names must have the same length
y_pred = pd.Series(...)
. Cela devrait fonctionner maintenant.Sur l'axe des confusion, la matrice de confusion a les valeurs réelles et sur l'axe des abscisses les valeurs données par le prédicteur. Par conséquent, les comptes sur la diagonale sont le nombre de prédictions correctes. Et les éléments de la diagonale sont des prédictions incorrectes.
Dans ton cas:
la source
Je voudrais préciser graphiquement la nécessité de comprendre cela. C'est une matrice simple qui doit être bien comprise avant de tirer des conclusions. Voici donc une version explicative simplifiée des réponses ci-dessus.
la source