J'ai un problème avec 6 cours. Je construis donc un classificateur multiclasse, comme suit: pour chaque classe, j'ai un classificateur de régression logistique, en utilisant One vs. All, ce qui signifie que j'ai 6 classificateurs différents.
Je peux signaler une matrice de confusion pour chacun de mes classificateurs. Mais, je voudrais signaler une matrice de confusion pour TOUS les classificateurs, comme je l'ai vu dans de nombreux exemples ici.
Comment puis-je le faire? Dois-je changer ma stratégie de classification, en utilisant un algorithme un contre un au lieu d'un contre tous? Parce que sur ces matrices de confusion, le rapport indique les faux positifs pour chaque classe.
Exemple d'une matrice de confusion multiclasse
Je voudrais trouver le nombre d'articles mal classés. Dans la première rangée, il y a 137 exemples de classe 1 qui ont été classés en classe 1 et 13 exemples de classe 1 qui ont été classés en classe 2 . Comment obtenir ce numéro?
Réponses:
Vraisemblablement, vous utilisez ces classificateurs pour vous aider à choisir une classe particulière pour un ensemble donné de valeurs d'entités (comme vous l'avez dit, vous créez un classificateur multiclasse).
Donc, supposons que vous ayez classes, alors votre matrice de confusion serait une matrice , avec l'axe gauche montrant la vraie classe (telle que connue dans le jeu de test) et l'axe supérieur montrant la classe attribuée à un élément avec cette vraie classe. Chaque élément de la matrice serait le nombre d'items de vraie classe qui ont été classés comme appartenant à la classe .N N×N i,j i j
Ceci est juste une extension simple de la matrice de confusion à 2 classes.
la source
Bien qu'il y ait déjà quelques réponses sur ce forum, j'ai pensé donner les équations explicites pour le rendre plus précis:
En supposant que vous ayez une matrice de confusion multi-classes de la forme,C=Actualc11⋮cn1Classifed...⋱c1ncnn
Les éléments de confusion pour chaque classe sont donnés par:
la source
En utilisant la matrice jointe à la question et en considérant les valeurs dans l'axe vertical comme la classe réelle, et les valeurs dans l'axe horizontal la prédiction. Alors pour la classe 1:
137
-> échantillons de classe 1, classés en classe 16
-> (1 + 2 + 4) échantillons des classes 2, 3 et 4, mais classés en classe 118
-> (13 + 3 + 1 + 1) échantillons de classe 1, mais classés en classes 2, 3, 6 et 7581
-> (55 + 1 + 6 ... + 2 + 26) La somme de toutes les valeurs de la matrice sauf celles de la colonne 1 et de la ligne 1la source