Le coefficient de corrélation de Matthews ( ) est une mesure pour mesurer la qualité d'une classification binaire ([Wikipedia] [1]). formulation est donnée pour la classification binaire utilisant les valeurs de vrais positifs ( ), de faux positifs ( ), de faux négatifs ( ) et de vrais négatifs ( ) comme indiqué ci-dessous:
J'ai un cas où je dois classer trois classes différentes, , et . Puis-je appliquer la formulation ci-dessus pour calculer pour le cas multi-classe après avoir calculé les valeurs , , et pour chaque classe comme indiqué ci-dessous?
Réponses:
Oui, en général, vous le pouvez. Cette approche que vous souhaitez utiliser est parfois appelée «micro-moyenne»: d'abord, additionnez tous les
TN
s,FP
s, etc. pour chaque classe, puis calculez la statistique d'intérêt.Une autre façon de combiner les statistiques pour les classes individuelles consiste à utiliser ce que l'on appelle la «macro-moyenne»: ici, vous calculez d'abord les statistiques pour les classes individuelles (A vs non A, B vs non B, etc.), puis calculez la moyenne de leur.
Vous pouvez consulter ici pour plus de détails. La page parle de précision et de rappel, mais je crois que cela s'applique au coefficient de Matthew ainsi qu'à d'autres statistiques basées sur des tableaux de contingence.
la source
La technique de moyenne macro fonctionne bien pour la précision, la sensibilité et la spécificité. Mais quand je l'ai essayé pour MCC, cela n'a pas donné de bons résultats. Pour plus de détails sur les calculs MCC multiclasses, voir:
Le code suivant a fonctionné pour moi:
la source
Le MCC peut être utilisé pour la classification binaire et multiclasses Wikipedia et il est implémenté dans sci-kit learn pour les étiquettes binaires et multiclasses.
la source
MCC est conçu pour la classification binaire.
Si vous voulez obtenir une mesure similaire d'un classificateur, vous pouvez essayer le Kappa de Cohen, il peut être appliqué à une matrice de confusion multi-classes.
la source