Comment interpréter le coefficient de corrélation de Matthews (MCC)?

17

La réponse à la question Relation entre les coefficients de corrélation phi, Matthews et Pearson? montre que les trois méthodes des coefficients sont toutes équivalentes.

Je ne suis pas des statistiques, donc ça devrait être une question facile.

L'article de Matthews (www.sciencedirect.com/science/article/pii/0005279575901099) décrit ce qui suit:

"A correlation of:
   C =  1 indicates perfect agreement,
   C =  0 is expected for a prediction no better than random, and
   C = -1 indicates total disagreement between prediction and observation"`.

Selon Wikipedia ( http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient ), la corrélation de Pearson est décrite comme suit:

giving a value between +1 and −1 inclusive, where:
   1 is total positive correlation, 
   0 is no correlation, and
  −1 is total negative correlation

L'interprétation du coefficient de corrélation de Pearson est mieux comprise comme suit (selon http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html ):

If r =
   +.70 or higher Very strong positive relationship
   +.40 to +.69 Strong positive relationship
   +.30 to +.39 Moderate positive relationship
   +.20 to +.29 weak positive relationship
   +.01 to +.19 No or negligible relationship
   -.01 to -.19 No or negligible relationship
   -.20 to -.29 weak negative relationship
   -.30 to -.39 Moderate negative relationship
   -.40 to -.69 Strong negative relationship
   -.70 or higher Very strong negative relationship

En lisant certains articles, il n'y a pas de degré d'interprétation pour la plage de résultats du MCC entre -1 et 1. Ce coefficient est bon pour les ensembles de données déséquilibrés de négatifs et de positifs, où la métrique de précision ne peut pas bien estimer si le prédicteur est précis dans ce cas.

Avec des ensembles de données déséquilibrés, la mesure F est-elle une bonne mesure à comparer avec le MCC pour évaluer les performances du prédicteur? Par exemple: il y a des cas qui F-measure = 94%et MCC = 0.58. Que dit-il sur le prédicteur?

Puis-je adopter la même interprétation pour le coefficient de corrélation de Matthews, ou il y a une signification différente sur l'interprétation? Je pense que les deux coefficients sont également équivalents dans l'interprétation.

Daniel souza
la source

Réponses:

9

Cette question était si simple et malheureusement, personne n'a pu répondre à cette question.

Selon cet article: http://www.bioinfopublication.org/files/articles/2_1_1_JMLT.pdf , le MCC est une méthode matricielle contingente de calcul du coefficient de corrélation produit-moment de Pearson. Par conséquent, il a la même interprétation.

Daniel souza
la source
0

Le coefficient de corrélation de Matthews est un cas particulier du coefficient de corrélation de Pearson. Par conséquent, les interprétations pour les deux sont les mêmes. Vérifiez les dérivations et autres détails dans mon article de blog sur github .

Lei Mao
la source
1
Bienvenue sur le site. Nous essayons de construire un référentiel permanent d'informations statistiques de haute qualité sous forme de questions et réponses. Ainsi, nous nous méfions des réponses de lien uniquement, en raison de linkrot. Il est préférable de publier le contenu ici et le lien pour le contexte. Vous devez également indiquer clairement que la publication liée est la vôtre.
gung - Rétablir Monica