Les coefficients de corrélation phi et Matthews sont-ils le même concept? Comment sont-ils liés ou équivalents au coefficient de corrélation de Pearson pour deux variables binaires? Je suppose que les valeurs binaires sont 0 et 1.
La corrélation de Pearson entre deux variables aléatoires de Bernoulli et est:y
où
Coefficient Phi de Wikipedia:
En statistique, le coefficient phi (également appelé "coefficient de contingence carré moyen" et noté ou ) est une mesure d'association pour deux variables binaires introduites par Karl Pearson. Cette mesure est similaire au coefficient de corrélation de Pearson dans son interprétation. En fait, un coefficient de corrélation de Pearson estimé pour deux variables binaires retournera le coefficient phi ...r ϕ
Si nous avons un tableau 2 × 2 pour deux variables aléatoires ety
Le coefficient phi qui décrit l'association de et est
Coefficient de corrélation de Matthews de Wikipedia:
Le coefficient de corrélation de Matthews (MCC) peut être calculé directement à partir de la matrice de confusion en utilisant la formule:
Dans cette équation, TP est le nombre de vrais positifs, TN le nombre de vrais négatifs, FP le nombre de faux positifs et FN le nombre de faux négatifs. Si l'une des quatre sommes du dénominateur est nulle, le dénominateur peut être arbitrairement fixé à un; cela se traduit par un coefficient de corrélation de Matthew de zéro, qui peut être montré comme la valeur limite correcte.
la source
Tout d'abord, il y avait une erreur de frappe dans la question: n'est pas mais plutôtE[xy] n∙1n1∙n2
Deuxièmement, la clé pour montrer que estρ=ϕ
la source