Comment exprimer les cellules d'un tableau 2x2 en termes de coefficient phi et de probabilités marginales

8

Considérons un tableau de fréquences 2x2 typique (montré dans cette image): Notation: La variable de ligne est notée R et prend les valeurs 0 ou 1; la variable de colonne est notée C et prend les valeurs 0 ou 1. Les cellules du tableau indiquent la fréquence de chaque combinaison de R et C; par exemple, est la fréquence de R = 0 et C = 1. Aux fins de ma question, supposons que le nombre de cellules est divisé par le total, de sorte que les valeurs des cellules sont les probabilités conjointes des cellules .
table deux par deux
b

Je veux exprimer les probabilités des cellules en termes de coefficient phi (qui est une mesure de corrélation avec la formule fournie ci-dessous) et les probabilités marginales: et . Autrement dit, je veux inverser le système suivant de quatre équations: et, bien sûr, . En d'autres termes, je voudrais résoudre pour , , et en termes deμRp(R=1)=c+dμCp(C=1)=b+d

(by defn)ϕ(adbc)/(a+b)(c+d)(a+c)(b+d)(by defn)μR=c+d(by defn)μC=b+d(constraint)1=a+b+c+d
0a,b,c,d1abcdϕ , et .μRμC

Ce problème a probablement été résolu par quelqu'un auparavant, mais mes recherches n'ont pas donné de source, et mes faibles tentatives d'algèbre n'ont pas produit de réponse, et je ne trouve pas d'onduleurs d'équation de système en ligne (non linéaires) qui gèrent ce cas. .

John K. Kruschke
la source

Réponses:

4

Nous reconnaissons facilement chaque facteur dans le dénominateur de , car et . Commençons donc par une petite simplification pour éviter d'écrire beaucoup de racines carrées:ϕa+b=1μRa+c=1μC

Δ=adbc=ϕμR(1μR)μC(1μC).

Trouvons :d

d=(1)d=(a+b+c+d)d=ad+bd+cd+d2=ad+(bc+bc)+bd+cd+d2=(adbc)+(c+d)(b+d)=Δ+μRμC.

La recherche de , et déroule de manière similaire en raison des symétries du problème: l'échange des colonnes permute et , et , tout en changeant en et en annulant , d'où abcabcdμC1μCΔ

c=Δ+μR(1μC).

L'échange des lignes permute et , et , tout en changeant en et en annulant , d'oùacbdμR1μRΔ

b=Δ+(1μR)μC.

L'échange de lignes et de colonnes donne

a=Δ+(1μR)(1μC).

Étant donné ces expressions pour , il est simple de vérifier que et , et seulement un peu plus difficile à vérifiez que .a,b,c,da+b+c+d=1,c+d=μR,b+d=μCadbc=Δ

whuber
la source
Une remarque pour ceux qui pourraient utiliser cette réponse (correcte!): Cela peut donner des valeurs de a, b, c ou d qui sont négatives. En d'autres termes, toutes les combinaisons de phi dans [-1,1], mu_R dans [0,1] et mu_C dans [0,1] ne peuvent pas être créées par des matrices de probabilité. À whuber: Merci!
John K. Kruschke
C'est exact, John, mais je n'ai fait aucune mention de ce fait parce que probablement , et ont été obtenus à partir d'une table valide en premier lieu. En supposant que et sont des fréquences valides (dans l'intervalle ), sera réel. Il doit se situer dans l'intervalleμRμCϕμRμC[0,1]Δ
[min(μRμC,(1μR)(1μC)), min(μR(1μC),(1μR)μC)].
whuber