Pourquoi le test de McNemar utilise-t-il le chi carré et non la distribution normale?

11

Je viens de remarquer comment le test de McNemar non exact utilise la distribution asymptotique du chi carré. Mais puisque le test exact (pour la table des deux cas) repose sur la distribution binomiale, comment se fait-il qu'il n'est pas courant de suggérer l'approximation normale de la distribution binomiale?

Merci.

Tal Galili
la source

Réponses:

15

Une réponse proche de l'intuition:

Examinez de plus près la formule du test McNemar, compte tenu du tableau

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

La statistique McNemar Mest calculée comme suit :

M=(bc)2b+c

La définition d'une avec k degrés de liberté est qu'elle se compose de la somme des carrés de k variables normales standard indépendantes. si les 4 nombres sont assez grands, et , et ainsi et peuvent être approximés par une distribution normale. Étant donné la formule de M, il est facile de voir qu'avec des valeurs suffisamment grandes suivra en effet approximativement une avec 1 degré de liberté.χ2bcb-cb+cMχ2


EDIT: Comme indiqué à juste titre onstop, l'approximation normale est en fait complètement équivalente. C'est plutôt trivial étant donné l'argument utilisant l'approximation de b-cpar la distribution normale.

La version binomiale exacte est également équivalente au test de signe, dans le sens où dans cette version la distribution binomiale est utilisée pour comparer bà . Ou nous pouvons dire que dans l'hypothèse nulle, la distribution de b peut être approximée par .Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

Ou équivalent:

b(b+c2)b+c2N(0,1)

ce qui simplifie

bcb+cN(0,1)

ou, une fois prise le carré des deux côtés, à .Mχ12

Par conséquent, l'approximation normale est utilisée. C'est la même chose que l' approximation .χ2

Joris Meys
la source
3
C'est vrai. La connexion peut peut-être être vue plus clairement en considérant Sqrt (M) = (bc) / Sqrt (b + c). En estimant la variance de b as b et la variance de c as c (comme cela est habituel avec les données comptées), nous voyons que Sqrt (M) ressemble à une variable approximativement normale (bc) divisée par son écart-type: en d'autres termes, il ressemble à une norme variate normale. En fait, nous pourrions effectuer un test équivalent en référant Sqrt (M) à un tableau de la distribution normale standard. La quadrature efficace rend le test symétrique à deux queues. Évidemment, cela tombe en panne si b ou c est petit.
whuber
Merci pour la réponse intuitive Joris. Pourtant, pourquoi est-il plus courant d'utiliser cette approximation plutôt que d'utiliser l'approximation normale du test binomial exact de McNemar?
Tal Galili
@Tal: C'est pareil. Voir la réponse sans escale et ma modification.
Joris Meys
En fait - dernière question. Donc, si les deux sont identiques (et je pense que vous pourriez également avoir besoin d'une "valeur absolue" autour du bc), alors pourquoi les gens vont-ils à la distribution chi au lieu de rester avec la distribution normale? Quel est l'avantage?
Tal Galili
1
@Tal: Vous savez, R. trace le chi2 avec un degré de liberté, vous verrez.
Joris Meys
8

Les deux approches ne reviendront-elles pas à la même chose? La distribution chi carré pertinente a un degré de liberté, tout comme la distribution du carré d'une variable aléatoire avec une distribution normale standard. Je devrais passer par l'algèbre pour vérifier, ce que je n'ai pas le temps de faire pour l'instant, mais je serais surpris si vous ne vous retrouviez pas exactement avec la même réponse dans les deux sens.

un arrêt
la source
voir ma réponse pour plus de détails
Joris Meys
Salut onestop - Étant donné que les deux sont asymptotiques, alors pour les N plus petits, ils peuvent donner des résultats quelque peu différents. Dans un tel cas, je me demande si le choix d'aller avec le chi carré est parce que c'est mieux que l'approximation normale, ou pour des raisons historiques (ou peut-être, comme vous l'avez suggéré - elles donnent toujours des résultats identiques)
Tal Galili
@Tal: pour un N plus petit, aucun des deux ne tient. Et comme indiqué dans mon montage, ils sont exactement les mêmes.
Joris Meys