Une réponse proche de l'intuition:
Examinez de plus près la formule du test McNemar, compte tenu du tableau
pos | neg
----|-----|-----
pos | a | b
----|-----|-----
neg | c | d
La statistique McNemar M
est calculée comme suit :
M=(b−c)2b+c
La définition d'une avec k degrés de liberté est qu'elle se compose de la somme des carrés de k variables normales standard indépendantes. si les 4 nombres sont assez grands, et , et ainsi et peuvent être approximés par une distribution normale. Étant donné la formule de M, il est facile de voir qu'avec des valeurs suffisamment grandes suivra en effet approximativement une avec 1 degré de liberté.χ2b
c
b-c
b+c
M
χ2
EDIT: Comme indiqué à juste titre onstop, l'approximation normale est en fait complètement équivalente. C'est plutôt trivial étant donné l'argument utilisant l'approximation de b-c
par la distribution normale.
La version binomiale exacte est également équivalente au test de signe, dans le sens où dans cette version la distribution binomiale est utilisée pour comparer b
à . Ou nous pouvons dire que dans l'hypothèse nulle, la distribution de b peut être approximée par .Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)
Ou équivalent:
b−(b+c2)b+c√2∼N(0,1)
ce qui simplifie
b−cb+c−−−−√∼N(0,1)
ou, une fois prise le carré des deux côtés, à .M∼χ21
Par conséquent, l'approximation normale est utilisée. C'est la même chose que l' approximation .χ2
Les deux approches ne reviendront-elles pas à la même chose? La distribution chi carré pertinente a un degré de liberté, tout comme la distribution du carré d'une variable aléatoire avec une distribution normale standard. Je devrais passer par l'algèbre pour vérifier, ce que je n'ai pas le temps de faire pour l'instant, mais je serais surpris si vous ne vous retrouviez pas exactement avec la même réponse dans les deux sens.
la source