Le test z pour comparer deux proportions est . Il est généralement défini que
où
Y a-t-il une référence écrite qui me légitime à la place d'utiliser la variance non regroupée, c'est-à-dire
Le test z pour comparer deux proportions est . Il est généralement défini que
où
Y a-t-il une référence écrite qui me légitime à la place d'utiliser la variance non regroupée, c'est-à-dire
Il y a pas mal de discussions à ce sujet sur le site AP .
Vous pouvez utiliser toutes les statistiques que vous voulez, à condition que vous soyez clair sur ce que vous faites et que vous regardiez la distribution nulle appropriée pour calculer les valeurs p ou les seuils.
Mais certaines statistiques sont meilleures que d'autres; dans ce cas, vous recherchez (a) une distribution nulle facilement calculée et (b) une puissance pour détecter la différence.
Mais je ne sais pas pourquoi vous préféreriez la variance non groupée à la variance groupée pour le test, bien qu'elle puisse être préférée dans le calcul d'un intervalle de confiance pour la différence.
La variance non regroupée a tendance à être trop petite. En effet, dans l'hypothèse nulle, il y aura toujours une variation aléatoire dans les deux proportions observées, bien que les probabilités sous-jacentes soient égales. Cette variation de chance contribue à la variance regroupée mais pas à la variance non regroupée.
Par conséquent, pour la statistique non regroupée n'a même pas approximativement une distribution normale standard. Par exemple, lorsque et les vrais probabilités sont tous deux , la variance de n'est que de au lieu de . En utilisant des tableaux de la distribution normale standard, vous obtiendrez des valeurs de p incorrectes: elles auront tendance à être artificiellement petites, rejetant trop souvent le nul lorsque les preuves ne sont pas vraiment là.z n1=n2 1 / 2 z 1 / 2 1
Néanmoins, on se demande si cela pourrait être corrigé. Ça peut. La question est de savoir si une valeur corrigée de , basée sur des estimations non regroupées, pourrait avoir un pouvoir plus important pour détecter les écarts par rapport à l'hypothèse nulle. Quelques simulations rapides suggèrent que ce n'est pas le cas: le test groupé (par rapport à un test non groupé correctement ajusté) a une meilleure chance de rejeter le null chaque fois que le null est faux. Par conséquent, je n'ai pas pris la peine de trouver la formule de la correction non groupée; cela semble inutile.z
En résumé, le test non groupé est incorrect, mais avec une correction appropriée, il peut être rendu légitime. Cependant, il semble être inférieur au test groupé.
la source