Je teste l'indépendance dans une table de contingenceJe ne sais pas si le test G ou le test chi carré de Pearson est meilleur. La taille de l'échantillon est de l'ordre de centaines, mais le nombre de cellules est faible. Comme indiqué sur la page Wikipedia , l'approximation de la distribution du chi carré est meilleure pour le test G que pour le test du chi carré de Pearson. Mais j'utilise la simulation de Monte Carlo pour calculer la valeur de p, alors y a-t-il une différence entre ces deux tests?
10
Réponses:
Ils sont asymptotiquement identiques. Ce ne sont que des façons différentes d'arriver à la même idée. Plus précisément, le test du chi carré de Pearson est un test de score, tandis que le test G est un test de rapport de vraisemblance. Pour avoir une meilleure idée de ces idées, cela peut vous aider à lire ma réponse ici: pourquoi mes valeurs de p diffèrent-elles entre la sortie de régression logistique, le test du chi carré et l'intervalle de confiance pour le bloc opératoire? Pour répondre à votre question directe, si vous calculez la valeur de p par simulation Monte Carlo, cela ne devrait pas avoir d'importance; vous pouvez simplement utiliser celui qui vous convient le mieux. Notez qu'il n'y a pas de problème avec un faible nombre de cellules, seulement (potentiellement) faible prévunumération cellulaire; il est possible d'avoir un faible nombre de cellules et d'avoir des comptes attendus très bien. De plus, ni les comptages réels faibles ni les comptages attendus faibles ne sont importants lorsque la valeur de p est déterminée par simulation.
(Pour ce que ça vaut, j'utiliserais probablement le chi carré de Pearson, parce que R a une fonction pratique pour cela qui inclut la possibilité de simuler la valeur de p.)
la source
chisq.test
.Jetez un œil à Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Les commandes pertinentes sont g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Les calculs sont extrêmement rapides. Et en général, préférez le test G ^ 2 car le chi carré en est une approximation.
la source
Le test du chi carré et le test G produisent généralement des résultats similaires. Mais la chose la plus importante ici est que vous devez choisir l'un des deux tests et vous y tenir, non seulement pour votre test mentionné, mais pour les tests futurs au cours de vos recherches. Il est conseillé car si vous essayez d'utiliser les deux tests de manière interchangeable, il est très probable que vous augmenterez les chances d'obtenir un faux positif.
la source