À la suite d'un récent vote à la baisse, j'ai essayé de vérifier ma compréhension du test Pearson Chi Squared. J'utilise généralement la statistique du chi carré (ou la statistique du chi carré réduit) pour ajuster ou vérifier l'ajustement résultant. Dans ce cas, la variance n'est généralement pas le nombre attendu de dénombrements dans un tableau ou un histogramme, mais une certaine variance déterminée expérimentalement. Quoi qu'il en soit, j'ai toujours eu l'impression que le test utilisait toujours la normalité asymptotique du PDF multinomial (c'est-à-dire que ma statistique de test est
et est multinormal asymptotiquement où est la matrice de covariance). Par conséquent, a une distribution chi carré donnée par un grand donc l'utilisation du nombre attendu de dénombrements comme le dénominateur dans la statistique devient valide pour le grand . Il est possible que cela ne soit vrai que pour les histogrammes, je n'ai pas analysé un petit tableau de données depuis des années.
Y a-t-il un argument plus subtil que je manque? Je serais intéressé par une référence, ou mieux encore une courte explication. (Bien que ce soit possible, je viens de voter pour avoir omis le mot asymptotique, ce que je concède est assez important.)
la source
Réponses:
Un test du chi carré est conçu pour analyser des données catégorielles. Cela signifie que les données ont été comptées et divisées en catégories. Il ne fonctionnera pas avec des données paramétriques ou continues. Donc, cela ne fonctionne pas pour déterminer l'ajustement résultant dans chaque cas.
Source: http://www.ling.upenn.edu/~clight/chisquared.htm
la source