Une question d'un débutant sur le résidu de Pearson dans le contexte du test du khi carré pour la qualité de l'ajustement:
En plus de la statistique de test, la chisq.test
fonction de R indique le résidu de Pearson:
(obs - exp) / sqrt(exp)
Je comprends pourquoi regarder la différence brute entre les valeurs observées et attendues n'est pas si informatif, car un échantillon plus petit entraînera une différence plus petite. Cependant, j'aimerais en savoir plus sur l'effet du dénominateur: pourquoi diviser par la racine de la valeur attendue? S'agit-il d'un résidu «standardisé»?
chi-squared
goodness-of-fit
residuals
Iain Dillingham
la source
la source
stdres
pour les résidus normalisés.chisq.test
calcule également lastdres
composante?Réponses:
Donc, ce que vous voyez dans la formule que vous recherchez, c'est le nombre de cellules standardisé, en supposant que les nombres de cellules ont une distribution de Poisson (inconditionnelle).
À partir de là, il est courant de tester l'indépendance de la variable de ligne et de colonne dans les données, et dans ce cas, vous pouvez utiliser une statistique de test qui examine la somme des carrés des valeurs ci-dessus (ce qui équivaut à la norme au carré) du vecteur de valeurs normalisées). Le test du chi carré fournit une valeur de p pour ce type de test basé sur une approximation à large échantillon de la distribution nulle de la statistique de test. Il est généralement appliqué dans les cas où aucun des comptes de vente n'est trop petit.
la source
Dans le contexte de la qualité de l'ajustement, vous pouvez vous référer à ce http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm .
Si vous voulez savoir comment le dénominateur y est arrivé, vous devrez voir le chi carré ici comme une approximation normale du binôme, pour les débutants, qui peut ensuite être étendu aux multinomiaux.
la source