Laissant de côté le problème évident de la faible puissance du chi carré dans ce genre de circonstances, imaginez faire un test de qualité khi carré pour une certaine densité avec des paramètres non spécifiés, en regroupant les données.
Pour le concret, disons une distribution exponentielle avec une moyenne inconnue et un échantillon de disons 100.
Afin d'obtenir un nombre raisonnable d'observations attendues par casier, il faudrait tenir compte des données (par exemple, si nous choisissions de mettre 6 casiers en dessous de la moyenne et 4 au-dessus, cela continuerait à utiliser les limites des casiers basées sur les données) .
Mais cette utilisation des bacs basée sur la visualisation des données affecterait vraisemblablement la distribution de la statistique de test sous le zéro.
J'ai vu beaucoup de discussions sur le fait que - si les paramètres sont estimés selon la probabilité maximale à partir des données regroupées - vous perdez 1 df par paramètre estimé (un problème qui remonte à Fisher vs Karl Pearson) - mais je ne me souviens pas lire quoi que ce soit sur la recherche des limites de bacs elles-mêmes sur la base des données. (Si vous les estimez à partir des données non combinées, alors avec cases la distribution de la statistique de test se situe quelque part entre a et a .)
Ce choix de bacs basé sur des données a-t-il un impact significatif sur le niveau de signification ou la puissance? Y a-t-il des approches plus importantes que d'autres? S'il y a beaucoup d'effet, est-ce quelque chose qui disparaît dans les grands échantillons?
Si cela a un impact substantiel, cela semblerait rendre l'utilisation d'un test du chi carré lorsque les paramètres sont inconnus presque inutile dans de nombreux cas (bien qu'il soit toujours préconisé dans de nombreux textes), sauf si vous aviez un bon -estimation prioritaire du paramètre.
Une discussion des questions ou des références à des références (de préférence avec une mention de leurs conclusions) serait utile.
Modifier, à peu près un côté de la question principale:
Il me semble qu'il existe des solutions potentielles pour le cas spécifique de l'exponentielle * (et l'uniforme en viennent à y penser), mais je suis toujours intéressé par la question plus générale de l'impact du choix des limites de bac.
* Par exemple, pour l'exponentielle, on pourrait utiliser la plus petite observation (disons qu'elle est égale à ) pour avoir une idée très approximative de l'emplacement des bacs (puisque la plus petite observation est exponentielle avec une moyenne μ / n ), puis tester les n - 1 différences restantes ( x i - m ) pour l'exponentialité. Bien sûr, cela pourrait donner une très mauvaise estimation de μ, et donc de mauvais choix de cases, bien que je suppose que l'on pourrait utiliser l'argument de manière récursive afin de prendre les deux ou trois observations les plus basses parmi lesquelles choisir des cases raisonnables, puis tester les différences des observations restantes au-dessus de la plus grande de ces statistiques d'ordre le plus petit pour exponentialité)
la source
Réponses:
Les résultats de base des tests de qualité d'ajustement du khi carré peuvent être compris de manière hiérarchique .
Niveau 0 . La statistique du test chi carré de Pearson classique pour tester un échantillon multinomial contre un vecteur de probabilité fixe est X 2 ( p ) = k ∑ i = 1 ( X ( n ) i - n p i ) 2p
où X ( n ) i désigne le nombre de résultats dans la i ème cellule d'un échantillon de taille n . Ceci peut être considéré comme la norme quadratique du vecteur Y n = ( Y ( n ) 1 , … , Y ( n ) k ) où Y ( n ) i = ( X ( n ) i - n
Des exemples sont la statistique Rao – Robson – Nikulin et la statistique Dzhaparidze – Nikulin .
References
A W. van der Vaart (1998), Asymptotic Statistics, Cambridge University Press. Chapter 17: Chi-Square Tests.
H. Chernoff and E. L. Lehmann (1954), The use of maximum likelihood estimates inχ2 tests for goodness of fit, Ann. Math. Statist., vol. 25, no. 3, 579–586.
F. C. Drost (1989), Generalized chi-square goodness-of-fit tests for location-scale models when the number of classes tends to infinity, Ann. Stat, vol. 17, no. 3, 1285–1300.
M. S. Nikulin, M.S. (1973), Chi-square test for continuous distribution with shift and scale parameters, Theory of Probability and its Application, vol. 19, no. 3, 559–568.
K. O. Dzaparidze and M. S. Nikulin (1973), On a modification of the standard statistics of Pearson, Theory of Probability and its Application, vol. 19, no. 4, 851–853.
K. C. Rao and D. S. Robson (1974), A chi-square statistic for goodness of fit tests within exponential family, Comm. Statist., vol 3., no. 12, 1139–1153.
N. Balakrishnan, V. Voinov and M. S. Nikulin (2013), Chi-Squared Goodness of Fit Tests With Applications, Academic Press.
la source
I've found at least partial answers to my question, below. (I'd still like to give someone that bonus, so any further information appreciated.)
Moore (1971) said that Roy (1956) and Watson (1957,58,59) showed that when the cell boundaries for a chi-square statistic are functions of best asymptotic normal estimated parameter values, then under certain conditions, the asymptotic null distribution of the chi-square statistic is still that of a sum of aχ2k−p−1 and a weighted
sum of p χ21 variables (for k cells, p parameters)
where the weights are between 0 and 1 (making the cdf of the
distribution between that of a χ2k−p and a χ2k , as alluded to in my question for the distribution when using ML estimation), and the weights on those last p terms are unaffected by that estimation.
References
Moore D.S. (1971), A Chi-Square Statistic with Random Cell Boundaries, Ann. Math. Stat., Vol 42, No 1, 147–156.
Roy A.R. (1956), Onχ2 statistics with variable intervals,
Technical Report No. 1, Dept of Statistics, Stanford University.
Watson, G.S. (1957), Theχ2 goodness-of-fit test for normal
distributions, Biometrika, 44, 336–348.
Watson, G.S. (1958), Onχ2 goodness-of-fit tests for
continuous distributions, J. Royal Statist. Soc. B, 20, 44–61.
Watson, G.S. (1959), Some recent results inχ2 goodness-of-
fit tests, Biometrics, 15, 440-468
la source