Pour les tests t, selon la plupart des textes, on suppose que les données de population sont normalement distribuées. Je ne vois pas pourquoi. Un test t ne nécessite-t-il pas seulement que la distribution d'échantillonnage des moyennes d'échantillonnage soit normalement distribuée, et non la population?
S'il est vrai que le test t ne requiert finalement que la normalité dans la distribution d'échantillonnage, la population peut ressembler à n'importe quelle distribution, n'est-ce pas? Tant qu'il y a une taille d'échantillon raisonnable. N'est-ce pas ce que dit le théorème de la limite centrale?
(Je fais référence ici à des tests t d'échantillons indépendants ou à des échantillons indépendants)
hypothesis-testing
t-test
assumptions
normality-assumption
central-limit-theorem
Peter Nash
la source
la source
Réponses:
La statistique t consiste en un rapport de deux quantités, les deux variables aléatoires. Il ne s'agit pas seulement d'un numérateur.
Pour que la statistique t ait la distribution t, vous devez non seulement que la moyenne de l'échantillon ait une distribution normale. Tu as aussi besoin:
que le numérateur et le dénominateur soient indépendants.
Pour que ces trois choses soient réellement vraies, vous devez que les données d'origine soient normalement distribuées.
Prenons iid comme indiqué un instant. Pour que le CLT tienne, la population doit répondre aux conditions ... - la population doit avoir une distribution à laquelle le CLT s'applique. Donc non, car il y a des distributions de population pour lesquelles le CLT ne s'applique pas.
Non, le CLT ne dit en fait pas un mot sur la "taille d'échantillon raisonnable".
En fait, il ne dit rien du tout sur ce qui se passe à n'importe quelle taille d'échantillon fini.
Vous avez donc deux problèmes:
A. L'effet que les gens attribuent habituellement au CLT - l'approche de plus en plus étroite de la normalité des distributions des moyennes des échantillons à des tailles d'échantillon petites / modérées - n'est pas réellement indiqué dans le CLT **.
B. "Quelque chose n'est pas si loin de la normale dans le numérateur" ne suffit pas pour obtenir la statistique ayant une distribution t
** (Quelque chose comme le théorème de Berry-Esseen vous permet de mieux comprendre ce que les gens voient lorsqu'ils examinent l'effet de l'augmentation de la taille de l'échantillon sur la distribution des moyennes des échantillons.)
la source