Faut-il corriger l'écart-type dans un test T de Student?

9

En utilisant le test T de Student, T-Critical est calculé via:

t=X¯μ0s/n

En regardant un article de Wikipédia sur l'estimation non biaisée de l'écart-type, la section Résultat pour la distribution normale qui mentionne un facteur de correctionc4(n)pour l'écart type mesuré de l'échantillon, s , basé sur la taille de l'échantillon. Des questions:

(1) Ce facteur de correction est-il inclus dans les données du tableau T de Student, car il est exprimé en degrés de liberté?

(2) Si (1) est non pourquoi pas?

MaxW
la source

Réponses:

15

1) Non, ce n'est pas le cas.

2) parce que le calcul de la distribution de la statistique de test repose sur l'utilisation de la racine carrée de la variance corrigée de Bessel ordinaire pour obtenir l'estimation de l'écart-type.

Si elle était incluse, elle ne ferait évoluer chaque statistique t - et donc sa distribution - que par un facteur (différent à chaque df); cela permettrait alors de mettre à l'échelle les valeurs critiques du même facteur.

Donc, vous pouvez, si vous le souhaitez, construire un nouvel ensemble de tables "t" avec s=s/c4 utilisé dans la formule pour une nouvelle statistique, t=X¯μ0s/n=c4(n)tn1, puis multipliez toutes les valeurs tabulées pour tν par le correspondant c4(ν+1)pour obtenir des tableaux pour la nouvelle statistique. Mais nous pourrions aussi facilement baser nos tests sur des estimations ML deσ, ce qui serait plus simple à plusieurs égards, mais ne changerait rien de substantiel à propos des tests.

Rendre l’estimation de l’écart-type de population non biaisé ne ferait que rendre le calcul plus compliqué et ne sauverait rien d’autre (le même x¯, x2¯ et nconduirait finalement au même rejet ou non-rejet). [À quelle fin? Pourquoi ne pas plutôt choisir MLE ou MSE minimum ou un certain nombre d'autres façons d'obtenir des estimateurs deσ?]

Il n'y a rien de particulièrement précieux à avoir une estimation impartiale de s à cet effet (l'impartialité est une bonne chose à avoir, toutes choses étant égales par ailleurs, mais d'autres choses sont rarement égales).

Étant donné que les gens sont habitués à utiliser les variances corrigées de Bessel et donc l'écart-type correspondant, et les distributions nulles qui en résultent sont assez simples, il y a peu - voire rien du tout - à gagner en utilisant une autre définition.

Glen_b -Reinstate Monica
la source
1
Merci pour la réponse réfléchie. Les statistiques sur les petits échantillons sont si imprécises qu'il ne semble pas que la correction résoudrait comme par magie le problème des petits échantillons.
MaxW
1
Désolé, je ne sais pas trop ce que vous en pensez. lec4 terme conduit simplement à un estimateur où E(σ^)=σsous échantillonnage normal. De quel petit problème d'échantillon parlons-nous (vraisemblablement, puisque la question concerne le test t, il y a un problème avec letJ'ai raté?), Et comment a-t-il été «corrigé»?
Glen_b -Reinstate Monica
Désolé d'être obtus. Je faisais référence à une situation dans laquelle on a pris 3 mesures et calculé la moyenne, std. dev. et intervalle de confiance à 95% sur la base de ces données. Avec un échantillon aussi petit, l'intervalle de confiance est énorme. La correction de l'écart-type ne changera pas par magie la précision et la précision d'un échantillon à 3 coups.
MaxW
Ah. Merci, je vois maintenant. Vous avez raison, il ne se passe rien de magique; avec de petits échantillons, l'intervalle de confiance sera large, et la mise à l'échelle d'une statistique n'a aucun impact sur tout cela; en effet, nous pouvons montrer que formellement via les quantités pivots utilisées pour construire les intervalles de confiance habituels.
Glen_b -Reinstate Monica