Quelqu'un peut-il expliquer pourquoi le test t "se produit"? On m'a appris à utiliser le test t lorsque vous ne connaissez pas l'écart-type de la population (c'est-à-dire que vous ne connaissez que l'écart-type de votre échantillon), mais je ne sais pas pourquoi cela le rendrait différent d'un test z .
hypothesis-testing
t-test
jasonbogd
la source
la source
Réponses:
Je ne pense pas avoir bien compris votre question. Demandez-vous pourquoi vous utiliseriez un test t?
Si vous comprenez pourquoi vous utiliseriez un test z, vous devriez avoir une bonne idée de la raison pour laquelle vous utiliseriez un test t. Pour les échantillons de grande taille, un test z et un test t doivent donner des résultats similaires ou identiques. Mais alors qu'un test z supposera une distribution normale, un test t tiendra compte de l'incertitude dans la distribution des échantillons à des tailles d'échantillons plus petites.
la source
Le test z lui-même est en fait un test de rapport de vraisemblance entre la vraisemblance en supposant l'hypothèse nulle et la vraisemblance en supposant l'hypothèse alternative. En supposant des distributions normales sous-jacentes avec des variances connues et en ne testant que les moyennes, l'algèbre se simplifie au test z que nous connaissons et aimons (DeGroot 1986, pp. 442–447).
Donc, pour le dire sans rigueur, le test t est le résultat naturel du même processus de rapport de vraisemblance qui est derrière le test z lorsque la variance des données est elle-même inconnue et est estimée par le maximum de vraisemblance.
la source
La réponse non rigoureuse est que vous souhaitez utiliser un test t lorsque vous avez un petit nombre d'échantillons en raison du risque que les échantillons soient inhabituellement rapprochés (par rapport à la variance réelle de la population). Dans ce cas, le dénominateur dans la formule de la statistique t sera anormalement petit, et donc la statistique t elle-même sera anormalement grande. Ainsi, vous avez beaucoup plus de chances d'obtenir une grande valeur pour la t-stat lorsque vous avez un petit nombre d'échantillons que vous ne le seriez pour obtenir une z-stat comparable, donc vous avez besoin d'une valeur plus grande pour rejeter la valeur nulle en utilisant le test t que le test z au même niveau de signification.
la source
Un bon aperçu des hypothèses sous-jacentes et des différences (et similitudes) des deux tests est donné ici:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
la source