J'ai récemment étudié le fonctionnement interne de l'erreur standard et je me suis trouvé incapable de comprendre comment cela fonctionne. D'après ce que je comprends de l'erreur type, il s'agit de l'écart type de la distribution des moyennes des échantillons. Mes questions sont:
• comment savons-nous que l'erreur-type est l'écart-type des moyennes de l'échantillon alors que nous ne prenons habituellement qu'un seul échantillon?
• pourquoi l'équation pour calculer l'erreur standard ne reflète-t-elle pas l'équation de l'écart type pour un seul échantillon?
standard-error
luciano
la source
la source
Réponses:
Oui, l'erreur type de la moyenne (SEM) est l'écart type (SD) des moyennes. (L'erreur standard est une autre façon de dire SD d'une distribution d'échantillonnage. Dans ce cas, la distribution d'échantillonnage est la moyenne pour des échantillons de taille fixe, disons N.) Il existe une relation mathématique entre le SEM et la population SD: SEM = population SD / la racine carrée de N. Cette relation mathématique est très utile, car nous n'avons presque jamais d'estimation directe du SEM mais nous avons une estimation de la population SD (à savoir la SD de notre échantillon). Quant à votre deuxième question, si vous deviez collecter plusieurs échantillons de taille N et calculer la moyenne de chaque échantillon, vous pourriez estimer le SEM simplement en calculant la SD des moyennes. Ainsi, la formule pour SEM reflète bien la formule pour la SD d'un seul échantillon.
la source
Supposons que sont indépendants et identiques. C'est la situation à laquelle je suis presque sûr de faire référence. Soit leur moyenne commune μ et leur variance commune σ 2 .X1,X2,…,Xn μ σ2
Maintenant, la moyenne de l'échantillon est . La linéarité de l'espérance montre que la moyenne de X b est également μ . L'hypothèse d'indépendance implique que la variance de X b est la somme des variances de ses termes. Chacun de ces termes X i / n a une variance σ 2 / n 2 (parce que la variance d'une constante fois une variable aléatoire est la constante au carré multipliée par la variance de la variable aléatoire). Nous avons nXb=∑iXi/n Xb μ Xb Xi/n σ2/n2 n réparties de manière identique pour additionner ces variables, de sorte que chaque terme a la même variance. Par conséquent, nous obtenons pour la variance de la moyenne de l'échantillon.nσ2/n2=σ2/n
Habituellement, nous ne connaissons pas et nous devons donc l'estimer à partir des données. Selon le paramètre, il existe différentes manières de procéder. Les deux estimations à usage général les plus courantes de σ 2 sont la variance de l' échantillon s 2 = 1σ2 σ2 et un petit multiple de celui-ci,s 2 u =ns2=1n∑i(Xi−Xb)2 (qui est un estimateur sans biais deσ2). L'utilisation de l'un de ces deux à la place deσ2dans le paragraphe précédent et la prise de la racine carrée donne l'erreur standard sous la forme des/√s2u=nn−1s2 σ2 σ2 ousu/ √s/n−−√ .su/n−−√
la source
In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.
la source