Selon l'article de Wikipedia sur l' estimation non biaisée de l'écart type, l'échantillon SD
est un estimateur biaisé du SD de la population. Il est écrit que .
NB Les variables aléatoires sont indépendantes et chaque
Ma question est double:
- Quelle est la preuve de la partialité?
- Comment calcule-t-on l'attente de l'écart type de l'échantillon?
Ma connaissance des maths / stats n'est qu'intermédiaire.
estimation
standard-deviation
Dav Weps
la source
la source
Réponses:
La réponse de NRH à cette question donne une preuve simple et intéressante du biais de l'écart type de l'échantillon. Ici, je vais calculer explicitement l'espérance de l'écart type de l'échantillon (la deuxième question de l'affiche originale) à partir d'un échantillon normalement distribué, point auquel le biais est clair.
La variance non biaisée d'un ensemble de points estx1,...,xn
Si les sont normalement distribués, c’est un fait quexi
où est la vraie variance. La a une densité de probabilitéχ 2 kσ2 χ2k
en utilisant cela, nous pouvons déduire la valeur attendue de ;s
qui découle de la définition de la valeur attendue et du fait que est la racine carrée d'une variable distribuée . L'astuce consiste maintenant à réorganiser les termes afin que l'intégrande devienne une autre densité de : χ2χ2s2( n - 1 )σ2------√ χ2 χ2
maintenant nous connaissons l'intégrale et la dernière ligne est égale à 1, puisqu'il s'agit d'une densité de . Simplifier un peu les constantes donneχ2n
Donc le biais de ests
Il n'est pas difficile de voir que ce biais n'est pas égal à 0 pour un fini , prouvant ainsi que l'écart type de l'échantillon est biaisé. En dessous du biais se trouve la courbe en fonction de pour en rouge avec en bleu:n n σ= 1 Une / 4 n
la source
Vous n'avez pas besoin de normalité. Tout ce dont vous avez besoin est que est un estimateur sans biais de la variance . Puis utilisez que la fonction racine carrée est strictement concave telle que (par une forme forte de l'inégalité de Jensen ) sauf si la distribution de dégénère à .
la source
Complétant la réponse de NRH, si quelqu'un enseigne cela à un groupe d'étudiants qui n'ont pas encore étudié l'inégalité de Jensen, il est possible de définir l'écart type de l'échantillon supposons que soit pas dégénéré (donc, ), et remarquez les équivalences SnVar[Sn]≠00<Var[Sn]=E[S2n]-E2[Sn]
la source