Vous pouvez tout trouver ici . Cependant, voici une brève réponse.
Soit μ et σ2 la moyenne et la variance d'intérêt; vous souhaitez estimer σ2 partir d'un échantillon de taille n .
Maintenant, disons que vous utilisez l'estimateur suivant:
S2=1n∑ni=1(Xi−X¯)2 ,
où est l'estimateur deX¯=1n∑ni=1Xi .μ
Il n'est pas trop difficile (voir note de bas de page) de voir que E[S2]=n−1nσ2 .
Puisque , l'estimateur S 2E[S2]≠σ2S2 est dit biaisé.
Mais observons que . Donc ˜ S 2=nE[nn−1S2]=σ2est un estimateur non biaisé deσ2.S~2=nn−1S2σ2
note de bas de page
Commencez par écrire puis développez le produit ...(Xi−X¯)2=((Xi−μ)+(μ−X¯))2
Modifier pour tenir compte de vos commentaires
La valeur attendue de ne donne pas σ 2 (et donc S 2 est biaisée) mais il s'avère que vous pouvez transformer S 2 en ˜ S 2 de sorte que l'attente donne σ 2 .S2σ2S2S2S~2σ2
En pratique, on préfère souvent travailler avec au lieu de S 2 . Mais, si n est assez grand, ce n'est pas un gros problème puisque nS~2S2nnn−1≈1 .
Remarque Notez que l'impartialité est une propriété d'un estimateur et non d'une attente comme vous l'avez écrit.
Je veux dire plus en termes théoriques. Je peux trouver la formule dans n'importe quel livre, mais je m'intéresse plus à l'explication des mots. L'attente du sigma est non biaisée et pouvons-nous transformer l'estimation en attente?
dessus du
Je pose également des questions sur les aspects pratiques de cela, utilisez-vous cette conversion lors de l'analyse?
dessus du
@ocram Qu'est-ce que ? Est-ce la taille de l'échantillon? Ou nombre d'échantillons prélevés? Ou les deux? n
Quirik
@quirik: L'hypothèse est qu'un seul échantillon est prélevé et que cet échantillon est de taille n
ocram
@ocram Comment calculer alors la valeur de variance attendue si nous avons un échantillon? Qu'est-ce que je rate?
Quirik
6
Cette réponse clarifie la réponse d'ocram. La raison principale (et les malentendus courants) pour E[S2]≠σ2 est que utilise l'estimation ˉ XS2X¯ qui est elle-même estimée à partir des données.
Si vous travaillez sur la dérivation, vous verrez que la variance de cette estimation E[(X¯−μ)2]−σ2n
L'explication donnée par @Ocram est excellente. Pour expliquer ce qu'il a dit avec des mots: si nous calculons en divisant juste par n , (ce qui est intuitif) notre estimation de ss2ns2n−1
Merci de votre aide. Quelques questions: Dans votre exercice: à quel type de distribution faites-vous référence, Binomial? Que voulez-vous dire par constituer une probabilité discrète? Vous voulez dire calculer toutes les probabilités de 2 et 6 sur différentes tailles d'échantillon?
dessus du
1
En général, l'utilisation de «n» dans le dénominateur donne des valeurs plus petites que la variance de la population, ce que nous voulons estimer. Cela se produit surtout si les petits échantillons sont prélevés. Dans le langage des statistiques, nous disons que la variance de l'échantillon fournit une estimation «biaisée» de la variance de la population et doit être rendue «non biaisée».
Cette vidéo répondra correctement à chaque partie de votre question.
Cette réponse clarifie la réponse d'ocram. La raison principale (et les malentendus courants) pourE[S2]≠σ2 est que utilise l'estimation ˉ XS2 X¯ qui est elle-même estimée à partir des données.
Si vous travaillez sur la dérivation, vous verrez que la variance de cette estimationE[(X¯−μ)2] −σ2n
la source
L'explication donnée par @Ocram est excellente. Pour expliquer ce qu'il a dit avec des mots: si nous calculons en divisant juste par n , (ce qui est intuitif) notre estimation de ss2 n s2 n−1
Parfois, tu dois te salir les mains.
la source
En général, l'utilisation de «n» dans le dénominateur donne des valeurs plus petites que la variance de la population, ce que nous voulons estimer. Cela se produit surtout si les petits échantillons sont prélevés. Dans le langage des statistiques, nous disons que la variance de l'échantillon fournit une estimation «biaisée» de la variance de la population et doit être rendue «non biaisée».
Cette vidéo répondra correctement à chaque partie de votre question.
https://www.youtube.com/watch?v=xslIhnquFoE
la source