Écart type de l'écart type

54

Qu'est-ce qu'un estimateur de l'écart type de l'écart type si la normalité des données peut être supposée?

Ferdi
la source
Je suppose que vous recherchez la distribution de la variance de l'échantillon . Vous trouverez un lien vers une section de la page Wikipedia sur la variance le 21 août 2016 à 16:55. Comme il s'agit d'un lien vers Wikipedia, cet article pourrait changer à l'avenir. Par conséquent, la section peut ne pas refléter le contenu auquel cette réponse fait référence après de tels changements. Par conséquent, un lien vers une version historique de la page Wikipedia est donné ici. L'article actuel sur la variance se trouve [ici] ( fr.wikipedia.org/wik

Réponses:

58

Soit . Comme indiqué dans ce fil , l’écart type de l’écart type,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

est

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

où est la fonction gamma , est la taille de l'échantillon et est la moyenne de l'échantillon. Puisque est un estimateur cohérent de , ceci suggère de remplacer par dans l'équation ci-dessus pour obtenir un estimateur cohérent de .Γ()¯ X = 1nsσσsSD(s)X¯=1ni=1nXisσσsSD(s)

Si vous recherchez un estimateur non biaisé, nous voyons dans ce fil que , ce qui, par la linéarité de l'espérance, suggèreE(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

comme estimateur non biaisé de . Tout ceci, associé à la linéarité des attentes, donne un estimateur non biaisé de : S D ( s )σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2
Macro
la source
12
+1 Il est agréable de voir non seulement une meilleure réponse arriver après presque deux ans, mais une réponse qui fournit des détails plus utiles que les références figurant ailleurs dans ce fil.
whuber
2
Avez-vous oublié de cadrer les distances dans la première formule?
danijar
2
La fonction Gamma est difficile à calculer pour les valeurs non-petites de . En appliquant l’approximation de Stirling, j’obtiens , ce qui est faisable sur le plan informatique aussi bien qu'un peu expression plus compacte. s nse(11n)n11
equaeghe
1
Cela vaut probablement la peine de souligner que s (calculé dans @ Macro, la réponse est parfois appelée l'erreur type de l'écart type de l'échantillon.
Harvey Motulsky le
Pour ceux qui veulent un formulaire simple,s/2(n1) est une bonne approximation à quelques pour cent.
Syrtis Major
5

X1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n

robin girard
la source
N'est-ce pas une fonction d'estimateur est encore un estimateur? Je ne connais toujours pas \ sigma, seulement X_i.
σ^/n
2σ^22n
1
σ^2n
-3

@Macro a fourni une excellente explication mathématique avec une équation à calculer. Voici une explication plus générale pour les moins mathématiciens.

Je pense que la terminologie "SD of SD" est source de confusion pour beaucoup. Il est plus facile de penser à l’intervalle de confiance d’un écart-type. Quelle est la précision de l'écart type que vous calculez à partir d'un échantillon? Par hasard, vous avez peut-être pu obtenir des données étroitement regroupées, ce qui rend l’échantillon SD bien inférieur au SD de la population. Vous pouvez également avoir obtenu des valeurs obtenues de manière aléatoire qui sont beaucoup plus dispersées que la population globale, ce qui rend l’échantillon SD plus élevé que celui de la population.

L'interprétation de l'IC du SD est simple. Commencez par l’hypothèse habituelle selon laquelle vos données ont été échantillonnées de manière aléatoire et indépendante à partir d’une distribution gaussienne. Maintenant, répétez cet échantillonnage plusieurs fois. Vous vous attendez à ce que 95% de ces intervalles de confiance incluent la population réelle SD.

Quelle est la largeur de l'intervalle de confiance à 95% d'un écart-type? Cela dépend de la taille de l'échantillon (n) bien sûr.

n: 95% IC de SD

2: 0,45 * SD à 31,9 * SD

3: 0,52 * SD à 6,29 * SD

5: 0,60 * SD à 2,87 * SD

10: 0,69 * SD à 1,83 * SD

25: 0,78 * SD à 1,39 * SD

50: 0,84 * SD à 1,25 * SD

100: 0,88 * SD à 1,16 * SD

500: 0,94 * SD à 1,07 * SD

Calculateur Web gratuit

Harvey Motulsky
la source
Je peux faire du Monte Carlo, je voulais juste faire de façon plus «économe»; vous avez toujours raison de dire que la distribution n’est pas normale, cette version sera donc inutile pour les tests.
4
Pour ce que cela vaut, je suis mal à l'aise avec l'affirmation "un intervalle de confiance de 95% ... susceptible de contenir le vrai DS" (ou, de manière plus explicite dans la page liée: "vous pouvez être sûr à 95% que le Le CI calculé à partir de l'échantillon de SD contient la population réelle SD "). Je pense que ces déclarations flirtent avec le renforcement d'une idée fausse populaire, voir ici , par exemple, pour une discussion connexe sur CV.
gung - Réintégrer Monica
5
Que signifie "Je pense que le concept et la terminologie de" SD of SD "sont trop glissants pour être abordés", ce qui est supposé vouloir dire? L'écart type de l'échantillon est une variable aléatoire qui a un écart type.
Macro
@ Macro. Merci pour vos commentaires. J'ai réécrit substantiellement.
Harvey Motulsky
1
@gung. J'ai réécrit pour expliquer correctement l'intervalle de confiance.
Harvey Motulsky