Pour quelles distributions existe-t-il un estimateur sans biais de forme fermée pour l'écart-type?

16

Pour la distribution normale, il existe un estimateur non biaisé de l'écart-type donné par:

σ^unbiased=Γ(n12)Γ(n2)12k=1n(xix¯)2

La raison pour laquelle ce résultat n'est pas si bien connu semble être qu'il s'agit en grande partie d'une curiosité plutôt que d'une question de grande importance . La preuve est couverte sur ce fil ; il profite d'une propriété clé de la distribution normale:

1σ2k=1n(xix¯)2χn12

De là, avec un peu de travail, il est possible de prendre l'attente E(k=1n(xix¯)2), et en identifiant cette réponse comme un multiple deσ, on peutdéduire le résultat pour σ non biaisée.σ^unbiased

Cela me laisse curieux de savoir quelles autres distributions ont un estimateur sans biais de forme fermée de l'écart-type. Contrairement à l'estimateur non biaisé de la variance, cela est clairement propre à la distribution. De plus, il ne serait pas simple d'adapter la preuve pour trouver des estimateurs pour d'autres distributions.

Les distributions skew-normales ont de belles propriétés distributionnelles pour leurs formes quadratiques, dont la propriété de distribution normale que nous avons utilisée est en fait un cas spécial (puisque la normale est un type spécial de skew-normal) donc il ne serait peut-être pas si difficile de étendre cette méthode à eux. Mais pour d'autres distributions, il semblerait qu'une approche entièrement différente soit requise.

Existe-t-il d'autres distributions pour lesquelles de tels estimateurs sont connus?

Silverfish
la source
1
Si vous ignorez les distractions techniques, la nature de la réponse devient plus claire. Dans le cas normal, peu de ce que vous écrivez est vraiment pertinent pour la conclusion; tout ce qui compte, c'est que la quantité de biais dans cet estimateur particulier est fonction de seul (et ne dépend pas d'autres paramètres de distribution qui doivent être estimés à partir des données). n
whuber
@whuber Je pense que je peux voir l'idée générale à laquelle vous faites allusion, et clairement "la fonction de seul" est nécessaire. Mais je ne pense pas que ce serait suffisant - si nous n'avions pas accès à de bons résultats de distribution, alors je ne vois pas comment l'aspect "forme fermée" serait traitable. n
Silverfish
5
Cela dépend de ce que vous entendez par «forme fermée». Par exemple, pour une personne, une fonction thêta peut être "fermée", mais pour une autre, ce n'est qu'un produit infini, une série de puissances ou une intégrale complexe. À bien y penser, c'est précisément ce qu'est une fonction Gamma :-).
whuber
@whuber Bon point! Par "la quantité de biais dans cet estimateur particulier", je suppose que vous voulez dire que le biais dans (plutôt que l'estimateur énuméré dans la question, qui a un biais nul) est une fonction de n (et aussi dans σ , mais heureusement de telle manière que nous pouvons facilement réorganiser pour trouver un estimateur sans biais)? snσ
Silverfish
1
@whuber: Il devrait y avoir une formule similaire pour toute famille à l'échelle de l'emplacement, avec la mise en garde que vous avez souligné que la fonction de peut être une intégrale intraitable. n
Xi'an

Réponses:

10

Bien que cela ne soit pas directement lié à la question, il y a un article de 1968 de Peter Bickel et Erich Lehmann qui déclare que, pour une famille convexe de distributions , il existe un estimateur non biaisé d'un q fonctionnel ( F ) (pour une taille d'échantillon n assez grand) si et seulement si q ( α F + ( 1 - α ) G ) est un polynôme à 0 α 1Fq(F)nq(αF+(1α)G)0α1. Ce théorème ne s'applique pas au problème ici car la collection de distributions gaussiennes n'est pas convexe (un mélange de gaussiens n'est pas un gaussien).

Une extension du résultat de la question est que toute puissance de l'écart-type peut être estimée sans biais, à condition qu'il y ait suffisamment d'observations lorsque α < 0 . Cela découle du résultat 1σαα<0 queσest le paramètre d'échelle (et unique) pour n k = 1 (xi- ˉ x )2.

1σ2k=1n(xix¯)2χn12
σk=1n(xix¯)2

Ce réglage normal peut ensuite être étendu à toute famille d'échelle d'emplacement avec une variance finie σ 2 . En effet,

X1,,Xniidτ1f(τ1{xμ})
σ2
  1. varμ,τ(X)=Eμ,τ[(Xμ)2]=τ2E0,1[X2]
    τ
  2. Eμ,τ[k=1n(XiX¯)2]=τ2Eμ,τ[k=1nτ2(XiμX¯+μ)2]=τ2E0,1[k=1n(XiX¯)2]
    has an expectation of the form τ2ψ(n);
  3. and similarly for any power
    Eμ,τ[{k=1n(XiX¯)2}α]=τ2αE0,1[{k=1n(XiX¯)2}α]
    such that the expectation is finite.
Xi'an
la source
10

A probably well known case, but a case nevertheless.
Consider a continuous uniform distribution U(0,θ). Given an i.i.d. sample, the maximum order statistic, X(n) has expected value

E(X(n))=nn+1θ

The standard deviation of the distribution is

σ=θ23

So the estimator

σ^=123n+1nX(n)

is evidently unbiased for σ.

This generalizes to the case where the lower bound of the distribution is also unknown, since we can have an unbiased estimator for the Range, and then the standard deviation is again a linear function of the Range (as is essentially above also).

This exemplifies @whuber's comment, that "the amount of bias is a function of n alone" (plus possibly any known constants) -so it can be deterministically corrected. And this is the case here.

Alecos Papadopoulos
la source
4
Now the hard part: when in the world are we interested in the standard deviation of a uniform distribution? (+1)
shadowtalker
1
@ssdecontrol That's an excellent question! -please proceed to the next one...
Alecos Papadopoulos
2
One thing I love about this answer is how poor the estimator is. It's quite common to see a question which boils down to "why do we use θ^ as an estimator even though it's biased?" Some students need convincing that unbiasedness is not the be-all and end-all, and a poor unbiased estimator is one way to show them.
Silverfish
1
@Silverfish Poor in what way? Some quick simulations show this to have lower MSE than the usual standard deviation (which surprised me).
Dave
@Dave Interesting! I had jumped to the conclusion it would be poor since it only looked at the maximum order statistic, but I too stand surprised! Shows the value of doing some simulation...
Silverfish