Déterminer la vraie moyenne à partir d'observations bruyantes

13

J'ai un grand ensemble de points de données du formulaire (moyenne, stdev). Je souhaite réduire cela à une moyenne (meilleure) et à un écart-type (espérons-le) plus petit.

De toute évidence, je pourrais simplement calculer , mais cela ne tient pas compte du fait que certains points de données sont nettement plus précis que d'autres.datameanN

Pour le dire simplement, je souhaite effectuer une moyenne pondérée de ces points de données, mais je ne sais pas quelle devrait être la fonction de pondération en termes d'écart type.

Michael
la source

Réponses:

24

Vous recherchez un estimateur linéaire pour la moyenne de la formeμ

μ^=i=1nαixi

où les sont les poids et les sont les observations. L'objectif est de trouver des valeurs appropriées pour les poids. Soit la véritable déviation standard de , qui pourrait coïncider ou non avec la déviation standard estimée que vous avez probablement. Supposons que les observations ne sont pas biaisées; c'est-à-dire que leurs attentes sont toutes égales à la moyenne . En ces termes, nous pouvons calculer que l'attente de estx i σ i x i um umαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

et (à condition que les soient pas corrélés) la variance de cet estimateur estxi

Var[μ^]=i=1nαi2σi2.

À ce stade, de nombreuses personnes exigent que l'estimateur soit sans biais; c'est-à-dire que nous voulons que son attente soit égale à la vraie moyenne. Cela implique que les poids doivent correspondre à l'unité. Sous réserve de cette restriction, la précision de l'estimateur (mesurée avec l'erreur quadratique moyenne) est optimisée en minimisant la variance. La solution unique (facilement obtenue avec un multiplicateur de Lagrange ou en réinterprétant la situation géométriquement comme un problème de minimisation de distance) est que les poids doivent être proportionnels à . 1 / σ 2 iαi1/σi2 La restriction somme-à-unité fixe leurs valeurs, ce qui donne

μ^=i=1nxi/σi2i=1n1/σi2

et

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

Dans les mots,

l'estimateur sans biais de variance minimale de la moyenne est obtenu en rendant les poids inversement proportionnels aux variances; la variance de cet estimateur est fois la moyenne harmonique des variances.1/n

Nous ne connaissons généralement pas les vraies variances . Tout ce que nous pouvons faire est de rendre les poids inversement proportionnels aux variances estimées (les carrés de vos écarts-types) et espérons que cela fonctionnera bien.σi

whuber
la source
1
et lié à cette réponse, également de whuber: stats.stackexchange.com/questions/9071/…
Henry
Que se passerait-il si nous ne «supposons pas que les observations sont non biaisées»? Avec cette affirmation, vous dites que si des mesures individuelles aléatoires infinies sont ajoutées à l'observation nous obtenons la moyenne mu? xi
user1420303