Pour la variance non pondérée il existe la variance d'échantillon corrigée du biais, lorsque la moyenne a été estimée à partir des mêmes données: Var(X):=1
J'examine la moyenne et la variance pondérées et je me demande quelle est la correction de biais appropriée pour la variance pondérée. En utilisant:
La variance "naïve", non corrigée que j'utilise est la suivante:
Je me demande donc si la bonne façon de corriger le biais est
A)
ou B)
ou C)
A) n'a pas de sens pour moi lorsque les poids sont petits. La valeur de normalisation pourrait être 0 ou même négative. Mais qu'en est-il de B) ( est le nombre d'observations) - est-ce la bonne approche? Avez-vous une référence qui le montre? Je crois que «la mise à jour des estimations de la moyenne et de la variance: une méthode améliorée», DHD West, 1979 utilise cela. Le troisième, C) est mon interprétation de la réponse à cette question: /mathpro/22203/unbias-estimate-of-the-variance-of-an-unnormalised-weighted-mean
Pour C) je viens de réaliser que le dénominateur ressemble beaucoup à . Y a-t-il un lien général ici? Je pense que cela ne correspond pas entièrement; et il y a évidemment le lien que nous essayons de calculer la variance ...
Tous les trois semblent "survivre" à la vérification de la raison de fixer tous . Alors, lequel dois-je utiliser, sous quels locaux? '' Mise à jour: '' whuber a suggéré de faire également le test de santé mentale avec ω 1 = ω 2 = .5 et tous les ω i = ϵ restants minuscules. Cela semble exclure A et B.
la source
Réponses:
Je suis passé par le calcul et je me suis retrouvé avec la variante C:
la source
A et C sont corrects, mais celui que vous utiliserez dépend du type de poids que vous utilisez:
La raison pour laquelle C est nécessairement biaisé est que si vous n'utilisez pas de poids de type "répétition", vous perdez la possibilité de compter le nombre total d'observations (taille de l'échantillon) et vous ne pouvez donc pas utiliser un facteur de correction.
Pour plus d'informations, consultez l'article Wikipédia mis à jour récemment: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
la source