Formule Microsoft Excel pour la variance

8

Selon l'aide de Microsoft Excel:

VAR utilise la formule suivante:
Formule

où x est la MOYENNE moyenne de l'échantillon (nombre1, nombre2,…) et n est la taille de l'échantillon.

Ne devrait-il pas être n, plutôt que n - 1, dans le dénominateur?

Paul Reiners
la source
@onestop La balise "partialité statistique" est quelque peu déroutante ici.
chl
Vous avez peut-être raison. Les lignes directrices suggèrent de mettre à jour les balises à la lumière des réponses ainsi que de la question d'origine, donc je me demandais s'il y avait une balise pour «estimateur non biaisé» ou «impartialité», mais il n'y en avait pas, alors j'ai utilisé «biais statistique» au motif que des étiquettes distinctes pour les revers d'une même pièce semblent un peu inutiles, et les lignes directrices favorisent la réutilisation des étiquettes existantes plutôt que la création de nouvelles. Je suis sur le point de m'endormir, mais je vais y jeter un autre coup d'œil demain matin.
2010
J'ai changé le biais statistique en estimateur sans biais. Est-ce que ça marche?
Ça me va. Je viens d'ajouter cette nouvelle balise à quelques autres anciens messages - qu'en pensez-vous? La balise "biais statistique" a-t-elle encore sa place? Si oui, quand l'utiliseriez-vous? Est-ce à cela que le système "tag wiki" est destiné? Je crains de ne pas avoir déterminé si ni comment je peux le modifier. Peut-être que nous devrions porter cela à la méta ...
onestop
@Skrikant En fait, je ne pensais pas qu'une autre balise était nécessaire, mais la vôtre semble meilleure.
chl

Réponses:

9

Utilisez VARP pour la variance souhaitée («variance de la population»). VAR est l'estimateur sans biais pour une population normalement distribuée.

whuber
la source
10
VAR est sans biais pour toute distribution avec une variance finie, pas seulement pour la distribution normale.
Rob Hyndman
Bon, quelle que soit la variance signifie lorsque la distribution n'est pas proche de la normale ;-)
2
@mbq pour certains, la variance est un moment d'inertie. il y a aussi l'inégalité de chebyshev, qui s'applique à toute distribution. il a également une interprétation similaire à celle de la normale pour toute famille d'emplacement / échelle avec un second moment fini - comme la logistique, par exemple. [les fichiers PDF n'ont pas besoin d'être symétriques, cependant.]
ronaf
cependant, comme le souligne Whuber, il existe deux fonctions excellentes pour la variance, si mes souvenirs sont corrects, il n'y en a qu'une pour la covariance - et elle se divise par n, pas n-1. [Je n'ai pas vérifié la dernière version d'Excel, tho. quelqu'un peut-il nous dire si c'est toujours le cas?]
ronaf
@ronaf prétendument Excel 2010 a maintenant à la fois, COVARIANCE.P et COVARIANCE.S. Cependant, la documentation est si lugubre qu'on ne peut pas vraiment en être sûr! (Dans les anciennes versions, si vous connaissez la covariance, vous êtes probablement suffisamment bien informé pour pouvoir multiplier le résultat par n / (n-1) dans la formule.) Pour plus d'informations, visitez office.microsoft.com/en- nous / excel-help /…
whuber
5

Utilisez VAR (avec dénominateur n-1) lorsque vous souhaitez estimer la variance de la population sous-jacente de l'échantillon, ou VARP (avec dénominateur n) lorsque l'échantillon est la population.

Je trouve le nom "variance de la population" assez ambigu ...

Michael Lew
la source
Clair comme de l'eau de roche! Je trouve le nom "variance de la population" ambigu aussi.
bersanri