Pourquoi la racine carrée est-elle prise pour le nombre d'échantillons «N» dans la formule d'écart type?

9

J'essaie de comprendre un concept très basique de l'écart-type.

À partir de la formuleσ=i=1n(xiμ)2N

Je ne comprends pas pourquoi devrions-nous diviser par deux la population "N", c'est-à-dire pourquoi voulons-nous prendre N alors que nous n'avons pas fait N2 ? Cela ne biaise-t-il pas la population que nous envisageons?

La formule ne doit pas être σ=i=1n(xiμ)2N

Mahesh Subramaniya
la source

Réponses:

10

Vous essayez de trouver un écart "typique" de la moyenne.

La variance est "la distance quadratique moyenne de la moyenne".

L'écart type est la racine carrée de cela.

Cela en fait la racine carrée moyenne écart par rapport à la moyenne.

  1. Pourquoi utiliserions-nous l'écart quadratique moyen? Qu'est-ce qui rend la variance intéressante? Entre autres choses, en raison d'un fait fondamental sur les variances - que la variance d'une somme de variables non corrélées est la somme des variances individuelles. (Ceci est couvert dans un certain nombre de questions, par exemple ici sur CrossValidated. Cette fonctionnalité pratique n'est pas partagée, par exemple, par l'écart absolu moyen.
  2. Pourquoi prendre la racine carrée de cela? Parce qu'alors c'est dans les mêmes unités que les observations originales. Il mesure un type particulier de «distance typique» de la moyenne (comme mentionné, la distance RMS) - mais en raison de la propriété de variance ci-dessus - qui a de belles caractéristiques.
Glen_b -Reinstate Monica
la source
7

L' écart type est la racine carrée de la variance .

La variance est la distance quadratique moyenne des données par rapport à la moyenne. Puisqu'une moyenne est la somme divisée par le nombre d'éléments additionnés, la formule de la variance est: Puisque, encore une fois, l'écart-type est simplement la racine carrée de cela, la formule de l'écart-type est: Rien n'a été ajouté ou modifié à propos de les hypothèses ou la variance ici, nous avons simplement pris la racine carrée de la variance, car c'est ce que l'écart-type est .

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N
gung - Réintégrer Monica
la source
il faut peut-être mentionner que cette formule de variance n'est vraie que pour les uniformes discrets. sinon cela pourrait brouiller la distinction entre variance de l'échantillon et de la population
Taylor
@ Taylor, je ne sais pas ce que tu veux dire. La formule de la variance n'est pas liée à la distribution.
gung - Rétablir Monica
la formule de la variance (échantillon) n'est pas liée à la distribution ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor
@ Taylor, je ne sais toujours pas ce que tu veux dire. La formule de la variance n'est pas liée à la distribution. Pour citer la page Wikipedia, "La variance d'une variable aléatoire, X, est la valeur attendue de l'écart au carré de la moyenne de X ... . Cette définition englobe les variables aléatoires générées par des processus discrets, continus, ni l'un ni l'autre. " La formule ne s'applique pas uniquement à l'uniforme discret. Var(X)=E[(Xμ)2]
gung - Rétablir Monica
Oui, c'est vrai, si vous prenez , mais n'est pas nécessairement égal, pour toute variable aléatoire , . D'une part, la première est une constante et la seconde est aléatoire. En fait, il n'est pas clair si la somme passe par le support de ou le nombre d'échantillons. Si ce dernier est étrange, vous connaissez , ce qui est rare dans la pratique. Si le premier, alors oui, c'est seulement vrai pour les uniformes discrets (parce que c'est une somme) (parce que les poids sont tous uniformes). μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Taylor
1

La première chose à comprendre est que l'écart type (std) est différent de l'écart absolu moyen . Ces deux définissent des propriétés mathématiques différentes sur les données.

Contrairement à l'écart absolu moyen, l'écart type (std) pèse davantage sur les valeurs qui sont loin d'être moyennes, ce qui se fait en mettant au carré les valeurs de différence.

Par exemple, pour les quatre points de données suivants:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

écart absolu moyen (aad) , et=16/4=4.0

Écart type (std) =80/4=20=4.47

Dans les données, il y a deux points éloignés de 6 de la moyenne et deux points éloignés de 2 de la moyenne. Ainsi, un écart de 4,47 a plus de sens que 4.

Étant donné que l'observation totale est toujours , pour calculer std, nous ne plongons pas par , nous divisons plutôt la variance totale par et prenons sa racine carrée, pour la ramener à la même unité que les données d'origine.NNN

aumpen
la source
0

@Mahesh Subramaniya - Ce n'est qu'une torsion mathématique . Lorsque nous avons une valeur d'origine comme . Nous pouvons obtenir la même valeur en utilisant ces deux équations et .a/b=()da2b=ccb=d

Par exemple, faites-le simplement avec = . Mais, nous voulons seulement de la valeur et non moins.522.5

Maintenant, . Et,522=12.512.52=2.5

Ellephy
la source