Quelle est la différence entre la variance et l'écart type?

127

Je me demandais quelle est la différence entre la variance et l'écart type.

Si vous calculez les deux valeurs, il est clair que vous obtenez l'écart type de la variance, mais qu'est-ce que cela signifie en termes de distribution que vous observez?

De plus, pourquoi avez-vous vraiment besoin d'un écart-type?

Le max
la source
12
Vous avez probablement déjà eu la réponse. Toujours ce lien a la plus simple et la meilleure explication. mathsisfun.com/data/standard-deviation.html
2
L’écart type est utile car la valeur est à la même échelle que les données à partir desquelles elle a été calculée. Si vous mesurez des compteurs, l'écart type sera de mètres. La variance, en revanche, sera exprimée en mètres carrés.
Vladislavs Dovgalecs
1
La variation standard peut être non biaisée mais la déviation standard ne le peut pas car la fonction racine carrée n'est pas linéaire.
Daksh Gargas le

Réponses:

85

L'écart-type est la racine carrée de la variance.

L'écart-type est exprimé dans les mêmes unités que la moyenne, alors que la variance est exprimée en unités carrées, mais pour regarder une distribution, vous pouvez utiliser soit aussi longtemps que vous savez clairement ce que vous utilisez. Par exemple, une distribution normale avec une moyenne = 10 et sd = 3 est exactement la même chose qu'une distribution normale avec une moyenne = 10 et une variance = 9.

Peter Flom
la source
58
Ouais c'est la façon mathématique d'expliquer ces deux paramètres, mais quelle est l'explication logique? Pourquoi ai-je vraiment besoin de deux paramètres pour montrer la même chose (l'écart autour de la moyenne arithmétique) ...
Le Max
5
Vous n'avez pas vraiment besoin des deux. Si vous en signalez un, vous n'avez pas besoin de signaler l'autre
Peter Flom
8
Nous avons besoin des deux: l’écart-type est bon pour l’interprétation, les rapports. Pour développer la théorie, la variance est meilleure.
kjetil b halvorsen
4
L’avantage de signaler l’écart type est qu’il reste dans l’échelle des données. Par exemple, un échantillon de hauteurs d’adultes est exprimé en mètres, l’écart-type sera également exprimé en mètres.
Vladislavs Dovgalecs
5
Vuner(ΣXje)=ΣVuner(Xje)
49

Vous n'avez pas besoin des deux. Ils ont chacun des buts différents. Le DS est généralement plus utile pour décrire la variabilité des données, tandis que la variance est généralement beaucoup plus utile mathématiquement. Par exemple, la somme des distributions non corrélées (variables aléatoires) a également une variance qui est la somme des variances de ces distributions. Ce ne serait pas vrai du SD. D'autre part, le SD a l'avantage d'être exprimé en unités de la variable d'origine.

John
la source
24

Si Jean fait référence à des variables aléatoires indépendantes lorsqu'il dit «distributions non liées», sa réponse est correcte. Cependant, pour répondre à votre question, plusieurs points peuvent être ajoutés:

  1. La moyenne et la variance sont les deux paramètres qui déterminent une distribution normale.

  2. k

  3. z0t

  4. 68%195,4%299%3

  5. La marge d'erreur est exprimée sous la forme d'un multiple de l'écart type de l'estimation.

  6. La variance et le biais sont des mesures de l’incertitude en quantité aléatoire. L'erreur quadratique moyenne pour une estimation est égale à la variance + le biais au carré.

Michael Chernick
la source
4
Vous ne devriez probablement pas dire «paramètre naturel», qui sont la moyenne divisée par la variance et 1 divisée par la variance: en.wikipedia.org/wiki/Natural_parameter
Neil G
σ
Au point 3, ne faudrait-il pas que "l'écart-type soit utilisé pour normaliser les statistiques" au lieu de normaliser?
Harry
15

La variance d'un ensemble de données mesure la dispersion mathématique des données par rapport à la moyenne. Cependant, bien que cette valeur soit théoriquement correcte, il est difficile de l'appliquer dans un sens réel du monde car les valeurs utilisées pour la calculer étaient au carré. L'écart-type, en tant que racine carrée de la variance, donne une valeur exprimée dans les mêmes unités que les valeurs d'origine, ce qui facilite beaucoup le travail et son interprétation avec le concept de courbe normale.

Hassan
la source
Cela explique très bien pourquoi en termes simples.
GWG
3
Un autre point intéressant à souligner est que chaque métrique sd et var mesure la dispersion de la variable autour de la moyenne. Prendre la racine carrée de la variance pour obtenir l'écart type pourrait être considéré comme un facteur d'échelle appliqué pour ramener la métrique en unités de la variable.
Matt L.
6

En termes de distribution, ils sont équivalents (mais ne sont évidemment pas interchangeables), mais sachez qu'en termes d'estimateurs, ils ne le sont pas: la racine carrée d'une estimation de la variance n'est PAS un estimateur (sans biais) de l'écart type. Seulement pour un nombre d'échantillons relativement grand (et selon les estimateurs), les deux s'approchent l'un de l'autre. Pour les échantillons de petite taille, vous devez connaître la forme paramétrique de la distribution à convertir entre les deux, qui peut devenir légèrement circulaire.

Quartz
la source
4

Lors du calcul de la variance, nous avons corrigé les écarts. Cela signifie que si les données (observations) données sont en mètres, elles deviendront des mètres carrés. J'espère que ce n'est pas une représentation correcte des écarts. Donc, nous retrouvons la racine carrée (SD) qui n’est que SD.

g ravi
la source