Désolé si cela a été répondu ailleurs, je n'ai pas pu le trouver.
Je me demande pourquoi nous prenons la racine carrée , en particulier, de la variance pour créer l'écart type? De quoi s'agit-il de prendre la racine carrée qui produit une valeur utile?
Réponses:
Dans un certain sens, c'est une question banale, mais dans un autre, elle est en fait assez profonde!
Comme d' autres l' ont mentionné, la racine carrée implique a les mêmes unités que .Stdev( X) X
En prenant la racine carrée vous donne une homogénéité absolue aka l' évolutivité absolue . Pour toute variable scalaire et aléatoire , nous avons: L'homogénéité absolue est une propriété requise d'une norme . L'écart type peut être interprété comme une norme (sur l'espace vectoriel de variables aléatoires moyennes nulles) de la même manière que est la norme euclidienne standard dans une dimension tridimensionnelle. espace. L'écart type est une mesure de la distance entre une variable aléatoire et sa moyenne.α X Stdev[ α X] = | α | Stdev[ X]
√X2+ y2+ z2----------√
Écart type et normeL2
Cas de dimension finie:
Dans un espace vectoriel à dimensions, la norme euclidienne standard alias la norme est définie comme:n L2
Plus largement, la -norm prend la ème racine pour obtenir l'absolu homogénéité: .p ∥ x ∥p= ( ∑je| Xje|p)1p p ∥ α x ∥p= ( ∑je| α xje|p)1p= | α | ( ∑je| Xje|p)1p= | α | ∥ x ∥p
Si vous avez des poids la somme pondérée est également une norme valide. De plus, c'est l'écart type si représente des probabilités etqje ∑jeX2jeqje------√ qje E[ x ] ≡ ∑jeXjeqje= 0
Cas de dimension infinie:
Dans un espace de Hilbert de dimension infinie, nous pouvons également définir la norme :L2
Si est une variable aléatoire moyenne nulle et est la mesure de probabilité, quel est l'écart type? C'est la même chose: .X P ∫ωX(ω)2dP(ω)−−−−−−−−−−−−√
Sommaire:
Prendre la racine carrée signifie que l'écart-type satisfait l'homogénéité absolue , une propriété requise d'une norme .
Sur un espace de variables aléatoires, est un produit interne et le norme induite par ce produit intérieur . Ainsi, l'écart-type est la norme d'une variable aléatoire dégradée: C'est une mesure de la distance à la moyenne à .⟨X,Y⟩=E[XY] ‖ X ‖ 2 = √∥X∥2=E[X2]−−−−−√ Stdev[X]=‖X-E[X]‖2EStdev[X]=∥X−E[X]∥2 E[X] X
(Point technique: alors que est une norme, l'écart-type n'est pas une norme sur les variables aléatoires en général car une exigence pour un espace vectoriel normé est si et seulement si . Un écart type de 0 ne fait pas ' t implique que la variable aléatoire est l'élément zéro.)E[X2]−−−−−√ E[(X−E[X])2]−−−−−−−−−−−−√ ‖x‖=0x=0∥x∥=0 x=0
la source
La variance de est définie comme , il s'agit donc d'une attente d'une différence au carré entre X et sa valeur attendue.X V(X)=E(X−E(X))2
Si est temps en secondes, est en secondes, mais est dans et est de nouveau en secondes.X X−E(X) V(X) seconds2 V(X)−−−−−√
la source
La réponse simple est que les unités sont à la même échelle que la moyenne. Exemple: j'estime que la moyenne des élèves du secondaire est de 160 cm avec un écart-type (ET) de 20 cm. Il est intuitivement plus facile de se faire une idée de la variation avec le SD que de la variance de 400 cm ^ 2.
la source
En termes plus simples, l'écart-type est conçu pour nous donner un nombre positif qui en dit long sur la diffusion de nos données à propos de sa moyenne.
Si nous devions simplement additionner les distances de tous les points à la moyenne, alors les points dans les directions positive et négative se combineraient d'une manière qui aurait tendance à revenir vers la moyenne et nous perdrions des informations sur la propagation. C'est pourquoi nous mesurons d'abord la variance, de sorte que toutes les distances soient préservées en tant que quantités positives via la quadrature et qu'elles ne s'annulent pas. En fin de compte, nous voulons une valeur positive qui représente les unités avec lesquelles nous avons commencé - cela a déjà été commenté ci-dessus - nous prenons donc la racine carrée positive.
la source
C'est une stupidité historique que nous continuons en raison de la paresse intellectuelle. Ils ont choisi de quadriller les différences par rapport à la moyenne afin de se débarrasser du signe moins. Ensuite, ils ont pris la racine carrée pour la porter à une échelle similaire à la moyenne.
Quelqu'un devrait générer de nouvelles statistiques, calculer la variance et l'écart-type en utilisant un module ou des valeurs absolues de déviance par rapport à la moyenne. Cela permettrait de se débarrasser de toute cette quadrature et de prendre ensuite l'entreprise racine carrée.
la source