La variance est-elle un concept plus fondamental que l'écart-type?

18

Sur ce site de psychométrie, j'ai lu que

[A] ta variance de niveau profond est un concept plus fondamental que l'écart-type.

Le site n'explique pas vraiment pourquoi la variance est censée être plus fondamentale que l'écart-type, mais cela m'a rappelé que j'ai lu des choses similaires sur ce site.

Par exemple, dans ce commentaire @ kjetil-b-halvorsen écrit que "l'écart-type est bon pour l'interprétation, le rapport. Pour développer la théorie, la variance est meilleure".

Je sens que ces revendications sont liées, mais je ne les comprends pas vraiment. Je comprends que la racine carrée de la variance de l'échantillon n'est pas un estimateur non biaisé de l'écart-type de la population, mais il doit certainement y avoir plus que cela.

Peut-être que le terme "fondamental" est trop vague pour ce site. Dans ce cas, nous pouvons peut-être opérationnaliser ma question en me demandant si la variance est plus importante que l'écart-type du point de vue du développement de la théorie statistique. Pourquoi pourquoi pas?

user1205901 - Réintégrer Monica
la source
N'est-ce pas la même chose? C'est comme 1 + 1 est le même que 2 * 1?
SmallChess
2
La variance est le deuxième cumulant, . L' article de Wikipedia sur les cumulants devrait impressionner tout le monde par leur naturel et leur importance, non seulement pour l'étude des variables aléatoires mais aussi en physique et en combinatoire. La propriété de multilinéarité (qui est fondamentale pour effectuer des calculs), ainsi que l'extension des cumulants aux distributions multivariées, ne bénéficient pas de l'écart-type. κ2
whuber

Réponses:

16

Les réponses de Robert et Bey donnent une partie de l'histoire (c'est-à-dire que les moments ont tendance à être considérés comme des propriétés de base des distributions, et l'écart-type conventionnel est défini en termes de deuxième moment central plutôt que l'inverse), mais dans quelle mesure ces les choses sont vraiment fondamentales dépend en partie de ce que nous entendons par le terme.

Il n'y aurait pas de problème insurmontable, par exemple, si nos conventions allaient dans l'autre sens - rien ne nous empêche de définir conventionnellement une autre séquence de quantités à la place des moments habituels, disons pour (notez que s'inscrit à la fois dans la séquence des moments et celle-ci en tant que premier terme) puis définissez les moments - et toutes sortes de calculs par rapport à moments - en termes d'entre eux. Notez que ces quantités sont toutes mesurées dans les unités d'origine, ce qui est un avantage par rapport aux moments (qui sont en puissances des unités d'origine, et donc plus difficiles à interpréter). Cela ferait de l'écart type de la population la quantité et la variance définies en fonction de celui-ci.E[(X-μ)p]1/pp=1,2,3,...μp

Cependant, cela rendrait les quantités comme la fonction de génération de moment (ou un équivalent relatif aux nouvelles quantités définies ci-dessus) moins "naturelles", ce qui rendrait les choses un peu plus gênantes (mais certaines conventions sont un peu comme ça). Il y a des propriétés pratiques du MGF qui ne seraient pas aussi pratiques dans l'autre sens.

Plus fondamental, à mon avis (mais en relation avec lui), il existe un certain nombre de propriétés de variance de base qui sont plus pratiques lorsqu'elles sont écrites en tant que propriétés de variance que lorsqu'elles sont écrites en tant que propriétés d'écart type (par exemple, la variance des sommes d'indépendant variables aléatoires est la somme des variances).

Cette additivité est une propriété qui n'est pas partagée par d'autres mesures de dispersion et elle a un certain nombre de conséquences importantes.

[Il existe des relations similaires entre les autres cumulants, c'est donc un sens dans lequel nous pourrions vouloir définir les choses par rapport aux moments plus généralement.]

Toutes ces raisons sont sans doute soit conventionnelles, soit pratiques, mais dans une certaine mesure, c'est une question de point de vue (par exemple, à certains points de vue, les moments sont des quantités assez importantes, d'autres ne le sont pas du tout). Il se peut que le bit "à un niveau profond" soit destiné à n'impliquer rien de plus que celui de kjetil "lors du développement de la théorie".

Je suis d'accord avec l'argument de kjetil que vous avez soulevé dans votre question; dans une certaine mesure, cette réponse est simplement une discussion à la main.

Glen_b -Reinstate Monica
la source
Je dirais que les deux sont sur un pied d'égalité, chacun avec son propre ensemble de commodités d'accompagnement.
JM n'est pas statisticien le
2

La variance est définie par les premier et deuxième moments d'une distribution. En revanche, l'écart-type ressemble plus à une «norme» qu'à un instant. Les moments sont des propriétés fondamentales d'une distribution, alors que les normes ne sont que des moyens de faire une distinction.


la source
2

La variance est plus fondamentale que l'écart-type parce que l'écart-type est défini comme «la racine carrée de la variance», par exemple sa définition dépend entièrement de la variance.

La variance, en revanche, est définie - de manière totalement indépendante - comme «l'attente de la différence au carré entre un échantillon et la moyenne».

Robert de Graaf
la source
3
Je verrais cela plus comme un rapport sur les façons dont nous utilisons (souvent) des termes, par exemple dans l'enseignement, pas comme une réflexion sur ce qui est fondamental. Il est parfaitement possible d'introduire l'écart-type sans mentionner (encore) la variance et de nombreux textes et cours le font précisément, tout comme vous pouvez parler du théorème de Pythagore sans avoir besoin d'utiliser des noms spéciaux pour les quantités au carré. Historiquement, le terme variance dans son sens statistique est postérieur à celui de l'écart-type, donc même cette forme de mots était impossible pendant quelques décennies.
Nick Cox
J'ai pris conscience de l'écart type survenu en tant qu'étiquette avant la variance tout en essayant de formuler une réponse au commentaire maintenant supprimé de Glen - à l'époque, je pensais que le fait que l'ancien terme était désormais communément défini en termes du nouveau terme renforcé le terme plus récent prétend être plus fondamental que les affaiblir.
Robert de Graaf
1
Toutes sortes d'explications peuvent être trouvées. Dans mon enseignement d'introduction au DD (aux géographes, qui ne sont pas tous forts en mathématiques), je n'utilise pas du tout le terme de variance . Je suis prompt à souligner que SD est une mesure d'échelle naturelle pour les distributions normales (gaussiennes), comme la distance entre la moyenne et l'inflexion sur la fonction de densité. Je soupçonne que c'est plus pour mon propre plaisir et plaisir que celui des étudiants.
Nick Cox
0

nXVuner[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,
StijnDeVuyst
la source
2
nn-1
Vuner[]Vuner[jeXje]=jeVuner[Xje]Xje
StijnDeVuyst
1
En effet, l'additivité des variances indépendantes est une propriété fondamentale, mais ce n'est pas votre argument.
Nick Cox
Ce qui est peut-être intéressant, c'est que, comme avec la moyenne, vous pouvez construire un estimateur de variance sans biais sans spécifier une distribution particulière (les estimations sans biais de l'écart-type sont spécifiques à la distribution.)
Scortchi - Reinstate Monica