La déviation CoStandard est-elle une chose?

8

Il y a donc écart-type, variance et covariance, mais y a-t-il un écart-type co?

Sinon pourquoi pas? Y a-t-il une raison mathématique fondamentale ou s'agit-il simplement d'une convention?

Si oui, pourquoi n'est-il pas utilisé davantage, ou du moins vraiment difficile à trouver en utilisant les recherches Google?

Je ne veux pas que ce soit une question désinvolte, j'essaie vraiment de remettre en question les statistiques plutôt que de simplement mémoriser un tas de formules.

canyon289
la source
1
Pourriez-vous préciser ce que, selon vous, un "écart-type" représenterait? Y a-t-il une motivation sous-jacente, ou demandez-vous simplement (dans un méta-sens) s'il pourrait y avoir une signification universelle à l'ajout de "co" au nom d'une statistique?
whuber
1
Je suppose que l'OP se généralise à partir de la variance: covariance :: écart-type: "écart-type", mais cela ne nuirait pas à la question d'être plus explicite (en supposant qu'ils signifient vraiment ). σXY
Ben Bolker

Réponses:

12

Une propriété utile de l'écart-type est qu'il a les mêmes unités que la moyenne, donc les amplitudes de et sont directement comparables. Je n'ai jamais vu personne calculer l'écart co-standard (par lequel je suppose que vous voulez dire la racine carrée de la covariance); si les unités de et sont notées et , alors les unités de la covariance sont et les unités de l'écart-type seraient , ce qui n'est pas particulièrement utile. En revanche, la corrélationσXX¯XY[X][Y][X][Y][X][Y] σXY/(σXσY) est sans unité et est une échelle très courante pour les associations déclarantes.

La variance (contrairement à l'écart-type) est utile car elle a généralement de plus belles propriétés mathématiques; en particulier

σX+Y2=σX2+σY2+2σXY,
ce qui simplifie bien lorsque et sont indépendants (d'où ).XYσXY=0

Pendant que vous réfléchissez aux moyens de mettre à l'échelle les variances, vous pouvez également considérer le coefficient de variation (qui est sans unité), ou le rapport variance sur la moyenne (qui a bizarre unités mais est significatif dans le contexte d'une distribution de comptage telle que le Poisson, qui est également sans unité).σX/X¯σX2/X¯

Ben Bolker
la source
3
De bons points, mais cela ne semble pas expliquer pourquoi prendre racine carrée de covariance n'a pas de sens.
Tim
3
Voici une façon d'exploiter votre formule: utilisez-la pour observer que la covariance peut être définie commeAlors pourquoi ne pas simplement définir un "co-SD" - appelons-le , disons - commeCela fait allusion à la difficulté de répondre à la question initiale sans savoir ce que le «co» de quoi que ce soit pourrait signifier: vous ne pouvez pas démontrer grand-chose simplement en montrant qu'une généralisation particulière est absurde ou inutile; vous devez considérer toutes les manières possibles de généraliser un concept!
σXY=(σX+Y2σX2σY2)/2.
τ
τXY=(σX+YσXσY)/2?
whuber
5

La question semble aller de l'avant. En mathématiques, nous n'inventons pas de noms pour les quantités "simplement parce que nous le pouvons", mais parce que la quantité nommée est utile pour quelque chose.

La question du PO ne donne pas et ne justifie pas pourquoi il / elle pense qu'il existe une quantité utile qui pourrait être nommée "écart standard" et les réponses supposent des choses qui pourraient être utiles.

Pour généraliser le concept à la régression linéaire multi-variable avec variables, la "covariance" devient une matrice symétrique . Vous pouvez certainement faire une définition sensée de la "racine carrée d'une matrice symétrique" tant qu'elle est définie positive ou semi-définie, mais il est difficile de penser à une utilisation dans ce contexte - et ce n'est pas la même chose comme prenant la racine carrée de chaque terme de la matrice séparément!nn×n

Bien sûr, la racine carrée d'une matrice diagonale (par exemple la matrice de variance) n'est que la racine carrée des termes individuels, de sorte que le concept d '«écart-type» se généralise de manière évidente et utile - mais «déviation coStandard» ne le fait pas , OMI. Et en général, la "racine carrée d'une matrice" n'est même pas définie de manière unique, alors quelle racine carrée particulière voulez-vous choisir comme déviation coStandard?

alephzero
la source
4

La covariance peut être à la fois positive et négative.

La racine carrée de la covariance pourrait donc être réelle ou imaginaire.

Vous pouvez comparer un nombre réel avec un nombre imaginaire pour la taille. Les unités de "co-écart type" ne seraient pas pratiques. Il n'y a aucun avantage à prendre la racine carrée.

James K
la source
et voir la réponse de Ben.
James K