Il y a donc écart-type, variance et covariance, mais y a-t-il un écart-type co?
Sinon pourquoi pas? Y a-t-il une raison mathématique fondamentale ou s'agit-il simplement d'une convention?
Si oui, pourquoi n'est-il pas utilisé davantage, ou du moins vraiment difficile à trouver en utilisant les recherches Google?
Je ne veux pas que ce soit une question désinvolte, j'essaie vraiment de remettre en question les statistiques plutôt que de simplement mémoriser un tas de formules.
variance
standard-deviation
covariance-matrix
canyon289
la source
la source
Réponses:
Une propriété utile de l'écart-type est qu'il a les mêmes unités que la moyenne, donc les amplitudes de et sont directement comparables. Je n'ai jamais vu personne calculer l'écart co-standard (par lequel je suppose que vous voulez dire la racine carrée de la covariance); si les unités de et sont notées et , alors les unités de la covariance sont et les unités de l'écart-type seraient , ce qui n'est pas particulièrement utile. En revanche, la corrélationσX X¯ X Y [X] [Y] [X][Y] [X][Y]−−−−−√ σXY/(σXσY) est sans unité et est une échelle très courante pour les associations déclarantes.
La variance (contrairement à l'écart-type) est utile car elle a généralement de plus belles propriétés mathématiques; en particulier
Pendant que vous réfléchissez aux moyens de mettre à l'échelle les variances, vous pouvez également considérer le coefficient de variation (qui est sans unité), ou le rapport variance sur la moyenne (qui a bizarre unités mais est significatif dans le contexte d'une distribution de comptage telle que le Poisson, qui est également sans unité).σX/X¯ σ2X/X¯
la source
La question semble aller de l'avant. En mathématiques, nous n'inventons pas de noms pour les quantités "simplement parce que nous le pouvons", mais parce que la quantité nommée est utile pour quelque chose.
La question du PO ne donne pas et ne justifie pas pourquoi il / elle pense qu'il existe une quantité utile qui pourrait être nommée "écart standard" et les réponses supposent des choses qui pourraient être utiles.
Pour généraliser le concept à la régression linéaire multi-variable avec variables, la "covariance" devient une matrice symétrique . Vous pouvez certainement faire une définition sensée de la "racine carrée d'une matrice symétrique" tant qu'elle est définie positive ou semi-définie, mais il est difficile de penser à une utilisation dans ce contexte - et ce n'est pas la même chose comme prenant la racine carrée de chaque terme de la matrice séparément!n n×n
Bien sûr, la racine carrée d'une matrice diagonale (par exemple la matrice de variance) n'est que la racine carrée des termes individuels, de sorte que le concept d '«écart-type» se généralise de manière évidente et utile - mais «déviation coStandard» ne le fait pas , OMI. Et en général, la "racine carrée d'une matrice" n'est même pas définie de manière unique, alors quelle racine carrée particulière voulez-vous choisir comme déviation coStandard?
la source
La covariance peut être à la fois positive et négative.
La racine carrée de la covariance pourrait donc être réelle ou imaginaire.
Vous pouvez comparer un nombre réel avec un nombre imaginaire pour la taille. Les unités de "co-écart type" ne seraient pas pratiques. Il n'y a aucun avantage à prendre la racine carrée.
la source