Soit un vecteur aléatoire. Les èmes moments de compte?

9

Je suis en train d'apprendre par moi-même sur la théorie des modèles linéaires, et une chose que je trouve surprenante est que bien que soit défini pour un vecteur aléatoire , il n'y a aucune mention d'autres moments en dehors de la matrice de covariance.E[Y]Y=[y1y2yn]

La recherche Google n'a pas beaucoup tourné. Les èmes moments (bruts) de compte, ou y a-t-il une idée différente que je ne connais pas?kY

J'apprends du texte Réponses planes aux questions complexes (la table des matières commence à la p. 17 du fichier lié). Par «considéré», ce que je veux dire, c'est qu'il existe une chose telle que , et si oui, comment définirait-on un tel concept? Le livre que j'ai ne couvre que le premier moment brut, et je trouve un peu étrange qu'il n'y ait aucune mention de la façon de définir compte tenu de mon expérience en univarié probabilité, et je n'ai pas l'expertise pour le définir.E[Yk]E[Yk]

De plus, si n'est pas défini, y a-t-il peut-être un concept connexe que je ne connais pas qui est utilisé à la place?E[Yk]

Clarinettiste
la source
Cette page montre la relation entre les moments bruts et centraux et décrit l'avantage des moments centraux.
EdM
@EdM je ne comprends pas; on dirait qu'il s'agit de moments univariés, que je connais très bien. Je me demande s'il y a une considération des -èmes moments bruts ( ) pour le cas multivarié (c'est-à-dire avec des vecteurs aléatoires), pas le cas univarié, et si oui, comment un tel concept serait défini. kk2
Clarinettiste
Mon sentiment est que les statistiques invariantes par rapport à la translation le long de l'axe d'une variable sont considérées comme les plus utiles, et donc les moments bruts ne seraient pas examinés aussi fréquemment que les moments centraux, qui ont cette propriété utile. Cette page de validation croisée comprend une discussion approfondie des moments d'ordre supérieur et des problèmes connexes.
EdM
Pourriez-vous amplifier ce que vous entendez par «théorie du modèle linéaire» et «considéré»? Dans certaines applications plus simples des modèles linéaires, des hypothèses sont faites uniquement sur les deux premiers moments de , mais dans d'autres - comme les modèles linéaires généralisés - des hypothèses sont faites qui ont des implications spécifiques pour la distribution entière de . YY
whuber

Réponses:

8

L'analogue approprié des moments univariés dans un paramètre multivarié est de visualiser également l'exposant comme un vecteur. La notation exponentielle avec des bases vectorielles et des exposants vectoriels est un raccourci pour le produit,k=(k1,k2,,kn)

yk=y1k1y2k2ynkn.

Pour un tel vecteur , le moment (brut) de la variable aléatoire est défini comme étantkkthY

μk=E(Yk).

Pour motiver une telle définition, considérons un moment univarié d'une fonction linéaire de :Y

E((λ1Y1++λnYn)m)=k(mk)λkμk

où la somme se produit sur tous les dont les composants sont des nombres entiers non négatifs sommant à et sont les coefficients multinomiaux. L'apparition des moments multivariés sur le côté droit montre pourquoi ce sont des généralisations naturelles et importantes des moments univariés.km(mk)=m!/(k1!k2!kn!)

Celles-ci apparaissent tout le temps. Par exemple, la covariance entre et n'est autre queYiYj

Cov(Yi,Yj)=E(YiYj)E(Yi)E(Yj)=μki+kjμkiμkj

où et sont les vecteurs indicateurs avec des zéros à tous les endroits sauf un et un à l'emplacement indiqué. (La même formule donne élégamment la variance de lorsque .)kikjYii=j

Il existe des généralisations naturelles de tous les concepts de moment univariés dans le cadre multivarié: une fonction de génération de moment, des cumulants, une fonction de génération de cumulant, des moments centraux, une fonction caractéristique et des relations algébriques et analytiques entre elles.

Référence

Alan Stuart et J. Keith Ord, Kendall's Advanced Theory of Statistics , cinquième édition. Oxford University Press, 1987: Volume I, Chapitre 3, Moments and Cumulants.

whuber
la source
3

En plus des points de @ whuber

1) Je ne sais pas ce qu'implique la théorie des modèles linéaires, mais rappelez-vous que dans les modèles linéaires, nous avons généralement affaire à des variables aléatoires normales qui ont 0 asymétrie et 0 kurtosis.

2) Plus généralement, la question est de la forme "Quelle est la précision?". Si je veux décrire des échantillons d'IID, je pourrais dire que je ne veux que la moyenne. Sinon, je pourrais dire que je veux la moyenne et les erreurs dans les moyens. Une alternative encore plus détaillée serait les moyens, les erreurs dans les moyens et les erreurs dans les moyens. À partir de ce modèle, vous pouvez voir comment les moments supérieurs continuent de monter. Il n'y a pas de vraie solution à ce problème, donc les gens s'arrêtent généralement au niveau 2 (c.-à-d. Moyenne et variance). Cela ne veut pas dire que les moments supérieurs sont inutiles. En fait, pour les problèmes impliquant des distributions à queue grasse, ces problèmes deviennent pertinents

Sid
la source