Preuve facile de ?

10

Soit des variables aléatoires normales standard indépendantes. Il existe de nombreuses (longues) preuves, montrant queZ1,,Zn

i=1n(Zi1nj=1nZj)2χn12

De nombreuses preuves sont assez longues et certaines utilisent l'induction (par exemple l'inférence statistique de Casella). Je me demande s'il existe une preuve facile de ce résultat.

3x89g2
la source
Pour une approche géométrique intuitive (sans coordonnées), consultez la section 1.2 de l'excellent texte L'approche sans coordonnées des modèles linéaires de Michael J. Wichura (les détails techniques sont remplis dans le théorème 8.2), où l'auteur a en fait comparé le traditionnel preuve matricielle (fournie par la réponse de whuber) et son approche de projection, montrant que son approche géométrique est plus naturelle et moins obscure. Personnellement, je pense que cette preuve est perspicace et succincte.
Zhanxiong

Réponses:

10

Pour , définissezk=1,2,,n1

Xk=(Z1+Z2++ZkkZk+1)/k+k2.

Les , étant des transformations linéaires de variables aléatoires multinormalement distribuées , ont également une distribution multinormale. Notez queZ iXkZi

  1. La matrice de variance-covariance de est la matrice d'identité .n - 1 × n - 1(X1,X2,,Xn1)n1×n1

  2. X12+X22++Xn12=i=1n(ZiZ¯)2.

( 2 ) X k ˉ Z . 1 + 1 + + 1 - k = 0 k(1) , qui est facile à vérifier, implique directement en observant que tous les sont pas corrélés avec Les calculs se résument tous au fait que , où il y en a .(2)XkZ¯.1+1++1k=0k

Ensemble, ceux-ci montrent que a la distribution de la somme de variables d'unité de variance normale non corrélées. Par définition, il s'agit de la , QED . n - 1 χ 2 ( n - 1 )i=1n(ZiZ¯)2n1χ2(n1)

Références

  1. Pour une explication de l'origine de la construction de , voir le début de ma réponse à Comment effectuer une transformation isométrique de log-ratio concernant les matrices Helmert .Xk

  2. Ceci est une simplification de la démonstration générale donnée dans la réponse d'ocram à Pourquoi le RSS est-il distribué chi carré np . Cette réponse affirme "qu'il existe une matrice" pour construire le ; ici, je présente une telle matrice.Xk

whuber
la source
Cette construction a une interprétation géométrique simple. (1) Les variables sont réparties sur une distribution sphérique symétrique à n dimensions (nous pouvons donc la faire pivoter comme bon nous semble). (2) Le est trouvé comme une solution au problème linéaire , qui est en fait une projection du vecteur sur . (3) Si nous faisons pivoter l'espace de coordonnées de telle sorte que l'une des coordonnées coïncide avec ce vecteur de projection, , alors le reste est une distribution multinomiale (n-1) représentant l'espace résiduel. ¯ Z Z i = ¯ Z + ϵ i Z 1 1ZiZ¯Zi=Z¯+ϵiZ11
Sextus Empiricus
Vous montrez que les ne sont pas corrélés entre eux. Mais pour autant que je comprends, pour dire qu'une somme de variables normales standard au carré est , nous avons besoin d'indépendance, ce qui est une exigence beaucoup plus forte que non corrélée? EDIT: oh attendez, si nous savons que deux variables sont normalement distribuées, alors non corrélées implique l'indépendance. χ 2Xiχ2
user56834
De plus, je ne comprends pas comment vous passez du fait que les ne sont pas corrélés avec (que je comprends) à (2). Pourriez-vous élaborer? ˉ ZXiZ¯
user56834
@Programmer Désolé; Je ne voulais pas sous-entendre que c'est une déduction logique - (1) et (2) sont deux observations distinctes. (2) n'est qu'une identité algébrique (simple).
whuber
1
Programmeur, notez le lien vers l'autre réponse donnée par Whuber ( stats.stackexchange.com/questions/259208/… ) Les sont construits sur la base d'une matrice, , avec des lignes orthogonales. Vous pouvez donc évaluer de manière plus abstraite (moins faillible) comme , (notez que nous devons étendre K par le vecteur 1111 pour le faire n par n) H K 2 i K K =XkHKi2KK=(HZ)(HZ)=(HZ)T(HZ)=ZT(HTH)Z=ZTIZ=ZZ
Sextus Empiricus
5

Notez que vous dites que sont iid avec la normale normale , avec etN ( 0 , 1 ) μ = 0 σ = 1ZisN(0,1)μ=0σ=1

AlorsZi2χ(1)2

Alors

i=1nZi2=i=1n(ZiZ¯+Z¯)2=i=1n(ZiZ¯)2+nZ¯2(1)=i=1n(ZiZ¯)2+[n(Z¯0)1]2

Notez que le côté gauche de (1), et que le deuxième terme sur le côté droit [

i=1nZi2χ(n)2
[n(Z¯0)1]2χ(1)2.

De plus, sorte que et sont indépendants. Par conséquent, les deux derniers termes de (1) (fonctions de et ) sont également indépendants. Leurs mgfs sont donc liés au mgf du côté gauche de (1) à où et . Le mgf de est donc . Ainsi, est un chi carré avec degrés de liberté.Z i - ˉ Z ˉ Z Z i - ˉ Z Z i M n ( t ) = M n - 1 ( t ) M 1 ( t ) M n ( t ) = ( 1 - 2 t ) - n / 2Cov(ZiZ¯,Z¯)=0ZiZ¯Z¯ZiZ¯Zi

Mn(t)=Mn1(t)M1(t)
Mn(t)=(12t)n/2 Σ n i = 1 ( Z i - ˉ Z ) 2 M n - 1 ( t ) = M n ( t ) / M 1 ( t ) = ( 1 - deux t ) - ( n - 1 )M1(t)=(12t)1/2i=1n(ZiZ¯)2 n i = 1 (Zi- ˉ Z )2n-1Mn1(t)=Mn(t)/M1(t)=(12t)(n1)/2i=1n(ZiZ¯)2n1
Deep North
la source
1
Le dernier "donc" est trop imprudent
Zhanxiong
L'indépendant peut être vu à partir de la déviation standard en fonction deX¯
Deep North
2
"écart-type indépendant de "? Peut-être que vous vouliez dire que est indépendant de . Malheureusement, ce n'est pas vrai. Ce qui tient vraiment, c'est est indépendant de , qui est également une partie de la preuve que nous devons compléter (au lieu de l'utiliser lors de l'affichage de cette proposition). Z 2 i ˉ Z(Zi- ˉ Z )2 ˉ ZX¯Zi2Z¯(ZiZ¯)2Z¯
Zhanxiong
Je pense que j'ai utilisé le théorème de Cochran
Deep North
3
@DeepNorth Si des pièces manquantes sont remplies dans votre épreuve
Jarle Tufto