Pourquoi la distribution d'échantillonnage de la variance est-elle une distribution chi carré?

22

La déclaration

La distribution d'échantillonnage de la variance de l'échantillon est une distribution khi carré avec un degré de liberté égal à , où est la taille de l'échantillon (étant donné que la variable aléatoire d'intérêt est normalement distribuée).nn-1n

La source

Mon intuition

Cela a un sens intuitif pour moi 1) parce qu'un test du chi carré ressemble à une somme de carrés et 2) parce qu'une distribution de chi carré n'est qu'une somme de distribution normale au carré. Mais encore, je ne le comprends pas bien.

Question

La déclaration est-elle vraie? Pourquoi?

Remi.b
la source
1
La déclaration initiale est fausse en général (elle est fausse pour deux raisons distinctes). Quelle est votre source (votre lien manque) et que dit-elle réellement?
Glen_b -Reinstate Monica
Ma question vient également de la réaction à une question-réponse dans une classe de statistiques d'introduction pour laquelle l'accès est protégé. La question est "Quelle est la distribution d'échantillonnage de la variance de la longueur des ailes chez les mouches?" et la réponse est "distribution Chi-carré"
Remi.b
1
La déclaration citée dans votre premier commentaire est toujours fausse en général. Le commentaire à la fin de la source est vrai (avec les hypothèses nécessaires): " lorsque des échantillons de taille n sont prélevés dans une distribution normale de variance , la distribution d'échantillonnage des ( n - 1 ) s 2 / σ 2 a une distribution chi carré avec n-1 degrés de liberté.σ2(n-1)s2/σ2 "... La réponse à la question dans votre deuxième commentaire sera également fausse - à moins, je suppose, que quelqu'un ait montré que la longueur des ailes est normalement distribuée. (Quelle base pourrait-il y avoir pour affirmer que c'est vrai?)
Glen_b -Reinstate Monica
Supposons donc que les ailes soient normalement distribuées, alors la distribution d'échantillonnage de serait distribuée en chi carré. Pourquoi en est-il ainsi? (n-1)s2/σ2
Remi.b
Savez-vous qu'une somme de carrés de iid N (0,1) variables aléatoires est khi carré avec k df? Ou est-ce la pièce dont vous cherchez la preuve? kk
Glen_b -Reinstate Monica

Réponses:

27

[Je suppose de la discussion dans votre question que vous êtes heureux d'accepter comme fait que si sont des variables aléatoires indépendantes identiquement distribuées N ( 0 , 1 ) alors k i = 1 Z 2 iχ 2 k .]Zje,je=1,2,,kN(0,1)je=1kZje2χk2

Formellement, le résultat dont vous avez besoin découle du théorème de Cochran . (Bien qu'il puisse être montré d'autres manières)

Moins formellement, considérons que si nous connaissions la moyenne de la population et estimions la variance à son sujet (plutôt qu'à propos de la moyenne de l'échantillon): , puiss 2 0 /σ2=1s02=1nje=1n(Xje-μ)2 , (Zi=(Xi-μ)/σ) qui sera1s02/σ2=1nje=1n(Xje-μσ)2=1nje=1nZje2Zje=(Xje-μ)/σ fois unevariable aléatoireχ 2 n .1nχn2

Le fait que la moyenne échantillon est utilisé, au lieu de la moyenne de la population ( ) fait la somme des carrés des écarts plus petits, mais seulement de telle façon que Σ n i = 1 ( Z i ) 2Zje=(Xje-X¯)/σ (dont, voir le théorème de Cochran). Par conséquent, plutôt que n s 2 0 / σ 2χ 2 n, nous avons maintenant ( n - 1 ) s 2 / σ 2χ 2 n - 1 .je=1n(Zje)2χn-12ns02/σ2χn2(n-1)s2/σ2χn-12

Glen_b -Reinstate Monica
la source
@Glen_b Pouvez-vous donner une référence pour d'autres preuves sur ce fait? Je veux vraiment le savoir.
Henry.L
Lequel de plusieurs faits êtes-vous après la preuve?
Glen_b -Reinstate Monica
@Glen_b Les deux seules méthodes en plus du théorème de Cochran-Madow pour prouver ce fait que la variance de l'échantillon et la moyenne de l'échantillon sont statistiquement indépendantes avec une distribution du chi carré sont: (1) Base canonique de Scheffe (Scheffe, 1959) (2) Méthodes cumulatives (Ou mgfs, ce qui lui est équivalent). Si vous connaissez plus de méthodes, je veux vraiment les connaître.
Henry.L
Un autre commentaire que je veux ajouter est que la moyenne de l'échantillon est utilisée, mais parfois nous voulons une puissance fixe indépendante de la variance fixe, cette méthode est remplacée par la méthode en deux étapes de Stein (1949).
Henry.L
X¯Xjes