C'est une question très fondamentale. Pourquoi utilisons-nous une distribution chi carré? Quelle est la signification de cette distribution? Pourquoi cette distribution est-elle utilisée pour créer un intervalle de confiance pour la variance?
Chaque endroit où je cherche une explication sur google présente ce fait, expliquant quand utiliser le chi, mais sans expliquer pourquoi utilise et pourquoi il ressemble à ça.
Un grand merci à tous ceux qui peuvent m'orienter dans la bonne direction et c'est vraiment comprendre pourquoi j'utilise le chi lorsque je crée un intervalle de confiance pour la variance.
variance
chi-squared
nafrtiti
la source
la source
Réponses:
Réponse rapide
La raison en est que, en supposant que les données sont iid et , et en définissant ˉ XXi∼N(μ,σ2)
lors de la formation des intervalles de confiance, la distribution d'échantillonnage associée à la variance de l'échantillon (S2, rappelez-vous, une variable aléatoire!) Est une distribution du chi carré (S2(N-1)/σ2∼χ2n-1), tout comme la distribution d'échantillonnage associée à la moyenne de l'échantillon est une distribution normale standard ((ˉX-μ)√
Longue réponse
Tout d'abord, nous allons prouver que suit une distribution khi carré avec N - 1S2(N−1)/σ2 N−1 degrés de liberté. Après cela, nous verrons comment cette preuve est utile lors de la dérivation des intervalles de confiance pour la variance, et comment la distribution du chi carré apparaît (et pourquoi elle est si utile!). Commençons.
La preuve
Pour cela, vous devez peut-être vous habituer à la distribution du chi carré dans cet article Wikipedia . Cette distribution n'a qu'un seul paramètre: les degrés de liberté, , et se trouve avoir une fonction de génération de moment (MGF) donnée par: m χ 2 ν ( t ) = ( 1 - 2 t ) - 1ν
Si nous pouvons montrer que la distribution de S 2 (N-1) / σ 2 a une fonction de génération de moment comme celle-ci, mais avecν
Si nous définissons, oùZ
Si et Y 2 sont indépendants et se répartissent chacun sous la forme d'une distribution chi carré mais avec ν 1 et ν 2 degrés de liberté, alors W = YY1 Y2 ν1 ν2 W=Y1+Y2 ν1+ ν2 W
Calcul de l'intervalle de confiance pour la variance.
la source