Réponse rapide

La raison en est que, en supposant que les données sont iid et , et en définissant $X_i\sim N(\mu,\sigma^2)$ lors de la formation des intervalles de confiance, la distribution d'échantillonnage associée à la variance de l'échantillon (, rappelez-vous, une variable aléatoire!) Est une distribution du chi carré (), tout comme la distribution d'échantillonnage associée à la moyenne de l'échantillon est une distribution normale standard (

\begin{array}{rcl} \bar{X} & = & \sum^{N} \frac{X_{i}}{N} \\ S^{2} & = & \sum^{N} \frac{(\bar{X} - X_{i})^{2}}{N - 1} \end{array}

$\begin{eqnarray*} \bar{X}&=&\sum^N \frac{X_i}{N}\\ S^2 &=& \sum^{N} \frac{(\bar{X}-X_i)^2}{N-1} \end{eqnarray*}$

S^{2}

$S^2$

S^{2} (N - 1) / σ^{2} \sim χ_{n - 1}^{2}

$S^2(N-1)/\sigma^2 \sim \chi^2_{n-1}$

) quand vous connaissez la variance, et avec un t-étudiant quand vous ne le savez pas (

(\bar{X} - μ) \sqrt{n} / σ \sim Z (0, 1)

$(\bar{X}-\mu)\sqrt{n}/\sigma \sim Z(0,1)$

(\bar{X} - μ) \sqrt{n} / S \sim T_{n - 1}

$(\bar{X}-\mu)\sqrt{n}/S \sim T_{n-1}$ ).

Longue réponse

Tout d'abord, nous allons prouver que suit une distribution khi carré avec $S^2(N-1)/\sigma^2$ $N-1$ degrés de liberté. Après cela, nous verrons comment cette preuve est utile lors de la dérivation des intervalles de confiance pour la variance, et comment la distribution du chi carré apparaît (et pourquoi elle est si utile!). Commençons.

La preuve

Pour cela, vous devez peut-être vous habituer à la distribution du chi carré dans cet article Wikipedia . Cette distribution n'a qu'un seul paramètre: les degrés de liberté, , et se trouve avoir une fonction de génération de moment (MGF) donnée par: $\nu$ Si nous pouvons montrer que la distribution de a une fonction de génération de moment comme celle-ci, mais avec

m_{χ_{ν}^{2}} (t) = (1 - 2 t)^{- ν / 2} .

$\begin{equation*} m_{\chi^2_\nu}(t)=(1-2t)^{-\nu/2}. \end{equation*}$

S^{2} (N - 1) / σ^{2}

$S^2(N-1)/\sigma^2$

, nous avons alors montré que

suit une distribution khi carré avec

degrés de liberté. Pour le montrer, notez deux faits:

ν = N - 1

$\nu=N-1$

S^{2} (N - 1) / σ^{2}

$S^2(N-1)/\sigma^2$

N - 1

$N-1$

Si nous définissons, où
$Y = \sum \frac{(X_{i} - \bar{X})^{2}}{σ^{2}} = \sum Z_{i}^{2},$ $\begin{equation*} Y = \sum \frac{(X_i-\bar{X})^2}{\sigma^2} = \sum Z_i^2, \end{equation*}$ , c'est-à-dire les variables aléatoires normales standard, la fonction de génération de moment de est donnée par $Z_i\sim N(0,1)$ $Y$ La MGF deest donnée par $\begin{array}{rcl} m_{Y} (t) & = & E [e^{t Y}] \\ = & E [e^{t Z_{1}^{2}}] \times E [e^{t Z_{2}^{2}}] \times . . . E [e^{t Z_{N}^{2}}] \\ = & m_{Z_{i}^{2}} (t) \times m_{Z_{2}^{2}} (t) \times . . . m_{Z_{N}^{2}} (t) . \end{array}$ $\begin{eqnarray*} m_Y(t) &=& \mathbb{E}[e^{tY}]\\ &=&\mathbb{E}[e^{tZ_1^2}]\times \mathbb{E}[e^{tZ_2^2}]\times ...\mathbb{E}[e^{tZ_N^2}]\\ &=&m_{Z_i^2}(t)\times m_{Z_2^2}(t)\times ...m_{Z_N^2}(t). \end{eqnarray*}$ $Z^2$ $\begin{array}{rcl} m_{Z^{2}} (t) & = & \int_{- \infty}^{\infty} f (z) \exp (t z^{2}) d z \\ = & (1 - 2 t)^{- 1 / 2}, \end{array}$ $\begin{eqnarray*} m_{Z^2}(t) &=& \int_{-\infty}^{\infty} f(z)\exp(tz^2)dz\\ &=&(1-2t)^{-1/2}, \end{eqnarray*}$ où j'ai utilisé le PDF de la norme normale, et, par conséquent, $f(z)=e^{-z^2/2}/\sqrt{2\pi}$ ce quiimplique que suit une distribution chi carré avec degrés de liberté. $m_{Y} (t) = (1 - 2 t)^{- N / 2},$ $\begin{equation*} m_Y(t)=(1-2t)^{-N/2}, \end{equation*}$ $Y$ $N$
Si et sont indépendants et se répartissent chacun sous la forme d'une distribution chi carré mais avec et degrés de liberté, alors $Y_1$ $Y_2$ $\nu_1$ $\nu_2$ $W=Y_1+Y_2$ $\nu_1+\nu_2$ $W$

$N-1$

(N - 1) S^{2} = - n (\bar{X} - μ) + \sum (X_{i} - μ)^{2},

$\begin{equation*} (N-1)S^2 = -n(\bar{X}-\mu)+\sum(X_i-\mu)^2, \end{equation*}$

σ^{2}

$\sigma^2$

\frac{(N - 1) S^{2}}{σ^{2}} + \frac{(\bar{X} - μ)^{2}}{σ^{2} / N} = \sum \frac{(X_{je} - μ)^{2}}{σ^{2}} .

$\begin{equation*} \frac{(N-1)S^2}{\sigma^2}+\frac{(\bar{X}-\mu)^2}{\sigma^2/N}=\sum \frac{(X_i-\mu)^2}{\sigma^2}. \end{equation*}$

N

$N$ $S^2(N-1)/\sigma^2$ $N-1$

Calcul de l'intervalle de confiance pour la variance.

$L_1$ $L_2$

P (L_{1} \leq σ^{2} \leq L_{2}) = 1 - α .

$\begin{equation*} \mathbb{P}\left(L_1\leq \sigma^2 \leq L_2\right) = 1-\alpha. \end{equation*}$

S^{2} (N - 1)

$S^2(N-1)$

\frac{L_{1}}{S^{2} (N - 1)} \leq \frac{σ^{2}}{S^{2} (N - 1)} \leq \frac{L_{2}}{S^{2} (N - 1)} .

$\begin{equation*} \frac{L_1}{S^2(N-1)}\leq \frac{\sigma^2}{S^2(N-1)} \leq \frac{L_2}{S^2(N-1)}. \end{equation*}$

S^{2} (N - 1) / σ^{2}

$S^2(N-1)/\sigma^2$

N - 1

$N-1$

\begin{array}{rcl} \frac{L_{1}}{S^{2} (N - 1)} \leq \frac{σ^{2}}{S^{2} (N - 1)} & \Rightarrow & \frac{S^{2} (N - 1)}{σ^{2}} \leq \frac{S^{2} (N - 1)}{L_{1}}, \\ \frac{σ^{2}}{S^{2} (N - 1)} \leq \frac{L_{2}}{S^{2} (N - 1)} & \Rightarrow & \frac{S^{2} (N - 1)}{L_{2}} \leq \frac{S^{2} (N - 1)}{σ^{2}}, \end{array}

$\begin{eqnarray*} \frac{L_1}{S^2(N-1)}\leq \frac{\sigma^2}{S^2(N-1)} &\Rightarrow& \frac{S^2(N-1)}{\sigma^2}\leq \frac{S^2(N-1)}{L_1},\\ \frac{\sigma^2}{S^2(N-1)} \leq \frac{L_2}{S^2(N-1)} &\Rightarrow& \frac{S^2(N-1)}{L_2} \leq \frac{S^2(N-1)}{\sigma^2},\\ \end{eqnarray*}$

P (\frac{S^{2} (N - 1)}{L_{2}} \leq \frac{S^{2} (N - 1)}{σ^{2}} \leq \frac{S^{2} (N - 1)}{L_{1}}) = 1 - α .

$\begin{equation*} \mathbb{P}\left(\frac{S^2(N-1)}{L_2} \leq \frac{S^2(N-1)}{\sigma^2}\leq \frac{S^2(N-1)}{L_1}\right) = 1-\alpha. \end{equation*}$

S^{2} (N - 1) / σ^{2} \sim χ^{2} (N - 1)

$S^2(N-1)/\sigma^2 \sim \chi^2(N-1)$

\begin{array}{rcl} \int_{\frac{S^{2} (N - 1)}{L_{2}}}^{N - 1} p_{χ^{2}} (x) d x & = & (1 - α) / 2, \\ \int_{N - 1}^{\frac{S^{2} (N - 1)}{L_{1}}} p_{χ^{2}} (x) d x & = & (1 - α) / 2 \end{array}

$\begin{eqnarray*} \int_{\frac{S^2(N-1)}{L_2}}^{N-1}p_{\chi^2}(x)dx &=& (1-\alpha)/2\ \ \ ,\\ \int_{N-1}^{\frac{S^2(N-1)}{L_1}}p_{\chi^2}(x)dx &=& (1-\alpha)/2\ \ \, \end{eqnarray*}$ (we integrate up to

N - 1

$N-1$ because the expected value of a chi-squared random variable with

N - 1

$N-1$ degrees of freedom is

N - 1

$N-1$ ) or, equivalently,

\begin{array}{rcl} \int_{0}^{\frac{S^{2} (N - 1)}{L_{2}}} p_{χ^{2}} (x) d x = α / 2, \\ \int_{\frac{S^{2} (N - 1)}{L_{1}}}^{\infty} p_{χ^{2}} (x) d x = α / 2. \end{array}

$\begin{eqnarray*} \int_{0}^{\frac{S^2(N-1)}{L_2}}p_{\chi^2}(x)dx=\alpha/2,\\ \int_{\frac{S^2(N-1)}{L_1}}^{\infty}p_{\chi^2}(x)dx=\alpha/2. \end{eqnarray*}$ Calling

χ_{α / 2}^{2} = \frac{S^{2} (N - 1)}{L_{2}}

$\chi^2_{\alpha/2}=\frac{S^2(N-1)}{L_2}$ and

χ_{1 - α / 2}^{2} = \frac{S^{2} (N - 1)}{L_{1}}

$\chi^2_{1-\alpha/2}= \frac{S^2(N-1)}{L_1}$ , where the values

χ_{α / 2}^{2}

$\chi^2_{\alpha/2}$ and

χ_{1 - α / 2}^{2}

$\chi^2_{1-\alpha/2}$ can be found in chi-square tables (in computers mainly!) and solving for

L_{1}

$L_1$ and

L_{2}

$L_2$ ,

\begin{array}{rcl} L_{1} & = & \frac{S^{2} (N - 1)}{χ_{1 - α / 2}^{2}}, \\ L_{2} & = & \frac{S^{2} (N - 1)}{χ_{α / 2}^{2}} . \end{array}

$\begin{eqnarray*} L_1 &=& \frac{S^2(N-1)}{\chi^2_{1-\alpha/2}},\\ L_2 &=& \frac{S^2(N-1)}{\chi^2_{\alpha/2}}. \end{eqnarray*}$ Hence, your confidence interval for the variance is

C . I . = (\frac{S^{2} (N - 1)}{χ_{1 - α / 2}^{2}}, \frac{S^{2} (N - 1)}{χ_{α / 2}^{2}}) .

$\begin{equation*} C.I.=\left(\frac{S^2(N-1)}{\chi^2_{1-\alpha/2}}, \frac{S^2(N-1)}{\chi^2_{\alpha/2}}\right). \end{equation*}$

Néstor
la source

Simply because

S^{2}

$S^2$ does not follow a centered chi-square distribution, while

S^{2} (N - 1) / σ^{2}

$S^2(N-1)/\sigma^2$ does and, therefore, its easier to work with. Are you asking for a derivation for that? (i.e., you want someone to show you that

S^{2} (N - 1) / σ^{2}

$S^2(N-1)/\sigma^2$ follows a chi-square distribution with

N - 1

$N-1$ degrees of freedom?)

Néstor

Il serait utile de modifier cette réponse pour inclure l' hypothèse très forte mais non affirmée que la variance de l'échantillon suit une distribution khi-deux lorsque les données sous-jacentes sont indépendantes et suivent une distribution normale . Contrairement à la théorie de la distribution de la moyenne de l'échantillon, où en pratique sa distribution d'échantillonnage sera approximativement de précision Normale à raisonnable dans de nombreuses situations, ce même comportement asymptotique a tendance à ne pas se produire avec la variance de l'échantillon (jusqu'à ce que la taille des échantillons devienne extrêmement grande).

whuber

Oops. So, so true! This actually came from a problem solution that I handed out to some students, where I state on the question all these assumptions. I edited the answer now.

Néstor

@user34756 The reason we don't use the distribution of

S^{2}

$S^2$ directly is that its distribution depends on the value of a parameter. You may find it useful to investigate the use of pivotal quantities in constructing confidence intervals.

Glen_b -Reinstate Monica

Isn't

f (z) = e^{- z^{2} / 2}

$f(z) = e^{-z^2/2}$ instead of

f (z) = e^{- z^{2}}

$f(z) = e^{-z^2}$ ?

Benoît Legat

Pourquoi le chi carré est-il utilisé lors de la création d'un intervalle de confiance pour la variance?

Réponses:

Réponse rapide

Longue réponse

La preuve

Calcul de l'intervalle de confiance pour la variance.