Valeur attendue de x dans une distribution normale, étant donné qu'elle est inférieure à une certaine valeur

Je me demande simplement s'il est possible de trouver la valeur attendue de x si elle est normalement distribuée, étant donné qu'elle est inférieure à une certaine valeur (par exemple, inférieure à la valeur moyenne).

normal-distribution conditional-probability expected-value Jasmin
la source

C'est bien sûr possible. Au minimum, vous pouvez calculer par force brute

F (t)^{- 1} \int_{- \infty}^{x} t f (t) d t

$F(t)^{-1} \int_{- \infty}^{x} t f(t) dt$ . Ou si vous connaissez

μ

$\mu$ et

σ

$\sigma$ vous pouvez l'estimer à l'aide d'une simulation.

dsaxton

@dsaxton Il y a quelques fautes de frappe dans cette formule, mais nous avons l'idée. Ce qui m'intéresse, c'est de savoir exactement comment vous exécuteriez la simulation lorsque le seuil est bien inférieur à la moyenne.

whuber

@whuber Oui,

F (t)

$F(t)$ devrait être

F (x)

$F(x)$ . Il ne serait pas très intelligent de faire une simulation lorsque

F (x)

$F(x)$ est proche de zéro, mais comme vous l'avez souligné, il existe de toute façon une formule exacte.

dsaxton

@dsaxton OK, assez bien. J'espérais seulement que vous aviez en tête une sorte d'idée intelligente et simple pour simuler à partir de la queue d'une distribution normale.

whuber

Plus ou moins la même question dans Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa

Jik

Réponses:

Une variable normalement distribuée avec moyenne et variance $X$ $\mu$ a la même distribution que où est une variable normale standard. Tout ce que vous devez savoir sur c'est que $\sigma^2$ $\sigma Z + \mu$ $Z$ $Z$

sa fonction de distribution cumulée est appelée $\Phi$ ,
il a une fonction de densité de probabilité , et que $\phi(z) = \Phi^\prime(z)$
. $\phi^\prime(z) = -z \phi(z)$

Les deux premières puces ne sont que de la notation et des définitions: la troisième est la seule propriété spéciale des distributions normales dont nous aurons besoin.

Que la « certaine valeur » soit . Anticipant le passage de à , définissez $T$ $X$ $Z$

t = (T - μ) / σ,

$t = (T-\mu)/\sigma,$

pour que

Pr (X \leq T) = Pr (Z \leq t) = Φ (t) .

$\Pr(X \le T) = \Pr(Z \le t) = \Phi(t).$

Ensuite, en commençant par la définition de l'espérance conditionnelle, nous pouvons exploiter sa linéarité pour obtenir

\begin{aligned} E (X | X \leq T) & = E (σ Z + μ | Z \leq t) = σ E (Z | Z \leq t) + μ E (1 | Z \leq t) \\ = (σ \int_{- \infty}^{t} z ϕ (z) ré z + μ \int_{- \infty}^{t} ϕ (z) ré z) / Pr (Z \leq t) \\ = (- σ \int_{- \infty}^{t} ϕ^{'} (z) ré z + μ \int_{- \infty}^{t} Φ^{'} (z) ré z) / Φ (t) . \end{aligned}

$\eqalign{ \mathbb{E}(X\,|\, X \le T) &= \mathbb{E}(\sigma Z + \mu \,|\, Z \le t) = \sigma \mathbb{E}(Z \,|\, Z \le t) + \mu \mathbb{E}(1 \,|\, Z \le t) \\ &= \left(\sigma \int_{-\infty}^t z \phi(z) dz + \mu \int_{-\infty}^t \phi(z) dz \right) / \Pr(Z \le t)\\ &=\left(-\sigma \int_{-\infty}^t \phi^\prime(z) dz + \mu \int_{-\infty}^t \Phi^\prime(z) dz\right) / \Phi(t). }$

Le théorème fondamental du calcul affirme que toute intégrale d'un dérivé est trouvée en évaluant la fonction aux points de terminaison: . Cela s'applique aux deux intégrales. Puisque et doivent disparaître à , nous obtenons $\int_a^b F^\prime(z) dz = F(b) - F(a)$ $\Phi$ $\phi$ $-\infty$

E (X | X \leq T) = μ - σ \frac{ϕ (t)}{Φ (t)} .

$\mathbb{E}(X\,|\, X \le T) = \mu - \sigma \frac{\phi\left(t\right)}{\Phi\left(t\right)}.$

Il s'agit de la moyenne d'origine moins un terme de correction proportionnel au rapport Invers Mills .

Comme on peut s'y attendre, le rapport de Mills inverse pour doit être positif et dépasser (dont le graphique est représenté par une ligne rouge en pointillés). Elle doit diminuer à mesure que grandit, car alors la troncature à (ou ) ne change presque rien. Comme devient très négatif, le rapport de Mills inverse doit approcher car les queues de la distribution normale diminuent si rapidement que presque toute la probabilité dans la queue gauche est concentrée près de son côté droit (en ). $t$ $-t$ $0$ $t$ $Z=t$ $X=T$ $t$ $-t$ $t$

Enfin, lorsque est à la moyenne, où le rapport de Mills inverse est égal à $T = \mu$ $t=0$ . Cela implique que la valeur attendue de, tronquée à sa moyenne (qui est le négatif d'unedistribution semi-normale), est $\sqrt{2/\pi} \approx 0.797885$ $X$ fois son écart type en dessous de la moyenne d'origine. $-\sqrt{2/\pi}$

whuber
la source

En général, laissez avoir la fonction de distribution . $X$ $F(X)$

On a, pour , $x\in[c_1,c_2]$ Vous pouvez obtenir des cas particuliers en prenant, par exemple, ce qui donne

\begin{array}{rcl} P (X \leq X | c_{1} \leq X \leq c_{2}) & = & \frac{P (X \leq X \cap c_{1} \leq X \leq c_{2})}{P (c_{1} \leq X \leq c_{2})} = \frac{P (c_{1} \leq X \leq X)}{P (c_{1} \leq X \leq c_{2})} \\ = & \frac{F (X) - F (c_{1})}{F (c_{2}) - F (c_{1})} \end{array}

$\begin{eqnarray*} P(X\leq x|c_1\leq X \leq c_2)&=&\frac{P(X\leq x\cap c_1\leq X \leq c_2)}{P(c_1\leq X \leq c_2)}=\frac{P(c_1\leq X \leq x)}{P(c_1\leq X \leq c_2)}\\&=&\frac{F(x)-F(c_1)}{F(c_2)-F(c_1)} \end{eqnarray*}$

c_{1} = - \infty

$c_1=-\infty$

F (c_{1}) = 0

$F(c_1)=0$ .

En utilisant des cdfs conditionnels, vous pouvez obtenir des densités conditionnelles (par exemple, pour $f(x|X<0)=2\phi(x)$ $X\sim N(0,1)$ ), qui peuvent être utilisées pour les attentes conditionnelles.

E (X | X < 0) = 2 \int_{- \infty}^{0} X ϕ (X) = - 2 ϕ (0),

$E(X|X<0)=2\int_{-\infty}^0x\phi(x)=-2\phi(0),$

Christoph Hanck
la source

+1 (en quelque sorte, j'ai raté cela lors de sa première apparition). La première partie est un excellent compte rendu sur la façon d'obtenir des fonctions de distribution tronquées et la seconde montre comment calculer leurs PDF.

whuber