Valeur attendue de x dans une distribution normale, étant donné qu'elle est inférieure à une certaine valeur

12

Je me demande simplement s'il est possible de trouver la valeur attendue de x si elle est normalement distribuée, étant donné qu'elle est inférieure à une certaine valeur (par exemple, inférieure à la valeur moyenne).

Jasmin
la source
C'est bien sûr possible. Au minimum, vous pouvez calculer par force brute F(t)-1-XtF(t)t . Ou si vous connaissez μ et σ vous pouvez l'estimer à l'aide d'une simulation.
dsaxton
@dsaxton Il y a quelques fautes de frappe dans cette formule, mais nous avons l'idée. Ce qui m'intéresse, c'est de savoir exactement comment vous exécuteriez la simulation lorsque le seuil est bien inférieur à la moyenne.
whuber
1
@whuber Oui, F(t) devrait être F(X) . Il ne serait pas très intelligent de faire une simulation lorsque F(X) est proche de zéro, mais comme vous l'avez souligné, il existe de toute façon une formule exacte.
dsaxton
@dsaxton OK, assez bien. J'espérais seulement que vous aviez en tête une sorte d'idée intelligente et simple pour simuler à partir de la queue d'une distribution normale.
whuber
Plus ou moins la même question dans Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
Jik

Réponses:

18

Une variable normalement distribuée avec μ moyenne et varianceXμ a la même distribution que σ Z + μ Z est une variable normale standard. Tout ce que vous devez savoir sur Z, c'est queσ2σZ+μZZ

  • sa fonction de distribution cumulée est appelée Φ ,
  • il a une fonction de densité de probabilité , et queϕ(z)=Φ(z)
  • .ϕ(z)=-zϕ(z)

Les deux premières puces ne sont que de la notation et des définitions: la troisième est la seule propriété spéciale des distributions normales dont nous aurons besoin.

Que la « certaine valeur » soit . Anticipant le passage de X à Z , définissezTXZ

t=(T-μ)/σ,

pour que

Pr(XT)=Pr(Zt)=Φ(t).

Ensuite, en commençant par la définition de l'espérance conditionnelle, nous pouvons exploiter sa linéarité pour obtenir

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σ-tzϕ(z)z+μ-tϕ(z)z)/Pr(Zt)=(-σ-tϕ(z)z+μ-tΦ(z)z)/Φ(t).

Le théorème fondamental du calcul affirme que toute intégrale d'un dérivé est trouvée en évaluant la fonction aux points de terminaison: . Cela s'applique aux deux intégrales. Puisque Φ et ϕ doivent disparaître à - , nous obtenonsunebF(z)z=F(b)-F(une)Φϕ-

E(X|XT)=μ-σϕ(t)Φ(t).

Il s'agit de la moyenne d'origine moins un terme de correction proportionnel au rapport Invers Mills .

! [figure: tracé du rapport de Mills inverse

Comme on peut s'y attendre, le rapport de Mills inverse pour doit être positif et dépasser - t (dont le graphique est représenté par une ligne rouge en pointillés). Elle doit diminuer à 0 à mesure que t grandit, car alors la troncature à Z = t (ou X = T ) ne change presque rien. Comme t devient très négatif, le rapport de Mills inverse doit approcher - t car les queues de la distribution normale diminuent si rapidement que presque toute la probabilité dans la queue gauche est concentrée près de son côté droit (en t ).t-t0tZ=tX=Tt-tt

Enfin, lorsque est à la moyenne, t = 0 où le rapport de Mills inverse est égal à T=μt=0. Cela implique que la valeur attendue deX, tronquée à sa moyenne (qui est le négatif d'unedistribution semi-normale), est-2/π0,797885X fois son écart type en dessous de la moyenne d'origine.-2/π

whuber
la source
6

En général, laissez avoir la fonction de distribution F ( X ) .XF(X)

On a, pour , P ( X x | c 1X c 2X[c1,c2] Vous pouvez obtenir des cas particuliers en prenant, par exemplec1=-, ce qui donneF(c1)=0

P(XX|c1Xc2)=P(XXc1Xc2)P(c1Xc2)=P(c1XX)P(c1Xc2)=F(X)-F(c1)F(c2)-F(c1)
c1=-F(c1)=0 .

En utilisant des cdfs conditionnels, vous pouvez obtenir des densités conditionnelles (par exemple, pour X N ( 0 , 1 )F(X|X<0)=2ϕ(X)XN(0,1) ), qui peuvent être utilisées pour les attentes conditionnelles.

E(X|X<0)=2-0Xϕ(X)=-2ϕ(0),
Christoph Hanck
la source
+1 (en quelque sorte, j'ai raté cela lors de sa première apparition). La première partie est un excellent compte rendu sur la façon d'obtenir des fonctions de distribution tronquées et la seconde montre comment calculer leurs PDF.
whuber