Explication intuitive de la contribution à la somme de deux variables aléatoires normalement distribuées

16

Si j'ai deux variables aléatoires indépendantes normalement distribuées et avec des moyennes \ mu_X et \ mu_Y et des écarts-types \ sigma_X et \ sigma_Y et je découvre que X + Y = c , alors (en supposant que je n'ai pas fait d'erreur) la distribution conditionnelle de X et Y donnés c sont également normalement distribués avec des moyens \ mu_ {X | c} = \ mu_X + (c - \ mu_X - \ mu_Y) \ frac {\ sigma_X ^ 2} {\ sigma_X ^ 2 + \ sigma_Y ^ 2 } \ mu_ {Y | c} = \ mu_Y + (c - \ mu_X - \ mu_Y) \ frac {\ sigma_Y ^ 2} {\ sigma_X ^ 2 + \ sigma_Y ^ 2} et l'écart type Y μ X μ Y σ X σ Y X + Y = c X Y c μ X | c = μ X + ( c - μ X - μ Y ) σ 2 XXYμXμYσXσYX+Y=cXYc μY| c=μY+(c-μX-μY)σ 2 Y

μX|c=μX+(cμXμY)σX2σX2+σY2
σX| c=σY| c=
μY|c=μY+(cμXμY)σY2σX2+σY2
σX|c=σY|c=σX2σY2σX2+σY2.

Il n'est pas surprenant que les écarts-types conditionnels soient les mêmes que, étant donné c , si l'un monte, l'autre doit descendre du même montant. Il est intéressant de noter que l'écart type conditionnel ne dépend pas de c .

Ce que je ne peux pas comprendre, ce sont les moyens conditionnels, où ils prennent une part de l'excès (cμXμY) proportionnelle aux variances d'origine, pas aux écarts-types d'origine.

Par exemple, s'ils ont des moyennes nulles, μX=μY=0 , et des écarts-types σX=3 et σY=1 alors conditionnés sur c=4 nous aurions E[X|c=4]=3.6 et E[Y|c=4]=0.4 , c'est-à-dire dans le rapport 9:1 même si j'aurais pensé intuitivement que le rapport 3:1 serait plus naturel. Quelqu'un peut-il donner une explication intuitive à cela?

Cela a été provoqué par une question Math.SE

Henri
la source

Réponses:

16

La question se réduit facilement au cas en examinant et .μX=μY=0XμXYμY

De toute évidence, les distributions conditionnelles sont normales. Ainsi, la moyenne, la médiane et le mode de chacun coïncident. Les modes se produiront aux coordonnées d'un maximum local du PDF bivarié de et contraint à la courbe . Cela implique le contour du PDF bivarié à cet emplacement et la courbe de contrainte a des tangentes parallèles. (C'est la théorie des multiplicateurs de Lagrange.) Parce que l'équation de tout contour est de la forme pour une constante (c'est-à-dire que tous les contours sont des ellipses), leurs gradients doivent être parallèles, d'où il existe telle sorte queXYg(x,y)=x+y=cf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2,yσY2)=f(x,y)=λg(x,y)=λ(1,1).

entrez la description de l'image ici

Il s'ensuit immédiatement que les modes des distributions conditionnelles (et donc aussi les moyennes) sont déterminés par le rapport des variances, pas des SD.

Cette analyse fonctionne également pour et corrélés et s'applique à toutes les contraintes linéaires, pas seulement à la somme.XY

whuber
la source
C'est très impressionnant et plutôt plus complet que je ne l'avais demandé. J'aurais été satisfait du diagramme et d'une déclaration selon laquelle la tangente à l'ellipse ne passe pas par le centre de l'ellipse, donc le point rouge tangent doit prendre disproportionnellement plus de la variable aléatoire avec un écart-type plus élevé.
Henry
1
Ce n'était pas bien formulé. Ce que je voulais dire, c'est que la ligne allant du centre au point rouge n'est pas perpendiculaire à la tangente.
Henry