Quelle est la probabilité que

10

Supposons que X et Y soient normaux bivariés avec la moyenne μ=(μ1,μ2) et la covariance Σ=[σ11σ12σ12σ22] . Quelle est la probabilité Pr(X<Y|min(X,Y)) ?

Mike
la source
@whuber, merci, j'ai supprimé mes pensées car elles n'ajoutent rien ici.
AdamO
1
Pr(m<Y|X=m)Pr(m<Y|X=m)+Pr(m<X|Y=m)
Sextus Empiricus
lien utile stats.stackexchange.com/questions/30588/… S'agit-il d'une question d'autoformation?
Sextus Empiricus
Vous devriez partager vos réflexions sur le problème, indépendamment du fait que cela ressemble à une question d'auto-étude.
StubbornAtom

Réponses:

7

En utilisant la notation légèrement plus explicite , où est un nombre réel, pas une variable aléatoire. L'ensemble sur lequel est un chemin en forme de L avec deux segments semi-ouverts: l'un allant directement du point et l'autre allant directement vers la droite de ce même point. Il est clair que sur la jambe verticale, et sur la jambe horizontale .P(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y

mu1 = 0, mu2 = 2, sigma11 = 0,5, sigma22 = 1, sigma12 = 0,2, m = 1

Compte tenu de cette intuition géométrique, il est facile de réécrire le problème sous une forme équivalente, où au numérateur nous n'avons que la jambe verticale où et au dénominateur nous avons la somme des deux jambes.x<y

(1)P(X<Y|min(X,Y))=P(m<Y|X=m)P(m<Y|X=m)+P(m<X|Y=m)

Il nous faut donc maintenant calculer deux expressions de la forme . De telles probabilités conditionnelles de la distribution normale bivariée ont toujours une distribution normale avec des paramètres:P(m<X|Y=m)N(μX|Y=m,sX|Y=m2)

(2)μX|Y=m=μ1+σ12σ22(mμ2)

(3)sX|Y=m2=σ11σ122σ22

Notez que dans la définition originale du problème, faisait référence à des éléments de la matrice de covariance, contrairement à la convention la plus courante d'utilisation de pour l'écart type. Ci-dessous, nous trouverons plus pratique d'utiliser pour la variance et pour l'écart-type de la distribution de probabilité conditionnelle.σijσs2s

Connaissant ces deux paramètres, nous pouvons calculer la probabilité que partir de la fonction de distribution cumulative.m<X

(4)P(m<X|Y=m)=Φ(μX;Y=mmsX;Y=m)

mutatis mutandis , nous avons une expression similaire pour . LaisserP(Y>m|X=m)

(5)zX|Y=m=μX;Y=mmsX;Y=m

et

(6)zY|X=m=μY;X=mmsY;X=m

Ensuite, nous pouvons écrire la solution complète de manière compacte en termes de ces deux scores :z

(7)P(X<Y|min(X,Y)=m)=1Φ(zX|Y=m)Φ(zX|Y=m)+Φ(zY|X=m)

Sur la base du code de simulation fourni par l'auteur de la question, nous pouvons comparer ce résultat théorique aux résultats simulés:

entrez la description de l'image ici

olooney
la source
Dans (3), je pense que le côté gauche devrait avoir un carré, car c'est la variance conditionnelle alors que l'écart-type est utilisé plus tard.
Yves
Vous avez tout à fait raison @Yves, et je pense que mes modifications récentes ont résolu le problème. Je vous remercie.
olooney
@olooney, merci pour cette réponse. Je peux suivre la dérivation et cela semble correct. Cependant, j'ai essayé de vérifier (1) et (7) dans une simulation et les résultats étaient assez différents. Vous pouvez voir mon code R ici gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
mike
@mike, je pense que j'ai eu une erreur de signe. Après avoir corrigé cela, le résultat théorique semble être en accord avec les résultats de la simulation. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739
olooney
@olooney, bonne prise. Je n'arrive toujours pas à comprendre pourquoi les deux estimations basées sur la simulation ne correspondent pas (lignes 30 à 32 dans mon code).
mike
1

La question peut être réécrite en utilisant une version modifiée du théorème de Bayes (et un abus de notion pour )Pr

Pr(X<Y|min(X,Y)=m)=Pr(min(X,Y)=m|X<Y)Pr(X<Y)Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|XY)Pr(XY)=Pr(X<Y,min(X,Y)=m)Pr(X<Y,min(X,Y)=m)+Pr(XY,min(X,Y)=m).

Définissez comme le PDF bivarié de et , et . alorsfX,YXYϕ(x)=12πexp(12x2)Φ(x)=xϕ(t)dt

Pr(X<Y,min(X,Y)=m)=Pr(X=m,Y>m)=mfX,Y(m,t)dt

et

Pr(XY,min(X,Y)=m)=Pr(Xm,Y=m)=mfX,Y(t,m)dt

En utilisant la normalité et la définition de la probabilité conditionnelle, les intégrandes peuvent être réécrits comme

fX,Y(m,t)=fY|X(t)fX(m)=1σY|Xϕ(tμY|XσY|X)1σ11ϕ(mμ1σ11)

et

fX,Y(t,m)=fX|Y(t)fY(m)=1σX|Yϕ(tμX|YσX|Y)1σ22ϕ(mμ2σ22).

μX|Y=μ1+σ12σ22(mμ2),

μY|X=μ2+σ12σ11(mμ1),

σX|Y=(1σ122σ11σ22)σ11

et

σY|X=(1σ122σ11σ22)σ22.

Donc

Pr(X<Y|min(X,Y)=m)=(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)+(1Φ(mμX|YσX|Y))1σ22ϕ(mμ2σ22).

Cette forme finale est très similaire au résultat auquel @olooney est arrivé. La différence est que ses probabilités ne sont pas pondérées par les densités normales.

Un script R pour la vérification numérique peut être trouvé ici

Mike
la source