Pourquoi la convolution fonctionne-t-elle?

11

Je sais donc que si nous voulons trouver la distribution de probabilité d'une somme de variables aléatoires indépendantes , nous pouvons la calculer à partir des distributions de probabilité de et , en disantX+YXY

fX+Y(a)=x=fX,Y(X=x,Y=ax) dx=x=fX(x)fY(ax) dx

Intuitivement, cela a du sens, car si nous voulons trouver la probabilité que deux variables aléatoires additionnent à , c'est essentiellement la somme des probabilités de tous les événements qui conduisent à ces variables sommant à . Mais comment puis-je prouver officiellement cette déclaration?aa

Jessica
la source
Question légèrement différente, mais la réponse est similaire .
Carl

Réponses:

10

La solution plus générale considère où et ne sont pas nécessairement indépendants. Une stratégie de solution courante pour les problèmes où vous vous demandez d'où vient un PDF ou comment le justifier est de trouver un cumulatif à la place, puis de le différencier pour réduire le CDF en PDF.X YZ=X+YXY

Il est assez facile de voir que dans ce cas où est la région du plan - pour laquelle .R x y x + y zFZ(z)=P(Zz)=RfX,Y(x,y)dxdyRxyx+yz

Il s'agit de la région hachurée en bleu dans le diagramme ci-dessous. Il est naturel de s'intégrer sur cette région en la décomposant en bandes - je l'ai fait avec des bandes verticales mais horizontales feront l'affaire. En fait, je me retrouve avec une bande pour chaque coordonnée , allant de à , et le long de chaque bande, je veux que les valeurs ne dépassent pas la ligne , donc .- y x + y = z y z - xxyx+y=zyzx

z <x + y

Maintenant que nous avons obtenu des limites d'intégration en termes de et , nous pouvons faire une substitution , comme suit, dans le but de faire apparaître comme la limite supérieure de . Les mathématiques sont simples tant que vous comprenez l' utilisation du jacobien pour changer les variables.xyu=xv=x+yzv

FZ(z)=x=x=y=y=zxfX,Y(x,y)dxdy=v=v=zu=y=fX,Y(u,vu)dudv

Tant que certaines conditions sont remplies, on peut différencier sous le signe intégral par rapport à pour obtenir:z

fZ(z)=fX,Y(u,zu)du

Cela fonctionne même si et ne sont pas indépendants. Mais s'ils le sont, nous pouvons réécrire la densité conjointe comme le produit des deux marginaux:XY

fZ(z)=fX(u)fY(zu)du

La variable fictive peut sans danger être écrite comme si vous le souhaitez.ux

Ma notation pour les intégrales suit exactement la section 6.4 de Geoffrey Grimmett et Dominic Walsh, Probability: An Introduction , Oxford University Press, New York, 2000.

Silverfish
la source
+1 En termes de notation, la convention est que le différentiel à l'extérieur de l'intégrale multiple s'applique à l'intégrale externe; ainsi, dans une expression de la forme l'intégration par rapport à se fait en premier - c'est l'intégrale intérieure - et celle par rapport à est fait en dernier - c'est l'intégrale externe. Cela nous laisse libre de placer des parenthèses sans changer la signification, comme dans . dxdyxy(dx)dy
whuber
1
@whuber, en y réfléchissant, c'est certainement la convention qui est appliquée dans à peu près tous les manuels que je connais (donc l'intégration multiple est effectivement des intégrales imbriquées). Mais en feuilletant, Grimmett et Welsh "Probability: An Introduction" sont absolument cohérents avec leur propre convention du même ordre gauche-droite pour les limites et les différentiels, par exemple, ils donnent ! uvw...dudvdw
Silverfish
Je suis constamment amusé par la façon dont, à l'intersection de nombreux domaines, nous sommes exposés à des conventions contradictoires. C'est l'une des joies de travailler avec des personnes d'horizons différents.
whuber
@whuber Je suis conscient que les conventions pour définir les intégrales varient considérablement entre les pays - vous apprécierez cela de Tex SE tex.stackexchange.com/a/88961/25866 et je souhaite qu'il soit étendu pour couvrir plusieurs intégrations!
Silverfish
10

L'énoncé est vrai si et seulement si le côté droit agit comme une densité pour ; C'est,X+Y

FX+Y(a)=P(X+Ya)=afX+Y(z)dz=a(fX(x)fY(zx)dx)dz

pour tous . Vérifions cela en commençant par le côté droit.a

Appliquez le théorème de Fubini pour changer l'ordre d'intégration et effectuez la substitution . Le déterminant de son jacobien est , donc aucun terme supplémentaire n'est introduit par ce changement de variables. Notez que parce que et sont en correspondance un à un et si et seulement si , nous pouvons réécrire l'intégrale commez=x+y1zy<za<y<ax

=(axfX(x)fY(y)dy)dx.

Par définition, c'est l'intégrale sur deR2

=I(x+ya)fX(x)fY(y)dydx

où est la fonction d'indicateur d'un ensemble. Enfin, puisque et sont indépendants, pour tous , révélant l'intégrale comme étant simplement l'attenteX YIXYf(X,Y)(x,y)=fX(x)fY(y)(x,y)

=I(x+ya)f(X,Y)(x,y)dydx=E(I(X+Ya))=P(X+Ya),

comme voulu.


Plus généralement, même lorsque l'un ou les deux de ou n'ont pas de fonction de distribution, on peut toujours obtenirXY

FX+Y(a)=EX(FY(aX))=EY(FX(aY))

directement à partir des définitions de base, en utilisant l'attente des indicateurs pour faire des allers-retours entre les probabilités et les attentes et en exploitant l'hypothèse d'indépendance pour diviser le calcul en attentes distinctes par rapport à et :XY

P(X+Ya)=E(I(X+Ya))=EX(EY(I(X+Ya))=EX(PY(YaX))=EX(FY(aX)).

Cela inclut les formules habituelles pour les variables aléatoires discrètes, par exemple, bien que sous une forme légèrement différente de celle habituelle (car elle est indiquée en termes de CDF plutôt que de fonctions de masse de probabilité).

Si vous avez un théorème assez fort sur l'échange de dérivés et d'intégrales, vous pouvez différencier les deux côtés par rapport à pour obtenir la densité en un seul coup,afX+Y

fX+Y(a)=ddaFX+Y(a)=EX(ddaFY(aX))=EX(fY(aX))=fX(x)fY(ax)dx.
whuber
la source