Transformation linéaire d'une variable aléatoire par une grande matrice rectangulaire

12

Disons que nous avons un vecteur aléatoire , tiré d'une distribution avec la fonction de densité de probabilité . Si nous le transformons linéairement par une matrice n \ fois n de rang complet A pour obtenir \ vec {Y} = A \ vec {X} , alors la densité de \ vec {Y} est donnée par f _ {\ vec {Y} } (\ vec {y}) = \ frac {1} {\ left | \ det A \ right |} f _ {\ vec {X}} (A ^ {- 1} \ vec {y}). XRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Supposons maintenant que nous transformons X place par une matrice m \ fois n B , avec m> n , donnant \ vec {Z} = B \ vec {X} . Il est clair que Z \ in \ mathbb {R} ^ m , mais il "vit" dans un sous-espace à n dimensions G \ subset \ mathbb {R} ^ m . Quelle est la densité conditionnelle de \ vec {Z} , étant donné que nous savons qu'elle se situe dans G ?m×nBm>nZ=BXZRmnGRmZG

Mon premier instinct était d'utiliser la pseudo-inverse de B . Si B=USVT est la décomposition en valeurs singulières de B , alors B+=VS+UT est la pseudo-inverse, où S+ est formé en inversant les entrées non nulles de la matrice diagonale S . J'ai deviné que cela donnerait

fZ(z)=1|det+S|fX(B+z),
où par det+S je veux dire le produit des valeurs singulières non nulles.

Ce raisonnement s'accorde avec la densité pour une normale singulière (conditionnée par la connaissance que la variable vit sur le sous-espace approprié) donnée ici et mentionnée ici et dans ce post CrossValidated .

Mais ce n'est pas bien! La constante de normalisation est désactivée. Un contre-exemple (trivial) est donné en considérant le cas suivant: Avec XN(0,1) , laissons

Y=(11)X=(XX).
Ici, la matrice B d'en haut n'est que le vecteur de ceux Son pseudo-inverse est
B+=(1/21/2)
et det+B=2 . Le raisonnement ci-dessus suggérerait
fY(y)=12π2exp(12yT(B+)TB+y),
mais cela s'intègre en fait (sur la ligne y=x ) à 12. Je me rends compte que dans ce cas, vous pouvez simplement supprimer l'une des entrées de Y , mais quand B est beaucoup plus grand, identifier l'ensemble des entrées à supprimer est ennuyeux. Pourquoi le raisonnement pseudo-inverse ne fonctionne-t-il pas? Existe-t-il une formule générale pour la fonction de densité d'une transformation linéaire d'un ensemble de variables aléatoires par une matrice "haute"? Toute référence serait également grandement appréciée.
Dan
la source

Réponses:

2

Pour ceux qui pourraient rencontrer cela à l'avenir ... la source de l'erreur provient en fait de l'intégration. Dans l'exemple ci-dessus, l'intégration s'effectue sur la ligne . Il est donc nécessaire de "paramétrer" la ligne et de considérer le jacobien de la paramétrisation lors de la prise de l'intégrale, puisque chaque pas unitaire dans l' axe des correspond aux pas de longueur sur la ligne. La paramétrisation que j'utilisais implicitement a été donnée par , en d'autres termes spécifiant les deux entrées identiques de par valeur. Cela a Jacobian , qui annule proprement avec ley=xx2x(x,x)y22 (venant exactement du même jacobien) dans le dénominateur.

L'exemple était artificiellement simple - pour une transformation générale , on peut avoir un autre paramétrage pour la sortie qui est naturel dans le contexte du problème. La paramétrisation devant couvrir le même sous-espace que et ce sous-espace étant un hyperplan, le paramétrage est lui-même susceptible d'être linéaire. En appelant la représentation matricielle de la paramétrisation , la condition est simplement qu'elle ait le même espace de colonne que (couvre le même hyperplan). La densité finale devient alorsBB m × n L B f Z ( z ) = | det + L |GBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

En général, cette configuration est un peu étrange, et je pense que la bonne chose à faire est de trouver un ensemble maximal linéairement indépendant de lignes de et de supprimer le reste des lignes (ainsi que les composants correspondants de la variable transformée ) pour obtenir une matrice carrée . Le problème se réduit ensuite au cas complet (en supposant que a le rang de colonne complet).de z B n × n BBzB^n×nB

Dan
la source