J'ai lu dans un certain nombre de références que l'estimation de Lasso pour le vecteur de paramètre de régression est équivalente au mode postérieur de dans lequel la distribution antérieure pour chaque est une distribution exponentielle double (également connue sous le nom de distribution de Laplace).
J'ai essayé de le prouver, quelqu'un peut-il étoffer les détails?
regression
bayesian
lasso
prior
regularization
Wintermute
la source
la source
Réponses:
Pour simplifier, considérons une seule observation d'une variableY telle que
Alors la densité conjointe deY,μ,σ2 est proportionnelle à
Prendre un log et éliminer les termes qui n'impliquent pas , log f ( Y , μ , σ 2 ) = - 1μ
Ainsi le maximum de (1) sera une estimation MAP et est bien le problème de Lasso après avoir reparamétrisé .λ~=λσ2
L'extension à la régression est claire - remplacer par X β dans la vraisemblance normale, et définir l'a priori sur β pour être une séquence de distributions indépendantes de laplace ( λ ) .μ Xβ β (λ)
la source
Cela est évident en examinant la quantité que le LASSO optimise.
Prenez l'a priori pour que soit Laplace indépendant avec un zéro moyen et une certaine échelle τ .βi τ
Donc .p(β|τ)∝e−12τ∑i|βi|
Le modèle des données est l'hypothèse de régression habituelle .y∼iidN(Xβ,σ2)
Maintenant, moins deux fois le journal de la partie postérieure est de la forme
1k(σ2,τ,n,p)+ 1σ2(y−Xβ)T(y−Xβ)+1τ∑i|βi|
Soit et on obtient - 2 log - postérieur deλ=σ2/τ −2log
1k(σ2,λ,n,p)+ 1σ2[(y−Xβ)T(y−Xβ)+λ∑i|βi|]
L'estimateur MAP pour minimise ce qui précède, ce qui minimiseβ
L'estimateur MAP pour est donc LASSO.β
(Ici, j'ai traité comme étant effectivement fixé, mais vous pouvez faire d'autres choses avec lui et toujours faire sortir LASSO.)σ2
Edit: C'est ce que j'obtiens pour composer une réponse hors ligne; Je n'ai pas vu une bonne réponse a déjà été publiée par Andrew. Le mien ne fait vraiment rien de ce qu'il ne fait pas déjà. Je vais laisser le mien pour l'instant car il donne quelques détails supplémentaires sur le développement en termes de .β
la source