Dans leur article fondateur «Least Angle Regression» , Efron et al décrivent une modification simple de l'algorithme LARS qui permet de calculer des chemins de régularisation LASSO complets.
J'ai implémenté cette variante avec succès et trace généralement le chemin de sortie en fonction du nombre d'étapes (itérations successives de l'algorithme LARS) ou de la l_1 des coefficients de régression ( ).
Pourtant, il semble que la plupart des packages disponibles fournissent le chemin de régularisation en termes de coefficient de pénalisation LASSO (par exemple LARS dans R, où vous pouvez jouer avec l'argument `` mode '' pour basculer entre différentes représentations).
Ma question est: quelle est la mécanique utilisée pour passer d'une représentation à l'autre (s). J'ai vu diverses questions liées à cela (ou plus précisément la question de la mise en correspondance de la contrainte d'inégalité avec un terme de pénalisation approprié ), mais je n'ai trouvé aucune réponse satisfaisante.
[Éditer]
J'ai regardé à l'intérieur du code MATLAB qui effectue la transformation requise et, pour chaque étape LARS , voici comment semble être calculé:
où (taille ) et (taille ) désignent les entrées / réponses normalisées, représente l'ensemble des prédicteurs actifs à l'étape et représente le résidu de régression actuel à l'étape .
Je ne peux pas saisir la logique derrière ce calcul. Quelqu'un pourrait-il aider?
la source