Quelqu'un a-t-il de l'expérience avec les approches de sélection du nombre de composants principaux clairsemés à inclure dans un modèle de régression?
pca
sparse
regression-strategies
Frank Harrell
la source
la source
Réponses:
Bien que je n'aie pas de vue directe sur votre question, j'ai parcouru certains documents de recherche qui pourraient vous intéresser. C'est, bien sûr, si je comprends bien que vous parlez d' ACP clairsemée , de régression des principaux composants et de sujets connexes. Dans ce cas, voici les papiers:
la source
http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5876870&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5876870
Je peux poster une copie si vous n'êtes pas membre d'eeee.
Ceci provient d'un article que j'ai écrit au premier cycle. J'ai eu un problème où je devais décider du nombre de dimensions (l'indexation sémantique latente est similaire à l'ACP) à utiliser dans mon modèle de régression logistique. Ce que j'ai fait, c'est de choisir une métrique (c.-à-d. Le taux d'erreur lors de l'utilisation d'une probabilité d'indicateur de 0,5) et j'ai examiné la distribution de ce taux d'erreur pour différents modèles formés sur différents nombres de dimensions. J'ai ensuite choisi le modèle avec le taux d'erreur le plus bas. Vous pouvez utiliser d'autres mesures comme l'aire sous la courbe ROC.
Vous pouvez également utiliser quelque chose comme une régression pas à pas pour choisir le nombre de dimensions pour vous. Quel type de régression effectuez-vous spécifiquement?
Qu'entendez-vous par btw clairsemé?
la source