J'ai récemment lu le livre de Skillicorn sur les décompositions matricielles et j'ai été un peu déçu, car il était destiné à un public de premier cycle. Je voudrais compiler (pour moi et pour les autres) une courte bibliographie des articles essentiels (enquêtes, mais aussi des articles révolutionnaires) sur les décompositions matricielles. Ce que je pense principalement, c'est quelque chose sur SVD / PCA (et les variantes robustes / clairsemées) et NNMF, car ce sont de loin les plus utilisés. Avez-vous tous des recommandations / suggestions? Je retiens la mienne pour ne pas biaiser les réponses. Je demanderais de limiter chaque réponse à 2-3 articles.
PS: Je considère ces deux décompositions comme les plus utilisées dans l'analyse des données . Bien sûr, QR, Cholesky, LU et polaire sont très importants dans l'analyse numérique. Ce n'est cependant pas l'objet de ma question.
Pour NNMF, Lee et Seung décrivent un algorithme itératif très simple à mettre en œuvre. En fait, ils donnent deux algorithmes similaires, l'un pour minimiser la norme de Frobenius des résidus, l'autre pour minimiser la divergence de Kullback-Leibler de l'approximation et de la matrice d'origine.
la source
Peut-être que vous pouvez trouver intéressant
Les deux derniers liens montrent comment les factorisations à matrice clairsemée sont utilisées dans le filtrage collaboratif. Cependant, je pense que les algorithmes de factorisation de type SGD peuvent être utiles ailleurs (au moins, ils sont extrêmement faciles à coder)
la source
Witten, Tibshirani - Décomposition de matrice pénalisée
http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf
http://cran.r-project.org/web/packages/PMA/index.html
Martinsson, Rokhlin, Szlam, Tygert - SVD randomisé
http://cims.nyu.edu/~tygert/software.html
http://cims.nyu.edu/~tygert/blanczos.pdf
la source
Au NIPS de cette année, il y avait un court article sur les SVD distribués à très grande échelle qui fonctionne en un seul passage sur une matrice d'entrée en streaming .
Le document est plus orienté vers l'implémentation, mais met les choses en perspective avec de vraies heures d'horloge murale et tout. Le tableau du début est également une bonne enquête.
la source