Cartes propres PCA, ICA et laplacienne

11

Question

Je suis très intéressé par la méthode des cartes propres laplaciennes. Actuellement, je l'utilise pour réduire les dimensions de mes ensembles de données médicales.

Cependant, j'ai rencontré un problème en utilisant la méthode.

Par exemple, j'ai quelques données (signaux spectraux) et je peux utiliser PCA (ou ICA) pour obtenir des PC (ou IC). Le problème est de savoir comment obtenir des composants à dimensions réduites similaires des données d'origine à l'aide de LE?

Selon la méthode des cartes propres laplacienne, nous devons résoudre le problème généralisé des valeurs propres, qui est

Ly=λDy

Ici, est le vecteur propre. Si je trace par exemple les 3 premiers vecteurs propres (la solution selon 3 valeurs propres), les résultats ne sont pas interprétables.y

Cependant, lorsque je trace les 3 premiers PC et les 3 meilleurs CI, les résultats semblent toujours clairement (visuellement) représenter les données d'origine .x

Je suppose que la raison en est que la matrice est définie par la matrice de poids (matrice d'adjacence ), et les données ont été ajustées avec le noyau de chaleur pour créer , qui utilise une fonction exponentielle. Ma question est de savoir comment récupérer les composantes réduites de (pas le vecteur propre de la matrice )?LWxWxyL


Les données

Mon ensemble de données est restreint et n'est pas facile à démontrer le problème. Ici, j'ai créé un problème de jouet pour montrer ce que je voulais dire et ce que je voulais demander.

S'il vous plaît voir l'image,

Tout d'abord, je crée des ondes sinusoïdales A, B, C montrant des courbes rouges (première colonne de la figure). A, B et C ont 1000 échantillons, en d'autres termes, enregistrés dans des vecteurs 1x1000.

Deuxièmement, j'ai mélangé les sources A, B, C en utilisant des combinaisons linéaires créées aléatoirement, par exemple, , dans lesquelles sont des valeurs aléatoires. Le signal mixte est dans un espace dimensionnel très élevé, par exemple, , 1517 est un espace dimensionnel élevé choisi au hasard. Je montre seulement les trois premières rangées de signal M dans des courbes vertes (deuxième colonne de la figure).M=r1A+r2B+r3Cr1,r2,r3MMR1517×1000

Ensuite, j'exécute des cartes propres PCA, ICA et laplacienne pour obtenir les résultats de réduction de dimension. J'ai choisi d'utiliser 3 PC, 3 IC et 3 LE pour faire une comparaison équitable (les courbes bleues représentaient respectivement la 3e, la 4e et la dernière colonne de la figure).

À partir des résultats de PCA et ICA (3e, 4e colonne de la figure), nous pouvons voir que nous pouvons interpréter les résultats comme une certaine réduction de dimension, c'est-à-dire que pour les résultats ICA, nous pouvons récupérer le signal mélangé par (je ne sais pas si nous pouvons également obtenir avec des résultats PCA mais le résultat me semble tout à fait correct).M=b1IC1+b2IC2+b3IC3M=a1PC1+a2PC2+a3PC3

Cependant, veuillez regarder les résultats de LE, je peux à peine interpréter les résultats (dernière colonne de la figure). Il semble que quelque chose ne va pas avec les composants réduits. Aussi, je tiens à mentionner que finalement le tracé de la dernière colonne est le vecteur propre dans la formuleyLy=λDy

Avez-vous des idées supplémentaires?

La figure 1 utilisant 12 voisins les plus proches et sigma dans le noyau chauffant est de 0,5: Colonnes de gauche à droite: signal d'origine, signal mixte, PC, IC, LE

La figure 2 utilisant 1000 voisins les plus proches et sigma dans le noyau chauffant est de 0,5: Colonnes de gauche à droite: signal d'origine, signal mixte, PC, IC, LE

Sourcecode: code Matlab avec package requis

Samo Jerom
la source
2
Qu'entendez-vous par composants réduits de x? Voulez-vous dire, une intégration de faible dimension de x?
corbillard
Cela semble intéressant. Pourriez-vous donner une description plus détaillée de ce à quoi ressemblent en fait vos données?
Placidia

Réponses:

4

La réponse à votre question est donnée par la cartographie au bas de la page 6 du papier d' origine des cartes propres laplaciennes :

xi(f1(i),,fm(i))

x5(f1(5),f2(5))f1f2Lf=λDf

L

Shantanu
la source
MMTmixedSignal'
MM
xi(f1(i),,fm(i))mixedSignalmappedX
PS: Ci-dessus, je voulais dire "Vous ne pouvez pas faire cela en utilisant LEM, du moins pas facilement".
Shantanu
1

Contrairement aux PCA, les cartes propres laplaciennes utilisent les vecteurs propres généralisés correspondant aux plus petites valeurs propres. Il saute le vecteur propre avec la plus petite valeur propre (peut être zéro) et utilise les vecteurs propres correspondant aux quelques petites valeurs propres suivantes. PCA est une variance maximale préservant l'incorporation à l'aide de la matrice noyau / gramme. Les cartes propres laplaciennes se posent davantage comme un problème de minimisation par rapport au laplacien des graphes combinatoires (voir les articles de Trosset).

corbillard
la source
Tous ceux qui sont intéressés, veuillez revoir ma question. Je mets quelques exemples. Merci beaucoup.
Samo Jerom