Je fais une analyse Matlab sur des données d'IRM où j'ai effectué l'ACP sur une matrice de taille 10304x236 où 10304 est le nombre de voxels (pensez-y comme pixels) et 236 est le nombre de points temporels. L'ACP me donne 236 valeurs propres et leurs coefficients associés. Tout va bien. Cependant, quand vient le temps de décider du nombre de composants à conserver, le papier que je reproduis dit ce qui suit (veuillez me faire savoir si des clarifications sont nécessaires car ce n'est qu'une courte partie de tout le papier):
Nous avons ensuite effectué des simulations Monte Carlo pour déterminer le nombre de composants principaux (PC) à extraire des données ROI nuisibles pour chaque scan. Une distribution nulle des valeurs propres attendues a été générée séparément pour les données de codage et de repos pour chaque sujet en effectuant l'ACP sur des données normalement distribuées de rang égal aux données de ROI de codage et de nuisance au repos. Les PC des véritables données de ROI nuisibles ont ensuite été sélectionnés pour un repos ou un balayage d'encodage donné si leurs valeurs propres associées dépassaient le 99e intervalle de confiance des valeurs propres des simulations de Monte Carlo.
Je ne sais absolument pas quoi faire ici. J'ai l'habitude de choisir des composants en fonction de la variance cumulée expliquée. Ma pensée est la suivante, cependant:
Nous avons ensuite effectué des simulations de Monte Carlo pour déterminer le nombre de composants principaux (PC) à extraire des données ROI nuisibles pour chaque scan.
Les simulations de Monte-Carlo signifient simplement de faire les 1000 (ou autres) temps suivants, non?
Une distribution nulle des valeurs propres attendues a été générée en effectuant l'ACP sur des données normalement distribuées de rang égal aux données de ROI d'encodage et de nuisance au repos.
Tout d'abord, je suppose que «rang égal» signifie essentiellement que je vais créer une matrice de la même taille que l'original (10304x236). En termes de «données normalement distribuées de rang égal» ... cela signifie-t-il que je devrais créer une matrice 10304x236 de nombres aléatoires à partir de la distribution normale? Matlab a une fonction appelée «normrnd» qui fait cela mais nécessite une entrée mu et sigma. Est-ce que j'utiliserais les mêmes mu et sigma que ceux dérivés du jeu de données initial? Est-ce plus ou moins ce que l'on entend par «valeurs propres attendues», car je n'ai aucune idée de ce à quoi ressemblerait une distribution des valeurs propres attendues.
Je suppose que mon problème est plus ou moins que je ne sais pas comment faire une «distribution nulle» des valeurs propres.
la source