J'ai eu du mal à interpréter les grappes résultantes d'une matrice d'adjacence. J'ai 200 matrices relativement grandes représentant des sujets qui contiennent des corrélations partielles (scores z) de séries chronologiques (données neuronales). L'objectif est de regrouper ces 210 matrices et de détecter toute communauté potentielle non découverte. J'ai donc fait un autre calcul de corrélation partielle résultant en une matrice d'adjacence 200x200. Chaque fois que je lance un algorithme de détection de communauté (par exemple Newmann), il arrive avec des communautés difficilement interprétables.
La question est de savoir quel genre de tests statistiques qui diront si ces communautés ou grappes sont significatives? et dans l'affirmative, existe-t-il des moyens systématiques d'élaborer l'interprétation?
Réponses:
J'ai déjà travaillé dans le passé sur le regroupement spectral qui pourrait être utile ici. L'idée de base est que l'on peut utiliser la matrice d'adjacence pour former ce que l'on appelle la matrice laplacienne:
Vous pouvez vérifier par vous-même que la valeur propre la plus basse du laplacien est zéro. La première valeur propre non nulle est souvent appelée connectivité algébrique, et le vecteur eigne correspondant aura une partie positive et une partie négative correspondant à deux partitions(B1,B2) du graphique sous-jacent. En gros, la grandeur de la première valeur eigne non nulle est une mesure de la force des connexions entre les deux partitions. Vous pourriez peut-être utiliser cette approche de manière récursive ou considérer les premières valeurs propres non nulles du laplacien. L' article suivant de Wikipédia sur le regroupement spectral est un bon début.
la source
Je regarde le même problème en ce moment. D'un examen rapide, il semble que le clustering spectral soit la façon la plus "naturelle" d'analyser une matrice d'adjacence. Voir cet article de blog pour plus de détails.
la source
Alternativement ... Les données neuronales (réelles ou artificielles) sont souvent une représentation très compressée des données, ce qui signifie que les données sont très aléatoires, ce qui signifie que vous ne trouverez aucune corrélation. Que vous avez !! Toutes nos félicitations! :)
la source