Quelles sont les étapes de prétraitement appropriées pour effectuer une analyse indépendante des composants?

17

Quelles sont les étapes appropriées pour prétraiter mes formes d'onde afin d'effectuer ultérieurement une analyse indépendante des composants (ICA)? Je comprends le comment, bien que cela ne fasse pas de mal, mais je suis plus intéressé par le pourquoi.

jonsca
la source
Je ne sais pas pourquoi vous avez besoin d'un prétraitement. Y a-t-il une raison particulière?
Phonon
@Phonon J'ai rencontré des enquêteurs qui ont contrôlé leurs données avant d'effectuer ICA dessus. Je me demandais simplement s'il y avait une méthode standard.
jonsca
Très intéressant. J'adorerais voir une réponse constructive.
Phonon
1
Dans le cas de l'analyse spectrale sur des signaux EEG, les gens blanchissent pour réduire l'effet dominant de la forme du spectre, qui cache souvent des choses intéressantes à hautes fréquences. Il y a au moins une petite discussion à ce sujet ici dans les documents supplémentaires. Que ce soit une astuce courante avant l'ICA en particulier, je ne sais pas. Votre application utilise-t-elle des signaux EEG / MEG / LFP? Peut-être que quelqu'un qui fait de l'ICA peut étoffer cela en une réponse complète, si mon intuition est bonne. Question intéressante - je vais la lire. 1/F
ImAlsoGreg
1
@Gigili Cela fait aussi partie de la question. Quelles sont celles qui sont considérées comme les étapes normales?
jonsca

Réponses:

15

L'analyse des composants indépendants (ICA) est utilisée pour séparer un mélange linéaire de composants statistiquement indépendants et, surtout, non gaussiens dans ses constituants. Le modèle standard pour un ICA sans bruit est

x=As

où est le vecteur d'observation ou de données, est un signal source / composants originaux (non gaussiens) et est un vecteur de transformation qui définit le mélange linéaire des signaux constitutifs. En général, et sont inconnus.s A A sxsAAs

Prétraitement

Il existe deux principales stratégies de prétraitement dans l'ICA, à savoir le centrage et le blanchiment / sphère. Les principales raisons du prétraitement sont:

  • Simplification des algorithmes
  • Réduction de la dimensionnalité du problème
  • Réduction du nombre de paramètres à estimer.
  • La mise en évidence des caractéristiques de l'ensemble de données n'est pas facilement expliquée par la moyenne et la covariance.

Extrait de l'introduction de G. Li et J. Zhang, "Sphering et ses propriétés", The Indian Journal of Statistics, Vol. 60, série A, partie I, p. 119-133, 1998:

Les valeurs aberrantes, les grappes ou d'autres types de groupes, et les concentrations près des courbes ou des surfaces non planes sont probablement les caractéristiques importantes qui intéressent les analystes de données. Ils ne sont généralement pas accessibles par la simple connaissance de la moyenne de l'échantillon et de la matrice de covariance. Dans ces circonstances, il est souhaitable de séparer les informations contenues dans les matrices moyenne et covariance et nous oblige à examiner des aspects de nos ensembles de données autres que ces natures bien comprises. Le centrage et la sphère sont une approche simple et intuitive qui élimine les informations de covariance moyenne et aide à mettre en évidence les structures au-delà de la corrélation linéaire et des formes elliptiques, et est donc souvent effectuée avant d'explorer les affichages ou les analyses d'ensembles de données

1. Centrage:

Le centrage est une opération très simple et se réfère simplement à la soustraction de la moyenne . En pratique, vous utilisez l'exemple de moyenne et créez un nouveau vecteur , où est la moyenne de les données. Géométriquement, soustraire la moyenne équivaut à traduire le centre des coordonnées à l'origine. La moyenne peut toujours être rajoutée au résultat à la fin (cela est possible car la multiplication matricielle est distributive).x c = x - ¯ x ¯ xE{x}Xc=X-X¯X¯

2. Blanchiment:

Le blanchiment est une transformation qui convertit les données de telle sorte qu'elles ont une matrice de covariance d'identité, c'est-à-dire . Normalement, vous travaillez avec la matrice de covariance échantillon,E{XcXcT}=je

Σ^=C.XcXcT

où est juste mon espace réservé paresseux pour le facteur de normalisation approprié (en fonction des dimensions de ). Un nouveau vecteur blanchi est créé commexCX

Xw=Σ^-1/2Xc

qui aura une covariance de . Géométriquement, le blanchiment est une transformation d' échelle . Voici un petit exemple dans Mathematica:je

s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[[email protected]/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
  ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]

entrez la description de l'image ici

Le premier tracé est la densité conjointe de deux vecteurs aléatoires uniformément distribués, ou les composants . La seconde montre l'effet de la multiplication par un vecteur de transformation . Le carré est de travers et mis à l'échelle en losange. En multipliant avec la matrice de blanchiment, la densité du joint revient à un carré légèrement tourné par rapport à l'original.AsUNE

En raison de la transformation de blanchiment, dans le nouveau système en cours de résolution, c'est-à-dire , est une matrice orthogonale. Cela peut être facilement montré:A wXw=UNEwswUNEw

E{XwXwT}=E{UNEwsw(UNEwsw)T}=UNEwE{swswT}UNEwT=UNEwUNEwT=je

où la dernière étape suit en raison de l'indépendance statistique de La condition d'orthogonalité signifie qu'il n'y a qu'environ la moitié du nombre de paramètres à estimer. (Remarque: bien que cela soit vrai dans ce cas et dans mon exemple, n'a pas besoin d'être carré pour commencer).sjeUNE

Si, après la transformation, il existe des valeurs propres proches de zéro, celles-ci peuvent être éliminées en toute sécurité car elles ne sont que du bruit et ne feront qu'entraver l'estimation en raison du "surapprentissage".

3. Autres prétraitements

Il peut y avoir d'autres étapes de prétraitement impliquées dans certaines applications spécifiques qui sont impossibles à couvrir dans une réponse. Par exemple, j'ai vu quelques articles qui utilisent le journal des séries chronologiques et quelques autres qui filtrent les séries chronologiques. Bien que cela puisse convenir à leur application / conditions particulières, les résultats ne sont pas appliqués à tous les champs.

Je pense qu'il est possible d'utiliser ICA si au plus l' un des composants est gaussien, bien que je ne trouve pas de référence pour cela pour le moment.


Pourquoi est-il appelé "sphère"?

Ceci est probablement bien connu, mais comme un fait amusant, sphéricité vient du changement de la structure des matrices de covariance dans le cas de gaussiennes à partir d' un -dimensionnelle hyper ellipsoïde à une sphère de dimension en raison de blanchiment. Voici un exemple (utilisez le même code que ci-dessus, mais remplacez-le par )nn{-1,1}NormalDistribution[]

entrez la description de l'image ici

La première est la densité conjointe de deux Gaussiennes non corrélées, la seconde en transformation et la troisième après le blanchiment. En pratique, seules les étapes 2 et 3 sont visibles.

Lorem Ipsum
la source
2
Wow, ça va me prendre un peu pour tout comprendre, mais merci est un euphémisme!
jonsca
Désolé, je pensais l'avoir déjà accepté.
jonsca