Quelles sont les étapes appropriées pour prétraiter mes formes d'onde afin d'effectuer ultérieurement une analyse indépendante des composants (ICA)? Je comprends le comment, bien que cela ne fasse pas de mal, mais je suis plus intéressé par le pourquoi.
preprocessing
ica
jonsca
la source
la source
Réponses:
L'analyse des composants indépendants (ICA) est utilisée pour séparer un mélange linéaire de composants statistiquement indépendants et, surtout, non gaussiens † dans ses constituants. Le modèle standard pour un ICA sans bruit est
où est le vecteur d'observation ou de données, est un signal source / composants originaux (non gaussiens) et est un vecteur de transformation qui définit le mélange linéaire des signaux constitutifs. En général, et sont inconnus.s A A sX s UNE UNE s
Prétraitement
Il existe deux principales stratégies de prétraitement dans l'ICA, à savoir le centrage et le blanchiment / sphère. Les principales raisons du prétraitement sont:
Extrait de l'introduction de G. Li et J. Zhang, "Sphering et ses propriétés", The Indian Journal of Statistics, Vol. 60, série A, partie I, p. 119-133, 1998:
1. Centrage:
Le centrage est une opération très simple et se réfère simplement à la soustraction de la moyenne . En pratique, vous utilisez l'exemple de moyenne et créez un nouveau vecteur , où est la moyenne de les données. Géométriquement, soustraire la moyenne équivaut à traduire le centre des coordonnées à l'origine. La moyenne peut toujours être rajoutée au résultat à la fin (cela est possible car la multiplication matricielle est distributive).x c = x - ¯ x ¯ xE { x } Xc= x - x¯¯¯ X¯¯¯
2. Blanchiment:
Le blanchiment est une transformation qui convertit les données de telle sorte qu'elles ont une matrice de covariance d'identité, c'est-à-dire . Normalement, vous travaillez avec la matrice de covariance échantillon,E { xcXTc} = Je
où est juste mon espace réservé paresseux pour le facteur de normalisation approprié (en fonction des dimensions de ). Un nouveau vecteur blanchi est créé commexC X
qui aura une covariance de . Géométriquement, le blanchiment est une transformation d' échelle . Voici un petit exemple dans Mathematica:je
Le premier tracé est la densité conjointe de deux vecteurs aléatoires uniformément distribués, ou les composants . La seconde montre l'effet de la multiplication par un vecteur de transformation . Le carré est de travers et mis à l'échelle en losange. En multipliant avec la matrice de blanchiment, la densité du joint revient à un carré légèrement tourné par rapport à l'original.As UNE
En raison de la transformation de blanchiment, dans le nouveau système en cours de résolution, c'est-à-dire , est une matrice orthogonale. Cela peut être facilement montré:A wXw= Awsw UNEw
où la dernière étape suit en raison de l'indépendance statistique de La condition d'orthogonalité signifie qu'il n'y a qu'environ la moitié du nombre de paramètres à estimer. (Remarque: bien que cela soit vrai dans ce cas et dans mon exemple, n'a pas besoin d'être carré pour commencer).sje UNE
Si, après la transformation, il existe des valeurs propres proches de zéro, celles-ci peuvent être éliminées en toute sécurité car elles ne sont que du bruit et ne feront qu'entraver l'estimation en raison du "surapprentissage".
3. Autres prétraitements
Il peut y avoir d'autres étapes de prétraitement impliquées dans certaines applications spécifiques qui sont impossibles à couvrir dans une réponse. Par exemple, j'ai vu quelques articles qui utilisent le journal des séries chronologiques et quelques autres qui filtrent les séries chronologiques. Bien que cela puisse convenir à leur application / conditions particulières, les résultats ne sont pas appliqués à tous les champs.
† Je pense qu'il est possible d'utiliser ICA si au plus l' un des composants est gaussien, bien que je ne trouve pas de référence pour cela pour le moment.
Pourquoi est-il appelé "sphère"?
Ceci est probablement bien connu, mais comme un fait amusant, sphéricité vient du changement de la structure des matrices de covariance dans le cas de gaussiennes à partir d' un -dimensionnelle hyper ellipsoïde à une sphère de dimension en raison de blanchiment. Voici un exemple (utilisez le même code que ci-dessus, mais remplacez-le par )n n
{-1,1}
NormalDistribution[]
La première est la densité conjointe de deux Gaussiennes non corrélées, la seconde en transformation et la troisième après le blanchiment. En pratique, seules les étapes 2 et 3 sont visibles.
la source