Quelques raisons "au niveau de l'intestin" pour lesquelles il est préférable de travailler avec la matrice d'autocorrélation au lieu d'une matrice avec vos observations:
- Si vous voulez prendre en compte toutes vos observations et que vous avez beaucoup de données, vous finirez par manipuler (inverser, multiplier) des matrices assez grandes. Si vous travaillez avec la matrice d'autocorrélation, vous "résumez" vos données une fois (dans une étape assez efficace ne nécessitant qu'une FFT et une FFT inverse), et à partir de là, vous manipulez simplement votre matrice d'autocorrélation de tailleP× P où P est votre ordre de modèle (par exemple pour la modélisation AR ou la modélisation sinusoïdale).
- Avec certaines données, l'utilisation des observations brutes ne fonctionne tout simplement pas numériquement, car vous rencontrez des situations dans lesquelles vous devez traiter des matrices qui ne sont pas garanties d'être positives-définies.
Par exemple, considérons deux approches de l'ajustement d'un modèle AR.
Utilisation directe de la matrice de données
L'erreur de reconstruction quadratique empirique sur vos données est:
ϵ =XTx +XTΓ a +uneTΓTx +uneTΓTΓ a
où une est le vecteur des coefficients AR, X est votre vecteur d'observation, et Γla matrice avec vos observations retardées. Vous devez trouver la valeur deunequi minimise cela. Après dérivation et un peu de mélange, votre solution ressemble à ceci:
a =-(ΓTΓ)- 1ΓTX
Et vous êtes foutu parce que vous n'avez absolument aucune garantie que ΓTΓpeut être inversé. Dans le processus, numériquement parlant, vous avez dû faire face à des produits matriciels assez gros si vous avez une longue séquence d'observations.
Vue de processus aléatoire
si vous adaptez un angle de "processus aléatoire" au problème, la quantité que vous devez minimiser (la valeur attendue de l'erreur) est:
ϵ =rX( 0 ) + 2 r a +uneTR a
Et vous vous retrouvez avec la solution la plus agréable au goût:
a=−R−1r
Avec une solide garantie que ce sera calculable car R est définitivement défini!
Il semble que votre problème soit celui de la modélisation sinusoïdale (plutôt que de la modélisation AR). Il y a beaucoup de signes de la main ici, mais ce que j'ai dit sur la modélisation AR et les obstacles à l'utilisation de la matrice de données brutes; s'applique également à la modélisation sinusoïdale - avec la décomposition des valeurs propres étant l'opération problématique au lieu de l'inversion de la matrice.