Quelle est la différence entre l'ACP et l'ACP asymptotique?

23

Dans deux articles en 1986 et 1988 , Connor et Korajczyk ont ​​proposé une approche pour modéliser les rendements des actifs. Étant donné que ces séries chronologiques ont généralement plus d'actifs que les observations de période, ils ont proposé d'effectuer une ACP sur les covariances transversales des rendements des actifs. Ils appellent cette méthode l'analyse des composants principaux asymptotiques (APCA, ce qui est assez déroutant, car le public pense immédiatement aux propriétés asymptotiques de l'ACP).

J'ai élaboré les équations, et les deux approches semblent numériquement équivalentes. Les asymptotiques diffèrent bien sûr, car la convergence est prouvée pour plutôt que . Ma question est: quelqu'un a-t-il utilisé APCA et comparé à PCA? Y a-t-il des différences concrètes? Si oui, lesquels?NT

gappy
la source
2
0 vote négatif Gappy:> ce n'est pas une réponse à votre question, mais une approche alternative, plus récente et souvent plus puissante dans les prévisions hors échantillon, à ce problème: les grands VAR bayésiens, voir ce document récent ideas.repec.org /p/cpr/ceprdp/6326.html
user603
5
Comment pourraient- ils être différents s'ils sont numériquement équivalents?
John Salvatier
Étant donné que l'ACP dans un processus de Markov est asymptotiquement une transformée en cosinus, cela ne peut-il pas être le sens dans APCA?
JohnRos
Bonjour @gappy! Je me demande si ma réponse a été utile ou convaincante. Si vous pensez que ce n'est pas correct (ou ne rend pas justice à l '«ACP asymptotique»), je serais curieux d'entendre vos réflexions sur la question.
Amoeba dit Reinstate Monica

Réponses:

6

Il n'y a absolument aucune différence.

Il n'y a absolument aucune différence entre l'ACP standard et ce que C&K a suggéré et appelé "ACP asymptotique". Il est assez ridicule de lui donner un nom distinct.

Voici une courte explication de l'ACP. Si des données centrées avec des échantillons en lignes sont stockées dans une matrice de données , alors PCA recherche les vecteurs propres de la matrice de covariance et projette les données sur ces derniers vecteurs propres pour obtenir les principaux composants. De manière équivalente, on peut considérer une matrice de Gram, . Il est facile de voir qu'il a exactement les mêmes valeurs propres, et ses vecteurs propres sont des PC à l'échelle. (Ceci est pratique lorsque le nombre d'échantillons est inférieur au nombre de fonctions.)1X11NXX1NXX

Il me semble que ce que C&K a suggéré, c'est de calculer des vecteurs propres de la matrice de Gram afin de calculer les composants principaux. Eh bien, wow. Ce n'est pas "équivalent" à PCA; il est PCA.

Pour ajouter à la confusion, le nom "ACP asymptotique" semble se référer à sa relation avec l'analyse factorielle (AF), pas avec l'ACP! Les documents originaux de C&K sont sous paywall, voici donc une citation de Tsay, Analysis of Financial Time Series, disponible sur Google Books:

Connor et Korajczyk (1988) ont montré que, comme [nombre de caractéristiques] analyse de valeur propre-vecteur propre [de la matrice de Gram] est équivalente à l'analyse factorielle statistique traditionnelle.k

Ce que cela signifie vraiment, c'est que lorsque , PCA donne la même solution que FA. C'est un fait facile à comprendre sur PCA et FA, et cela n'a rien à voir avec ce que C&K a suggéré. J'en ai discuté dans les discussions suivantes:k

Le résultat est donc le suivant: C&K a décidé d'inventer le terme "PCA asymptotique" pour PCA standard (qui pourrait également être appelé "FA asymptotique"). J'irais jusqu'à recommander de ne jamais utiliser ce terme.

amibe dit réintégrer Monica
la source
2

En général, APCA est utilisé lorsqu'il y a beaucoup de séries mais très peu d'échantillons. Je ne décrirais pas APCA comme meilleur ou pire que PCA, en raison de l'équivalence que vous avez notée. Ils diffèrent cependant par le moment où les outils sont applicables. C'est la perspicacité du papier: vous pouvez inverser la dimension si c'est plus pratique! Donc, dans l'application que vous avez mentionnée, il y a beaucoup d'actifs, donc vous auriez besoin d'une longue série chronologique pour calculer une matrice de covariance, mais maintenant vous pouvez utiliser APCA. Cela dit, je ne pense pas que APCA soit appliqué très souvent car vous pouvez essayer de réduire la dimensionnalité en utilisant d'autres techniques (comme l'analyse factorielle).

mindmatters
la source
(-1) Je ne comprends pas: sont-ils équivalents ou non, selon vous? Si oui, comment peuvent-ils éventuellement différer quant à leur application?
amibe dit Réintégrer Monica