Dans deux articles en 1986 et 1988 , Connor et Korajczyk ont proposé une approche pour modéliser les rendements des actifs. Étant donné que ces séries chronologiques ont généralement plus d'actifs que les observations de période, ils ont proposé d'effectuer une ACP sur les covariances transversales des rendements des actifs. Ils appellent cette méthode l'analyse des composants principaux asymptotiques (APCA, ce qui est assez déroutant, car le public pense immédiatement aux propriétés asymptotiques de l'ACP).
J'ai élaboré les équations, et les deux approches semblent numériquement équivalentes. Les asymptotiques diffèrent bien sûr, car la convergence est prouvée pour plutôt que . Ma question est: quelqu'un a-t-il utilisé APCA et comparé à PCA? Y a-t-il des différences concrètes? Si oui, lesquels?
la source
Réponses:
Il n'y a absolument aucune différence.
Il n'y a absolument aucune différence entre l'ACP standard et ce que C&K a suggéré et appelé "ACP asymptotique". Il est assez ridicule de lui donner un nom distinct.
Voici une courte explication de l'ACP. Si des données centrées avec des échantillons en lignes sont stockées dans une matrice de données , alors PCA recherche les vecteurs propres de la matrice de covariance et projette les données sur ces derniers vecteurs propres pour obtenir les principaux composants. De manière équivalente, on peut considérer une matrice de Gram, . Il est facile de voir qu'il a exactement les mêmes valeurs propres, et ses vecteurs propres sont des PC à l'échelle. (Ceci est pratique lorsque le nombre d'échantillons est inférieur au nombre de fonctions.)1X 11NX⊤X 1NX X⊤
Il me semble que ce que C&K a suggéré, c'est de calculer des vecteurs propres de la matrice de Gram afin de calculer les composants principaux. Eh bien, wow. Ce n'est pas "équivalent" à PCA; il est PCA.
Pour ajouter à la confusion, le nom "ACP asymptotique" semble se référer à sa relation avec l'analyse factorielle (AF), pas avec l'ACP! Les documents originaux de C&K sont sous paywall, voici donc une citation de Tsay, Analysis of Financial Time Series, disponible sur Google Books:
Ce que cela signifie vraiment, c'est que lorsque , PCA donne la même solution que FA. C'est un fait facile à comprendre sur PCA et FA, et cela n'a rien à voir avec ce que C&K a suggéré. J'en ai discuté dans les discussions suivantes:k → ∞
Le résultat est donc le suivant: C&K a décidé d'inventer le terme "PCA asymptotique" pour PCA standard (qui pourrait également être appelé "FA asymptotique"). J'irais jusqu'à recommander de ne jamais utiliser ce terme.
la source
En général, APCA est utilisé lorsqu'il y a beaucoup de séries mais très peu d'échantillons. Je ne décrirais pas APCA comme meilleur ou pire que PCA, en raison de l'équivalence que vous avez notée. Ils diffèrent cependant par le moment où les outils sont applicables. C'est la perspicacité du papier: vous pouvez inverser la dimension si c'est plus pratique! Donc, dans l'application que vous avez mentionnée, il y a beaucoup d'actifs, donc vous auriez besoin d'une longue série chronologique pour calculer une matrice de covariance, mais maintenant vous pouvez utiliser APCA. Cela dit, je ne pense pas que APCA soit appliqué très souvent car vous pouvez essayer de réduire la dimensionnalité en utilisant d'autres techniques (comme l'analyse factorielle).
la source