Quelle est votre intuition / interprétation d'une distribution de valeurs propres d'une matrice de corrélation? J'ai tendance à entendre que généralement les 3 valeurs propres les plus importantes sont les plus importantes, tandis que celles proches de zéro sont du bruit. En outre, j'ai vu quelques articles de recherche sur la façon dont les distributions de valeurs propres se produisant naturellement diffèrent de celles calculées à partir de matrices de corrélation aléatoires (encore une fois, en distinguant le bruit du signal).
N'hésitez pas à développer vos idées.
distributions
correlation
Eduardas
la source
la source
Réponses:
J'ai tendance à entendre que généralement les 3 valeurs propres les plus importantes sont les plus importantes, tandis que celles proches de zéro sont le bruit
Vous pouvez tester cela. Voir l'article lié dans cet article pour plus de détails. Encore une fois, si vous traitez avec des séries chronologiques financières, vous voudrez peut-être d'abord corriger la leptokurticité (c.-à-d. Considérer la série de rendements ajustés en fonction du marché, pas les rendements bruts).
J'ai vu quelques articles de recherche enquêter sur la façon dont les distributions de valeurs propres d'origine naturelle diffèrent de celles calculées à partir de matrices de corrélation aléatoires (encore une fois, en distinguant le bruit du signal).
Edward:> Habituellement, on le ferait dans l'autre sens: regardez la distribution multivariée des valeurs propres (des matrices de corrélation) provenant de l'application que vous voulez. Une fois que vous avez identifié un candidat crédible pour la distribution des valeurs propres, il devrait être assez facile de générer à partir d'eux.
La meilleure procédure pour identifier la distribution multivariée de vos valeurs propres dépend du nombre d'actifs que vous souhaitez considérer simultanément (c'est-à-dire quelles sont les dimensions de votre matrice de corrélation). Il y a une astuce intéressante si ( étant le nombre d'actifs).pp≤10 p
Modifier (commentaires de Shabbychef)
procédure en quatre étapes:
Une limitation est que le calcul rapide de la coque convexe d'une série de points devient extrêmement lent lorsque le nombre de dimensions est supérieur à 10.J≥2
la source
Les valeurs propres donnent l'ampleur des principales composantes de la diffusion des données.
la source
Habituellement, le premier portefeuille propre a une pondération presque égale dans chaque nom, c'est-à-dire le portefeuille «marché» composé de tous les actifs avec des pondérations égales en dollars. Le deuxième portefeuille propre peut avoir une signification sémantique, selon la période de temps que vous examinez: par exemple, principalement les actions énergétiques, ou les actions bancaires, etc. et cela dépend en partie de la sélection de l'univers et de la période considérée. C'est très bien car généralement la cinquième valeur propre n'est pas trop loin au-delà des limites imposées par la distribution de Marchenko-Pastur.
la source
la source