Je vois un modèle de régression qui régresse les rendements des indices boursiers sur douze mois (12 mois) Rendements annuels du même indice boursier, écart de crédit (différence entre la moyenne mensuelle des obligations sans risque et des obligations de sociétés) taux d'inflation en glissement annuel et indice de production industrielle en glissement annuel.
Il ressemble ainsi (bien que vous substitueriez les données spécifiques à l'Inde dans ce cas):
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY est le rendement annuel de l'indice SP500 Pour calculer cela, la moyenne mensuelle des valeurs SP500 est calculée puis convertie en rendements annuels pour chaque mois (c.-à-d. Janvier 2010-janvier 2011, février 2010- Feb'11, Mar'10-Mar'11,...). Du côté des variables explicatives, une valeur décalée de 12 mois du SP500YOY est utilisée avec le CREDITSPREAD au temps T et INFLATION et INDUSTRIALPRODUCTION deux périodes à venir. L'INFLATIONASYMM est un indice pour savoir si l'inflation est supérieure à une valeur seuil de 5,0%. L'index entre parenthèses montre l'indice de temps pour chaque variable.
Ceci est estimé par régression linéaire OLS standard. Pour utiliser ce modèle pour prévoir les rendements YOY à 1,2 et 3 mois à venir de SP500, il faut générer des prévisions à 3, 4 et 5 mois pour l'inflation et l'indice de la production industrielle. Ces prévisions sont faites après l'ajustement d'un modèle ARIMA à chacun des deux individuellement. Les prévisions CreditSpread pour 1, 2 et 3 mois à venir ne sont que des estimations mentales.
Je voudrais savoir si cette régression linéaire OLS est correcte / incorrecte, efficace / inefficace ou une pratique statistique généralement valide.
Le premier problème que je vois est celui de l'utilisation de données qui se chevauchent. c'est-à-dire que les valeurs quotidiennes de l'indice boursier sont moyennées chaque mois, puis utilisées pour calculer les rendements annuels qui sont reconduits mensuellement. Cela devrait rendre le terme d'erreur autocorrélé. Je pense qu'il faudrait utiliser une certaine «correction» sur le modèle de l'un des éléments suivants:
- Estimateur de covariance cohérente à hétéroscédasticité de White
- Estimateur de l'hétéroscédasticité et de l'autocorrélation de Newey & West (HAC)
- version cohérente de l'hétéroscédasticité de Hansen & Hodrick
Est-il vraiment judicieux d'appliquer une régression linéaire OLS standard (sans aucune correction) à ces données qui se chevauchent, et plus encore, d'utiliser des prévisions ARIMA à 3 périodes pour les variables explicatives à utiliser dans la régression linéaire OLS d'origine pour prévoir SP500YOY? Je n'ai jamais vu une telle forme auparavant et je ne peux donc pas vraiment la juger, à l'exception de la correction pour l'utilisation d'observations qui se chevauchent.
la source
Réponses:
Voici quelques articles qui traitent de ce sujet:
Britten-Jones et Neuberger, amélioration de l'inférence et de l'estimation en régression avec chevauchement des observations
Harri & Brorsen, le problème des données qui se chevauchent
la source