Régression des séries chronologiques avec chevauchement des données

13

Je vois un modèle de régression qui régresse les rendements des indices boursiers sur douze mois (12 mois) Rendements annuels du même indice boursier, écart de crédit (différence entre la moyenne mensuelle des obligations sans risque et des obligations de sociétés) taux d'inflation en glissement annuel et indice de production industrielle en glissement annuel.

Il ressemble ainsi (bien que vous substitueriez les données spécifiques à l'Inde dans ce cas):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +    
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)

SP500YOY est le rendement annuel de l'indice SP500 Pour calculer cela, la moyenne mensuelle des valeurs SP500 est calculée puis convertie en rendements annuels pour chaque mois (c.-à-d. Janvier 2010-janvier 2011, février 2010- Feb'11, Mar'10-Mar'11,...). Du côté des variables explicatives, une valeur décalée de 12 mois du SP500YOY est utilisée avec le CREDITSPREAD au temps T et INFLATION et INDUSTRIALPRODUCTION deux périodes à venir. L'INFLATIONASYMM est un indice pour savoir si l'inflation est supérieure à une valeur seuil de 5,0%. L'index entre parenthèses montre l'indice de temps pour chaque variable.

Ceci est estimé par régression linéaire OLS standard. Pour utiliser ce modèle pour prévoir les rendements YOY ​​à 1,2 et 3 mois à venir de SP500, il faut générer des prévisions à 3, 4 et 5 mois pour l'inflation et l'indice de la production industrielle. Ces prévisions sont faites après l'ajustement d'un modèle ARIMA à chacun des deux individuellement. Les prévisions CreditSpread pour 1, 2 et 3 mois à venir ne sont que des estimations mentales.

Je voudrais savoir si cette régression linéaire OLS est correcte / incorrecte, efficace / inefficace ou une pratique statistique généralement valide.

Le premier problème que je vois est celui de l'utilisation de données qui se chevauchent. c'est-à-dire que les valeurs quotidiennes de l'indice boursier sont moyennées chaque mois, puis utilisées pour calculer les rendements annuels qui sont reconduits mensuellement. Cela devrait rendre le terme d'erreur autocorrélé. Je pense qu'il faudrait utiliser une certaine «correction» sur le modèle de l'un des éléments suivants:

  • Estimateur de covariance cohérente à hétéroscédasticité de White
  • Estimateur de l'hétéroscédasticité et de l'autocorrélation de Newey & West (HAC)
  • version cohérente de l'hétéroscédasticité de Hansen & Hodrick

Est-il vraiment judicieux d'appliquer une régression linéaire OLS standard (sans aucune correction) à ces données qui se chevauchent, et plus encore, d'utiliser des prévisions ARIMA à 3 périodes pour les variables explicatives à utiliser dans la régression linéaire OLS d'origine pour prévoir SP500YOY? Je n'ai jamais vu une telle forme auparavant et je ne peux donc pas vraiment la juger, à l'exception de la correction pour l'utilisation d'observations qui se chevauchent.

Vishal Belsare
la source
S'il vous plaît ne pas cross-post .
Joshua Ulrich

Réponses:

10

Voici quelques articles qui traitent de ce sujet:

Britten-Jones et Neuberger, amélioration de l'inférence et de l'estimation en régression avec chevauchement des observations

Harri & Brorsen, le problème des données qui se chevauchent

R_Coholic
la source
1
Il ne ressort pas très clairement de ces articles comment appliquer ces corrections dans la pratique. Existe-t-il une procédure pas à pas plus pratique ou un didacticiel quelque part?
rinspy
@rinspy Voir quant.stackexchange.com/questions/35216/… pour un code sur Hansen & Hodrick
Candamir
5
Pouvez-vous fournir un résumé des informations contenues dans ces articles et comment ils apportent une solution à la question?
gung - Rétablir Monica