Comment interpréter ma régression avec les premières variables différenciées?

17

J'ai deux séries chronologiques:

  1. Un proxy de la prime de risque de marché (ERP; ligne rouge)
  2. Le taux sans risque, fondé sur une obligation d'État (ligne bleue)

Proxy de prime de risque et taux sans risque dans le temps

Je veux tester si le taux sans risque peut expliquer l'ERP. Par la présente, j'ai essentiellement suivi les conseils de Tsay (2010, 3e édition, p. 96): Financial Time Series:

  1. Ajuster le modèle de régression linéaire et vérifier les corrélations en série des résidus.
  2. Si la série résiduelle est une non-stationnarité racine unitaire, prenez la première différence entre les variables dépendantes et explicatives.

En faisant la première étape, j'obtiens les résultats suivants:

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)     6.77019    0.25103   26.97   <2e-16 ***
Risk_Free_Rate -0.65320    0.04123  -15.84   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Comme attendu sur la figure, la relation est négative et significative. Cependant, les résidus sont corrélés en série:

Fonction ACF des résidus de la régression du taux sans risque sur ERP

Par conséquent, je différencie d'abord la variable dépendante et la variable explicative. Voici ce que j'obtiens:

Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
(Intercept)    -0.002077   0.016497  -0.126      0.9    
Risk_Free_Rate -0.958267   0.053731 -17.834   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Et l'ACF des résidus ressemble à:

Fonction ACF des résidus de la régression du taux sans risque sur ERP (différenciée)

Ce résultat est superbe: tout d'abord, les résidus ne sont plus corrélés. Deuxièmement, la relation semble désormais plus négative.

Voici mes questions (vous vous êtes probablement déjà demandé ;-) La première régression, je l'aurais interprétée comme (problèmes économétriques mis à part) "si le taux sans risque augmente d'un point de pourcentage, l'ERP baisse de 0,65 point de pourcentage." En fait, après avoir réfléchi à ce sujet pendant un certain temps, j'interpréterais la même régression de la même manière (ce qui entraîne maintenant une baisse de 0,96 point de pourcentage). Cette interprétation est-elle correcte? C'est bizarre de transformer mes variables, mais je n'ai pas à changer mon interprétation. Si cela est cependant correct, pourquoi les résultats changent-ils? Est-ce simplement le résultat de problèmes économétriques? Si oui, quelqu'un a-t-il une idée pourquoi ma deuxième régression semble être encore "meilleure"? Normalement, je lis toujours que vous pouvez avoir de fausses corrélations qui disparaissent après l'avoir fait correctement. Ici,

Christoph_J
la source

Réponses:

23

yt=β0+β1xt+β2t+ϵt.
yt1β0+β1xt1+β2(t1)+ϵt1yt1
Δyt=β1Δxt+β2+Δϵt.
Δxβ1 dans le modèle original.

ϵt=s=0t1νs,
νs soit du bruit blanc, l'erreur différenciée est du bruit blanc.

ϵ sont déjà du bruit blanc (Un AR (1) avec un coefficient de corrélation de 0 si vous le souhaitez), alors la différenciation induit une corrélation sérielle entre les erreurs.

Pour ces raisons, il est important de ne différencier que les processus non stationnaires en raison des racines unitaires et d'utiliser la tendance à la dérive pour les processus stationnaires dits de tendance.

(Une racine unitaire fait changer la variance d'une série et elle explose en fait au fil du temps; la valeur attendue de cette série est cependant constante. Un processus stationnaire de tendance a les propriétés opposées.)

Charlie
la source
Excellente réponse, merci pour l'explication. Ça aide beaucoup.
Christoph_J
2
+1 La dernière phrase est dorée, et j'aurais aimé la voir clairement si la première fois que j'ai rencontré l'idée de différenciation.
Wayne
ϵ
Grands points, @cardinal. Des modifications ont été apportées. J'espère qu'ils clarifient les choses.
Charlie
1
yyxxxyxyt1
2

La première différenciation supprime les tendances linéaires qui semblent persister dans vos résidus d'origine. Il semble que la première différenciation ait supprimé la tendance des résidus et vous vous retrouvez avec des résidus essentiellement non corrélés. Je pense que la tendance des résidus a peut-être caché une partie de la relation négative entre l'ERP et le taux sans risque et que ce serait la raison pour laquelle le modèle montre une relation plus forte après différenciation.

Michael R. Chernick
la source