Interpréter les coefficients de régression après diverses différences

10

Il y a peu d'explications que je peux trouver qui décrivent comment interpréter les coefficients de régression linéaire après avoir différencié une série chronologique (pour éliminer une racine unitaire). Est-ce si simple qu'il n'est pas nécessaire de le déclarer formellement?

(Je suis au courant de cette question , mais je ne savais pas à quel point sa réponse était générale).

Disons que nous sommes intéressés par le modèle où est peut-être ARMA (p, q). Ce sont les , , ... qui sont intéressants. Plus précisément, l'interprétation en termes de "un changement d'une unité dans entraîne un changement moyen dans de " pourYt=β0+β1X1t+β2X2t++...+βpXpt+δtδtβ1β2βpXiYtβii=1...p.

Supposons maintenant que nous devons différencier raison de la non-stationnarité suspectée d'une racine unitaire (par exemple, test ADF). Il nous faut alors également différencier de la même manière, chacun des .YtXit

Quelle est l'interprétation du si:βi

  1. La première différence est prise de et de chacun des ?YtYtXit
  2. La deuxième différence (différence de la différence) ( ) est prise de Y_ {t} et de chacun des X_ {it} ?YtYtXit
  3. Une différence saisonnière (par exemple (1B12) pour les données mensuelles) est prise de Yt et de chacun des Xit ?

EDIT 1

J'ai trouvé un texte qui mentionne les différences et l'interprétation des coefficients et cela ressemble beaucoup à la question liée. Ceci est de Alan Pankratz Forecasting avec Dynamic Regression pages 119-120:

entrez la description de l'image ici entrez la description de l'image ici

B_Miner
la source
Puis-je supposer que les séries chronologiques sont mensuelles? Que les Y et les X sont des transformations logarithmiques des variables économiques?
La question concerne davantage l'interprétation générale et si diverses formes de différenciation, peut-être avec des erreurs ARMA, modifient l'interprétation de la régression non différenciée. Donc, non non connecté :)
B_Miner
Oui, mais l'interprétation peut être aussi simple que est l'augmentation de la croissance de pour une augmentation unitaire de la croissance de . Où «croissance» est la croissance d'un mois à l'autre pour votre première question et la «croissance d'une année à l'autre» pour votre question. La croissance est la croissance absolue de y mais si y est la transformation logarithmique de alors c'est la croissance relative de z. Est-ce une telle interprétation que vous demandez? β1yx1z
Ce commentaire ajoute à ma confusion sur le sujet. Je trouve des exemples où l'interprétation ne change pas du tout parce que les bêtas sont inchangés après la différenciation, mais vous laissez entendre (je pense) qu'il faut utiliser le mot croissance qui implique (je pense) que l'interprétation change pour les données différenciées ( changer en Y, changer en X).
B_Miner
1
Réponse quelque peu connexe ici .
Richard Hardy

Réponses:

10

Prenons un exemple avec une variable indépendante car c'est plus facile à taper.

Lorsque vous commencez à partir de il en va de même pour . yt=β0+β1xtyt1=β0+β1xt1

Donc, si je soustrais les deux, j'obtiens . Par conséquent, l'interprétation du coefficient ne change pas , c'est la même dans chacune de ces équations.Δy=β1Δx β1 β1

Mais l'interprétation de l' équation n'est pas la même que l'interprétation de l' équation . C'est ce que je veux dire.yt=β0+β1xt Δy=β1Δx

Donc est le changement de pour un changement d'unité de mais est-ce aussi le changement de la croissance de pour un changement d'unité de la croissance de .β1yxyx

La raison de la différenciation est «technique»: si les séries ne sont pas stationnaires, je ne peux pas estimer avec OLS. Si les séries différenciées sont stationnaires, je peux utiliser l'estimation de de l'équation comme une estimation de dans l'équation , car elle est le même .yt=β0+β1xtβ1Δy=β1Δxβ1yt=β0+β1xt β1

La différenciation est donc une astuce «technique» pour trouver une estimation de dans lorsque les séries ne sont pas stationnaires. L'astuce utilise le fait que le même apparaît dans l'équation différenciée.β1yt=β0+β1xt β1

Évidemment, ce n'est pas différent s'il y a plus d'une variable indépendante.

Remarque: tout cela est une conséquence de la linéarité du modèle, si alors , donc le est en même temps le changement de pour une unité changement de mais aussi le changement de la croissance de y pour un changement unitaire de la croissance de , il en est de même .y=αx+βΔy=αΔxαyxxα


la source
L'interprétation se fait donc dans les deux sens. Mais le point principal est que s'il y a une différenciation (tout type des trois dans ma question ou des combinaisons de ceux-ci), la version bêta non différenciée d'origine est toujours estimée (de sorte que la question de recherche originale d'intérêt est toujours disponible). Correct? Est-ce toujours valable s'il y a des erreurs Arma?
B_Miner
Eh bien, si vous estimez le partir de l'équation différenciée, alors ce estimé est également une estimation du dans l'équation indifférenciée (car il s'agit du même ). Le fait est que, dans l'équation pour laquelle vous faites l'estimation, la série doit être stationnaire, alors tout va bien (sinon vous n'obtenez pas d'estimateurs avec des propriétés souhaitables comme l'impartialité). Un inconvénient est bien sûr que vous ne pouvez pas estimer de cette manière, donc si vous voulez une estimation pour vous devrez regarder la co-intégration. β1β^1β1β1β0β0
Une interception est rarement intéressante bien qu'il semble, plus important est le B1 à BP qui sont les coefficients des variables d'intérêt continues ou fictives. Et juste pour clarifier, rien ne change à cet égard si les erreurs ne sont pas iid mais nous utilisons des erreurs ARMA? Je suppose que l'on doit considérer que dans l'interprétation avec ou sans différences correctes (car «toutes choses étant égales par ailleurs» comprend les valeurs décalées (avec AR) de y contrôlées)?
B_Miner
1
Les erreurs ARMA ne changent rien à l'interprétation. Le seul problème technique est qu'après la différenciation, vous devez avoir des séries stationnaires, sinon l'estimation de est biaisée, donc si vous avez des erreurs ARMA mais après la différenciation, vous obtenez des séries stationnaires, alors à mon avis, tout va bien. β1
1
Pour la différenciation saisonnière, vous obtenez également le même dans l'équation différenciée que dans l'équation «d'origine», donc tout reste valide. En fait, quoi que vous fassiez, tant que vous pouvez montrer qu'après les manipulations vous avez le même le raisonnement reste valable. β1β1
0

Prenez la fonction de transfert finale et ré-exprimez-la comme une pure équation de droite. Sous cette forme, ce sera un PDL ou un ADL. L'interprétation suivra alors comme d'habitude. J'ai implémenté cette option dans AUTOBOX et l'ai appelée côté DROIT. Si vous publiez un ensemble de données et le modèle que vous souhaitez utiliser, je serai heureux de publier les résultats.

ÉDITÉ: POUR PRÉSENTER UN EXEMPLE ILLUSTRATIF POUR TESTER L'HYPOTHÈSE DE COEFFICIENTS ÉGAUX:

J'ai pris le jeu de données GASX (X d'abord puis Y) du texte de Box-Jenklins disponible ici http://www.autobox.com/stack/GASX.ASC et estimé une fonction de transfert sur la série indifférenciée et obtenuentrez la description de l'image ici

J'ai ensuite introduit une différenciation simple sur Y et X et obtenu entrez la description de l'image ici. L'hypothèse selon laquelle les coefficients sont les mêmes est rejetée. Les coefficients sont similaires mais certainement pas les mêmes. J'ai ensuite essayé d'introduire un coefficient MA (proche de 1.) pour terminer l'exercice algébrique de multiplication par [1-B] mais cela n'a pas non plus reproduit les résultats non différenciés.

En résumé: la réponse est qu'ils sont différents, mais cela peut être dû au entrez la description de l'image iciterme constant omis dans le cas indifférencié.

J'ai décidé de simuler deux séries de bruit blanc (X1 et Y1) et d'estimer pour elles un modèle OLS sans terme constant et obtenu. J'ai ensuite intégré les séries X1 et Y1 white nosie et obtenu deux nouvelles séries (X2 et Y2). Ce qui suit est le résultat d'un modèle OLS pour X2 ET Y2 [ entrez la description de l'image ici] [4 Le coefficient de régression résultant est presque identique (petite variation due à 1 observation de moins dans l'étude X2, Y2. Ainsi je peux conclure que le cas est prouvé (ou non rejetée) que les coefficients de régression sont comparables. Notez que lorsque j'ai introduit une constante dans (X1 contre Y1), le coefficient de régression n'était pas le même. les résultats sont en accord avec @f coppens.

IrishStat
la source
Je ne suis pas - fonction de transfert? Pouvez-vous montrer ce que vous voulez dire?
B_Miner du
Une fonction de transfert générale prend la forme: Yt = μ + [(ω0 − ω1B1 −.....− ωsBs) / 1 − δ1B1 −... δrBr)] Xt − b + et où et peut avoir une structure arima
IrishStat
Dois-je déduire de votre réponse que l'interprétation du change en fait avec la différenciation? Je ne sais pas comment construire une fonction de transfert à partir de ce que j'ai dans ma question. βi
B_Miner
L'interprétation de βi en l'absence de différenciation est que le niveau de Y est affecté tandis que si la différenciation est en place, le changement de Y est affecté.
IrishStat
Regardez le lien dans ma question. Il semble dire ici que l'interprétation d'un modèle différencié est exactement la même que les niveaux. Voulez-vous dire que ce n'est pas le cas? Je suis confus par ce qui semble être des différences (sans jeu de mots) dans les réponses.
B_Miner