Pourquoi est-il valable de dissuader les séries chronologiques de régression?

14

Cela peut être une question étrange du tout, mais en tant que novice sur le sujet, je me demande pourquoi utilisons-nous la régression pour détrôner une série chronologique si l'une des hypothèses de la régression est que les données devraient iid tandis que les données sur lesquelles la régression est appliquée sont un non iid?

FarrukhJ
la source
6
Il n'est généralement pas vrai que nous faisons l'hypothèse que les «données» sont iid
Christoph Hanck
3
Que voulez-vous dire précisément par détend ?
Matthew Gunn
6
Je n'ai pas le temps d'écrire une bonne réponse / documenter cela, mais en général, la corrélation sérielle ne biaise pas les résultats d'une régression linéaire (elle modifie le calcul approprié des erreurs standard, des intervalles de confiance, etc.). Cela rend l'approche classique en deux étapes (détend, puis analyse pour la corrélation) sensible. (par exemple, une recherche sur Google de la "régression linéaire sans corrélation série conduit à fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Ben Bolker
2
Peut-être plus important encore , l'OLS estimateur du coefficient sur une tendance linéaire converge tout un ordre de grandeur plus rapide (à un taux ) à sa valeur réelle que pour les régresseurs fixes ( n - une / 2 ), ce qui signifie que peut constamment estimer la tendance même si vous négligez les variables stationnaires. Cela contraste avec l'estimation des effets des variables stationnaires une par une, où vous perdez de la cohérence si vous omettez des variables. n3/2n1/2
Richard Hardy

Réponses:

15

Vous êtes astucieux en sentant qu'il peut y avoir un conflit entre les hypothèses classiques de régression linéaire des moindres carrés ordinaires et la dépendance en série communément trouvée dans le cadre des séries chronologiques.

Prenons l'hypothèse 1.2 (Exogénéité stricte) de l' économétrie de Fumio Hayashi .

E[ϵiX]=0

Cela implique à son tour , que tout résidu ϵ i est orthogonal à tout régresseur x j . Comme le souligne Hayashi, cette hypothèse est violée dans le modèle autorégressif le plus simple . [1] Considérons le processus AR (1):E[ϵixj]=0ϵixj

yt=βyt1+ϵt

On peut voir que sera un régresseur pour y t + 1 , mais ϵ t n'est pas orthogonal à y t (ie E [ ϵ t y t ] 0 ).ytyt+1ϵtytE[ϵtyt]0

Puisque l'hypothèse stricte d'exogénéité est violée, aucun des arguments qui s'appuient sur cette hypothèse ne peut être appliqué à ce modèle AR (1) simple!

Nous avons donc un problème insoluble?

Non, non! L'estimation des modèles AR (1) avec les moindres carrés ordinaires est un comportement standard entièrement valide. Pourquoi cela peut-il encore être ok?

Un large échantillon, des arguments asymptotiques n'ont pas besoin d'une exogénéité stricte. Une hypothèse suffisante (qui peut être utilisée à la place d'une exogénéité stricte) est que les régresseurs sont prédéterminés , que les régresseurs sont orthogonaux au terme d'erreur contemporain. Voir le chapitre 2 de Hayashi pour un argument complet.

Les références

[1] Fumio Hayashi, Econométrie (2000), p. 35

[2] ibid., P. 134

Matthew Gunn
la source
6

Les méthodes de régression de type moindres carrés de base ne supposent pas que les valeurs y sont iid Elles supposent que les résidus (c'est-à-dire la valeur y moins la tendance vraie) sont iid

Il existe d'autres méthodes de régression qui font des hypothèses différentes, mais cela compliquerait probablement trop cette réponse.

Geoffrey Brent
la source
5
Hypothèse qui est aussi clairement fausse: il suffit de penser à une série chronologique à la fois linéaire et saisonnière. Les résidus résiduels de la régression linéaire sont clairement corrélés, donc pas iid.
DeltaIV
3

C'est une bonne question! Le problème n'est même pas mentionné dans mes livres de séries chronologiques (j'ai probablement besoin de meilleurs livres :) Tout d'abord, notez que vous n'êtes pas obligé d'utiliser la régression linéaire pour décourager une série chronologique, si la série a une tendance stochastique (racine unitaire )- vous pourriez simplement prendre la première différence. Mais vous devez utiliser la régression linéaire, si la série a une tendance déterministe. Dans ce cas, il est vrai que les résidus ne sont pas iid, comme vous le dites. Pensez simplement à une série qui a une tendance linéaire, des composantes saisonnières, des composantes cycliques, etc. ensemble - après une régression linéaire, les résidus sont presque indépendants. Le fait est que vous n'utilisez pas ensuite la régression linéaire pour faire des prédictions ou pour former des intervalles de prédiction. C'est juste une partie de votre procédure d'inférence: vous devez toujours appliquer d'autres méthodes pour arriver à des résidus non corrélés. Ainsi, alors que la régression linéaire en soi n'est pas une procédure d'inférence valide (ce n'est pas le bon modèle statistique) pour la plupart des séries chronologiques, une procédure qui inclut une régression linéaire car l'une de ses étapes peut être un modèle valide, si le modèle qu'elle suppose correspond au processus de génération de données pour la des séries chronologiques.

DeltaIV
la source
3
Ne différenciez pas si vous avez une tendance déterministe - la différenciation n'est appropriée que pour les tendances stochastiques (racines unitaires). Si vous différenciez une série sans racine unitaire, vous introduirez le type d'erreur moyenne mobile intégrée dans le modèle, et c'est désagréable.
Richard Hardy
1
Je pense que vous voulez dire la différence, pas la différenciation.
Hong Ooi
@RichardHardy intéressant. Que voulez-vous dire par «tendance stochastique»? Voulez-vous dire des cycles? Voudraisyt=β0+β1yt-1+ϵtavoir une tendance stochastique ou déterministe selon votre définition?
DeltaIV
1
@HongOoi, oui, mon mauvais, je voulais dire la différenciation, pas la différenciation. DeltaIV, une série chronologique aurait une tendance stochastique si la série chronologique est un processus intégré (= racine unitaire). Il s'agit d'un terme standard dans la littérature sur les racines unitaires et la cointégration. Je me demande s'il a des significations différentes dans d'autres volets de la littérature. Dans tous les cas, la sur-différenciation (= différenciation d'une série chronologique qui n'a pas de racine unitaire) est un phénomène notoire, et il convient de l'éviter.
Richard Hardy
@RichardHardy ok, merci. Je vais essayer de me documenter sur la définition du processus intégré et des racines unitaires. Pour commencer, pouvez-vous me dire si la série que j'ai proposée est intégrée ou non? Les racines auxquelles vous vous référez, les racines du polynômey=β0+betune1X1?
DeltaIV