Pourquoi l'estimateur OLS du coefficient AR (1) est-il biaisé?

11

J'essaie de comprendre pourquoi OLS donne un estimateur biaisé d'un processus AR (1). Considérez Dans ce modèle, l'exogénéité stricte est violée, c'est-à-dire que et sont corrélés mais et sont pas corrélés. Mais si cela est vrai, pourquoi la dérivation simple suivante ne tient-elle pas? ytεtyt-1εtplim β

yt=α+βyt1+ϵt,ϵtiidN(0,1).
ytϵtyt1ϵt
plim β^=Cov(yt,yt1)Var(yt1)=Cov(α+βyt1+ϵt,yt1)Var(yt1)=β+Cov(ϵt,yt1)Var(yt1)=β.
Florestan
la source
Il y a eu quelques questions connexes à Cross Validated. Vous pourriez bénéficier de les rechercher.
Richard Hardy
Je les ai vus, mais ils ne m'ont pas vraiment aidé. J'ai trouvé une preuve et des simulations qui montrent ce résultat. Ce qui m'intéresse, c'est ce qui ne va pas avec mon raisonnement ci-dessus.
Florestan
1
Lorsque vous utilisez , ne parlez-vous pas de cohérence plutôt que de (dé) biais? En cas de (non) biais, vous devez utiliser les attentes. plim
Richard Hardy
Vous avez tout à fait raison, cela pourrait résoudre le casse-tête. Donc, si l'équation ci-dessus ne tient pas sans plim, elle ne contredirait pas la polarisation de l'OLS dans de petits échantillons et montrerait la cohérence de l'OLS en même temps. Bien que je sois un peu incertain: cette formule de covariance sur la variance ne vaut-elle vraiment que pour le plim et pas aussi dans l'attente? Merci beaucoup déjà!
Florestan du
1
L'estimateur OLS lui-même n'implique aucun s, vous devez simplement regarder les attentes dans les échantillons finis. plim
Richard Hardy

Réponses:

10

Comme cela a été essentiellement discuté dans les commentaires, l'impartialité est une propriété d'échantillon fini, et si elle se maintenait, elle serait exprimée comme suit:

E(β^)=β

(où la valeur attendue est le premier moment de la distribution des échantillons finis)

tandis que la cohérence est une propriété asymptotique exprimée en

plimβ^=β

L'OP montre que même si l'OLS dans ce contexte est biaisé, il est toujours cohérent.

E(β^)βbutplimβ^=β

Pas de contradiction ici.

Alecos Papadopoulos
la source
6

@Alecos explique bien pourquoi un plim correct et un impartialité ne sont pas les mêmes. Quant à la raison sous-jacente pour laquelle l'estimateur n'est pas sans biais, rappelons que le caractère sans biais d'un estimateur nécessite que tous les termes d'erreur soient des moyennes indépendantes de toutes les valeurs du régresseur, .E(ϵ|X)=0

Dans le cas présent, la matrice de régresseur se compose des valeurs , de sorte que - voir le commentaire de mpiktas - la condition se traduit par pour tout . E ( ϵ s | y 1 , , y T - 1 ) = 0 s = 2 , , Ty1,,yT1E(ϵs|y1,,yT1)=0s=2,,T

Ici nous avons

yt=βyt1+ϵt,
Même dans l'hypothèse nous avons que Mais, est aussi un régresseur pour les valeurs futures dans un modèle AR, comme .E(ϵtyt1)=0
E(ϵtyt)=E(ϵt(βyt1+ϵt))=E(ϵt2)0.
ytyt+1=βyt+ϵt+1
Christoph Hanck
la source
3
J'ajouterais la clarification que dans ce cas se traduit par pour chaque . Ensuite, la discussion ultérieure devient un peu plus claire. E(ε|X)E(εs|y1,...,yT)s
mpiktas
bon point, j'ai fait un montage
Christoph Hanck
3

Élargir deux bonnes réponses. Notez l'estimateur OLS:

β^=β+t=2Tyt1εtt=2Tyt12

Pour l'impartialité dont nous avons besoin

E[t=2Tyt1εtt=2Tyt12]=0.

Mais pour cela, nous avons besoin que pour chaque . Pour le modèle AR (1), cela échoue clairement, car est lié aux futures valeurs .E(εt|y1,...,yT1)=0,tεtyt,yt+1,...,yT

mpiktas
la source
Juste pour vérifier si j'ai bien compris: le problème n'est pas le numérateur, pour chaque t et sont pas corrélés. Le problème est le dénominateur qui présente des t plus élevés de telle sorte qu'il existe une corrélation entre le numérateur et le dénominateur de sorte que je ne peux pas prendre l'espérance dans la somme du numérateur (sous une exogénéité stricte, je pourrais le faire?!). Est-ce l'intuition mathématique correcte? ϵ tyt1ϵt
Florestan
Oui, c'est l'intuition correcte. Notez que l'exogénéité stricte n'est pas possible dans ce cas, mais pour l'impartialité, l'exogénéité stricte devient une exigence.
mpiktas