OLS:

8

Supposons que sont des séries chronologiques avec , ( et est similaire à celle de , mais change lorsque le mannequin = 1). et , . Dans un contexte réel, il s'agira de rendements boursiers périodiques sur entreprises (mais vous pouvez ignorer cela). Il existe un mannequin, qui est égal à l'unité sur et égal à zéro sinon. Le modèle de série chronologique à estimer avec OLS est:Xit,YitXitN(0.1,1)σ2(Yit)=1mean(Yit)Xitt{1,2,...,200}i{1,2,...,N}NDtt{150,151,...,200}i

(1)Yit=αi+βiXit+γiDt+ϵit

Ce modèle adhère généralement aux hypothèses de Gauss-Markov pour chaque . Cependant, nous avons pour tout et .iE[ϵitTϵjt]0ij

L'étape suivante consiste à construire un vecteur de gammas en utilisant les estimations du modèle . Appelez ce vecteur . Nous utilisons ensuite ceci dans le modèle transversal:N(1)γ^

(2)γ^i=a+bZi+ui

où est une variable transversale qui ne provoque aucune violation des hypothèses OLS et est pertinente pour expliquer .Ziγ^i


Dans la littérature sur l'économétrie appliquée, l'affirmation est que dans le modèle n'entraîne (i) aucun problème pour les estimations du coefficient OLS dans , mais (ii) Erreurs standard biaisées dans .E[ϵitTϵjt]0(1)(2)(2)

  • Quelqu'un peut-il s'il vous plaît poster des idées sur les raisons de ce cas?

  • Je ne comprends pas ce que est dans l'expression . Bien sûr, est un scalaire et vous ne pouvez pas transposer un scalaire. Ceci est vu ICI , où ils appliquent cette méthodologie.ϵitTE[ϵitTϵjt]0ϵit


la source
1
Vous dites que vous ne comprenez pas pourquoi les estimations de la variance sont biaisées dans l'équation 2 et vous dites ensuite que nous pouvons ignorer votre estimation qui se trouve être l'équation 2? Je pense que je comprends ce que vous voulez dire et pourriez donner une réponse spéculative à cela, mais il vaudrait mieux que vous précisiez votre question. γ
JDav
1
Dans votre configuration, ne peut pas être stationnaire, car sa moyenne dépend de . Yitt
mpiktas
Il y a trois versions de l'attente (une dans le titre, une autre dans le corps et une troisième dans les commentaires). Tous intègrent une transposition mystérieuse même si dans tous les cas seuls des scalaires sont présents. Cela vous dérange-t-il de modifier votre message pour clarifier?
cardinal
@mpiktas Observation correcte, a une moyenne différente après (étant donné ). Merci. Yitt=150γi0
Quelques bonnes réponses ont été apportées - j'ajouterais simplement que cela doit être estimé comme un modèle de coefficients aléatoires (aka modèle à plusieurs niveaux pour les sociologues et les psychologues, aka modèle mixte pour les biostatisticiens). Si les économistes ne le savent pas et l'estiment avec une procédure en deux étapes, c'est tout simplement dommage pour eux (et j'attends toujours la mort des erreurs standard de Fama-Macbeth, ce qu'ils ne veulent apparemment tout simplement pas faire).
StasK

Réponses:

3

Pour être sûr que vous devez entrer dans les détails, cela implique de comparer la matrice de covariance de la variance vraie avec celle que vous obtenez dans la deuxième étape.

Le vrai :

Ceci peut être obtenu en remplaçant eq.2 par eq.1, l'OLS groupé suit, et de lui, le vrai a^,b^ matrice de covariance de variance:

Yit=αi+βiXit+aDt+bDtZi+Dtui+ϵit

Utiliser la notation matricielle pour diviser l'équation en γ paramètres et autres conduit à:

Y=Xθ+Zγ+ε

où nous sommes intéressés V(γ^) , γ=[ab], Z est un vecteur à deux colonnes Z=[DtDtZi][i=1,..,N;t=1,...,T] (une structure similaire définit X mais cela n'a pas d'intérêt) et où V(ε)=Σ a une structure complète de covariances entre les entreprises, c'est pourquoi il n'est pas diagonal (σ2INT) comme dans les hypothèses GAUSS-MARKOV. Par Frish-Waugh nous pouvons exprimerγ ols comme:

γ^=(ZMXZ)1ZMXYMX=IX(XX)1X

ce qui implique la vraie variance suivante:

V(γ^)=HΣHH=(ZMXZ)1ZMX

L'autre

Dans l'hypothèse d'entreprises non corrélées (et de périodes mais ce n'est pas le problème), Σ a une structure diagonale plus simple Δ. Cela signifie queΔ les termes triangulaires sont 0. Sous une spécification encore plus simple, (celle qui est estimée par défaut par les logiciels économétriques et statistiques pour OLS) Σ suit les hypothèses de GAUSS-Markov signifiant que même les termes diagonaux sont égaux ainsi Σ est rétrogradé à σ2I

Cela implique que ne pas tenir compte de la corrélation entre les entreprises conduirait à V(γ^)comme:

V(γ^)=HΔH ou V(γ^)=Hσ2IHσ2(ZMxZ)1

qui, comme on peut le voir, ne sont pas égaux à la vraie.

JDav
la source
Avec des mots différents .. Je donne fondamentalement la même réponse que @mpiktas a donné
JDav
(1) Vraiment fantastique. (2) On dirait que vous avez ignoréDiuiquand vous avez exprimé le modèle sous forme matricielle? Cela ne devrait cependant rien changer à ce que vous avez fait. (3) Savez-vous pourquoi Portfolio OLS donne des SE correctes? (Voir l'article de 1986 que j'ai lié). Ne vous embêtez pas avec la réponse (3) si vous ne souhaitez pas résoudre ce problème.
(2) Je n'ai pas mis toutes les définitions pour en laisser un peu à l'intuition et pour éviter les produits kronecker ... de cette façon la démo va "plus vite". Mais vous pouvez déduire que le nouveau terme aléatoire estεit=Dtui+ϵit, cela signifie que si les entreprises étaient corrélées par ui alors cela provoque le nouveau terme aléatoire εitêtre corrélé également sur la dimension de son entreprise. (3) n'a pas entendu parler d'un portefeuille OLS, mais je suppose que c'est juste un autre nom à quelque chose qui existe déjà dans l'économétrie standard à supprimer avec des matrices Var complètes, comme WLS, ou Robust OLS, etc.
JDav
(3) une bonne estimation implique une bonne Σ estimation, le portefeuille OLS estime en quelque sorte la structure complète Σ et pas seulement des variances sans covariances: Δ ou une seule variance: σ2
JDav
2
Je pense que la notation est inexacte, il utilise des scalaires où des vecteurs sont nécessaires pour se référer au fait que les covariances entre entreprises ne sont pas nulles, donc sa notation implique ϵit=[ϵit]i=1,...,Nest un vecteur à N lignes. Une autre interprétation est qu'il se réfère àij élément de ϵ.tTϵ.t. Dans les deux cas, il veut dire la même chose, mais comme ce n'est pas une revue quantitative, des ambiguïtés de notation mathématique se produisent ...
JDav
2

Je mets une autre réponse avec plus de détails.

Dans le modèle de régression linéaire standard (sous forme matricielle):

Y=Xβ+ε

l'estimation OLS est la suivante

β^=(XTX)1XTY.

Sa variance est alors

Var(β^)=(XTX)1XTVar(Y)X(XTX)1.

L'hypothèse habituelle de régression est que

Var(Y)=σ2I,

Iest la matrice d'identité. alors

Var(β^)=σ2(XTX)1.

Maintenant, dans votre cas, vous avez deux modèles:

Yi=Miδi+ϵi

et

Γ=Lc+u,

  • YiT=(Yi1,...,YiT),
  • Mi=[1,Xi,D], avec XiT=(Xi1,...,XiT), DT=(D1,...,DT)
  • δiT=(αi,βi,γi)
  • ϵiT=(ϵi1,...,ϵiT)
  • ΓT=(γ1,...,γn)
  • L=[1,Z], avec ZT=(Z1,...,Zn)
  • cT=(a,b)
  • uT=(u1,...,uN).

Notez que vous indiquez le deuxième modèle pour les estimations deγ, ce qui n'est pas habituel, donc je le reformule sous une forme habituelle, pour le "vrai" γ.

Écrivons la matrice de covariance pour les estimations de coefficients OLS c:

Var(c^)=(LTL)1LTVar(Γ)L(LTL)1

Le problème est que nous n'observons pas Γ. Nous observons les estimationsΓ^. γ^i fait partie du vecteur

δ^i=δi+(MiTMi)1MiTϵi.

Suppose que δi sont aléatoires et indépendants avec ϵi et Mi. Cela vaut certainement pourγi donc nous ne perdons rien si nous étendons cela pour d'autres éléments de δi.

Empilons tout δ^i l'un sur l'autre:

δ^T=[δ1T,...,δNT]

et explorer la variance de δ^:

Var(δ^)=[Var(δ^1)cov(δ^1,δ^2)cov(δ^1,δ^N)cov(δ^n,δ^1)cov(δ^n,δ2)Var(δ^N)]

Suppose que Var(ϵi)=σϵ2I et cela EϵiϵjT=0. Pourij on a

cov(δ^i,δ^j)=cov(δi,δj)+cov((MiTMi)1MiTϵi,(MjTMj)1MjTϵj)=(MiTMi)1MiTE(ϵiϵjT)Mj(MjTMj)1=0

Pour les éléments diagonaux, nous avons

Var(δ^i)=Var(δi)+σϵ2(MiTMi)1

Revenons à la variance de c^. Puisque nous substituonsΓ^ au lieu de Γ la variance est la suivante

Var(c^)=(LTL)1LTVar(Γ^)L(LTL)1,

Nous pouvons extraire Var(Γ^) de Var(δ^) en sélectionnant les éléments appropriés:

Var(Γ^)=Var(Γ)+diag(g1,...,gn)

gi est l'élément de σϵ2(MiTMi)1 correspondant à la Var(γ^i). Chaquegi est différent de gj car ils correspondent à différents Xit et Xjt qui ne sont pas supposés égaux.

Nous obtenons donc le résultat surprenant, que, algébriquement même si nous supposons toutes les propriétés nécessaires, la matrice de covariance résultante au moins algébriquement ne sera pas égale à la matrice de covariance OLS habituelle, car pour cela nous avons besoin de cela Var(Γ^) est une matrice d'identité à temps constant, ce qui n'est clairement pas le cas.

Toutes les formules ci-dessus ont été dérivées en supposant que Xij sont constants, ils sont donc conditionnels à Xij. Cela signifie que nous avons calculéVar(Γ^|X). En mettant des hypothèses supplémentaires surXij, Je pense qu'il serait possible de montrer que la variance inconditionnelle est OK.

L'hypothèse d'indépendance placée sur ϵi peut également être relâché à décorrélation.

Il serait également possible d'utiliser une étude de simulation pour voir comment la matrice de covariance diffère si nous utilisons Γ^ au lieu de Γ.

mpiktas
la source
1

Je pense que le problème réside dans la définition du deuxième modèle. Je pense que l'on suppose que

γi=a+bZi+ui

avec l'hypothèse habituelle que

cov(γi,γj|Z1,...,ZN)=0,

c'est-à-dire que le γi ne sont pas corrélés si nous contrôlons Zi. Maintenant, lorsque vous remplacezγ^ au lieu de γ, vous devez vérifier si l'hypothèse est vraie, c'est-à-dire si

cov(γi^,γ^j|Zi)=0.

Maintenant

γ^i=γi+L(ϵit),

Lest une fonction linéaire. Il est sûr de supposer queϵit est indépendant de Zi, mais si Eϵitϵjt0, l'hypothèse nécessaire ne tient pas.

Étant donné que l'hypothèse de non-corrélation est au cœur du calcul des statistiques OLS habituelles, cela donne la raison pour laquelle les erreurs standard sont biaisées.

C'était un aperçu, mais je pense que l'idée devrait fonctionner si vous voulez entrer dans les moindres détails des machines OLS.

mpiktas
la source