Supposons que sont des séries chronologiques avec , ( et est similaire à celle de , mais change lorsque le mannequin = 1). et , . Dans un contexte réel, il s'agira de rendements boursiers périodiques sur entreprises (mais vous pouvez ignorer cela). Il existe un mannequin, qui est égal à l'unité sur et égal à zéro sinon. Le modèle de série chronologique à estimer avec OLS est:
Ce modèle adhère généralement aux hypothèses de Gauss-Markov pour chaque . Cependant, nous avons pour tout et .
L'étape suivante consiste à construire un vecteur de gammas en utilisant les estimations du modèle . Appelez ce vecteur . Nous utilisons ensuite ceci dans le modèle transversal:
où est une variable transversale qui ne provoque aucune violation des hypothèses OLS et est pertinente pour expliquer .
Dans la littérature sur l'économétrie appliquée, l'affirmation est que dans le modèle n'entraîne (i) aucun problème pour les estimations du coefficient OLS dans , mais (ii) Erreurs standard biaisées dans .
Quelqu'un peut-il s'il vous plaît poster des idées sur les raisons de ce cas?
Je ne comprends pas ce que est dans l'expression . Bien sûr, est un scalaire et vous ne pouvez pas transposer un scalaire. Ceci est vu ICI , où ils appliquent cette méthodologie.
Réponses:
Pour être sûr que vous devez entrer dans les détails, cela implique de comparer la matrice de covariance de la variance vraie avec celle que vous obtenez dans la deuxième étape.
Le vrai :
Ceci peut être obtenu en remplaçant eq.2 par eq.1, l'OLS groupé suit, et de lui, le vraiune^,b^ matrice de covariance de variance:
Utiliser la notation matricielle pour diviser l'équation enγ paramètres et autres conduit à:
où nous sommes intéressésV(γ^) , γ= [ ab ] , Z est un vecteur à deux colonnes Z= [rétrétZje][ I = 1 , . . , N; t = 1 , . . . , T] (une structure similaire définit X mais cela n'a pas d'intérêt) et où V( ε ) = Σ a une structure complète de covariances entre les entreprises, c'est pourquoi il n'est pas diagonal (σ2jeNT ) comme dans les hypothèses GAUSS-MARKOV. Par Frish-Waugh nous pouvons exprimerγ ols comme:
ce qui implique la vraie variance suivante:
L'autre
Dans l'hypothèse d'entreprises non corrélées (et de périodes mais ce n'est pas le problème),Σ a une structure diagonale plus simple Δ . Cela signifie queΔ les termes triangulaires sont 0. Sous une spécification encore plus simple, (celle qui est estimée par défaut par les logiciels économétriques et statistiques pour OLS) Σ suit les hypothèses de GAUSS-Markov signifiant que même les termes diagonaux sont égaux ainsi Σ est rétrogradé à σ2je
Cela implique que ne pas tenir compte de la corrélation entre les entreprises conduirait àV(γ^) comme:
qui, comme on peut le voir, ne sont pas égaux à la vraie.
la source
Je mets une autre réponse avec plus de détails.
Dans le modèle de régression linéaire standard (sous forme matricielle):
l'estimation OLS est la suivante
Sa variance est alors
L'hypothèse habituelle de régression est que
oùje est la matrice d'identité. alors
Maintenant, dans votre cas, vous avez deux modèles:
et
où
Notez que vous indiquez le deuxième modèle pour les estimations deγ , ce qui n'est pas habituel, donc je le reformule sous une forme habituelle, pour le "vrai" γ .
Écrivons la matrice de covariance pour les estimations de coefficients OLSc :
Le problème est que nous n'observons pasΓ . Nous observons les estimationsΓ^ . γ^i fait partie du vecteur
Suppose queδi sont aléatoires et indépendants avec ϵi et Mi . Cela vaut certainement pourγi donc nous ne perdons rien si nous étendons cela pour d'autres éléments de δi .
Empilons toutδ^i l'un sur l'autre:
et explorer la variance deδ^ :
Suppose queVar(ϵi)=σ2ϵI et cela EϵiϵTj=0 . Pouri≠j on a
Pour les éléments diagonaux, nous avons
Revenons à la variance dec^ . Puisque nous substituonsΓ^ au lieu de Γ la variance est la suivante
Nous pouvons extraireVar(Γ^) de Var(δ^) en sélectionnant les éléments appropriés:
oùgi est l'élément de σ2ϵ(MTiMi)−1 correspondant à la Var(γ^i) . Chaquegi est différent de gj car ils correspondent à différents Xit et Xjt qui ne sont pas supposés égaux.
Nous obtenons donc le résultat surprenant, que, algébriquement même si nous supposons toutes les propriétés nécessaires, la matrice de covariance résultante au moins algébriquement ne sera pas égale à la matrice de covariance OLS habituelle, car pour cela nous avons besoin de celaVar(Γ^) est une matrice d'identité à temps constant, ce qui n'est clairement pas le cas.
Toutes les formules ci-dessus ont été dérivées en supposant queXij sont constants, ils sont donc conditionnels à Xij . Cela signifie que nous avons calculéVar(Γ^|X) . En mettant des hypothèses supplémentaires surXij , Je pense qu'il serait possible de montrer que la variance inconditionnelle est OK.
L'hypothèse d'indépendance placée surϵi peut également être relâché à décorrélation.
Il serait également possible d'utiliser une étude de simulation pour voir comment la matrice de covariance diffère si nous utilisonsΓ^ au lieu de Γ .
la source
Je pense que le problème réside dans la définition du deuxième modèle. Je pense que l'on suppose que
avec l'hypothèse habituelle que
c'est-à-dire que leγi ne sont pas corrélés si nous contrôlons Zi . Maintenant, lorsque vous remplacezγ^ au lieu de γ , vous devez vérifier si l'hypothèse est vraie, c'est-à-dire si
Maintenant
oùL est une fonction linéaire. Il est sûr de supposer queϵit est indépendant de Zi , mais si Eϵitϵjt≠0 , l'hypothèse nécessaire ne tient pas.
Étant donné que l'hypothèse de non-corrélation est au cœur du calcul des statistiques OLS habituelles, cela donne la raison pour laquelle les erreurs standard sont biaisées.
C'était un aperçu, mais je pense que l'idée devrait fonctionner si vous voulez entrer dans les moindres détails des machines OLS.
la source