Comment conserver les variables invariantes dans le temps dans un modèle à effets fixes

15

J'ai des données sur les employés d'une grande entreprise italienne sur dix ans et j'aimerais voir comment l'écart entre les sexes dans les gains des hommes et des femmes a changé au fil du temps. À cette fin, je gère l'OLS groupé:

yit=Xitβ+δmalei+t=110γtdt+εit
y est le logarithme des gains par an, Xit comprend covariables qui diffèrent selon l'individu et le temps, dtsont des variables muettes de l'année et malei est égal à un si un travailleur est un homme et est égal à zéro dans le cas contraire.

Maintenant, je crains que certaines covariables puissent être corrélées avec des effets fixes non observés. Mais lorsque j'utilise l'estimateur à effets fixes (intra) ou les premières différences, je perds le mannequin de genre parce que cette variable ne change pas avec le temps. Je ne veux pas utiliser l'estimateur à effets aléatoires, car j'entends souvent des gens dire qu'il pose des hypothèses très irréalistes et peu susceptibles de tenir.

Existe-t-il des moyens de conserver le factice de genre et de contrôler les effets fixes en même temps? S'il y a un moyen, dois-je regrouper ou prendre soin d'autres problèmes avec les erreurs pour les tests d'hypothèse sur la variable de genre?

user42263
la source

Réponses:

22

Il existe plusieurs façons possibles de conserver le mannequin de sexe dans une régression à effets fixes.

Dans Estimator
Supposons que vous ayez un modèle similaire par rapport à votre modèle OLS groupé qui est où les variables sont comme précédemment. Notons maintenant que β 1 et β 1 + γ 1 ( m a l e i ) ne peuvent pas être identifiés car l'estimateur intra ne peut pas les distinguer de l'effet fixe c i . Étant donné que β 1 est l'ordonnée à l'origine pour l'année de base t = 1 , γ 1 est l'effet du sexe sur les gains au cours de cette période. Ce que nous pouvons identifier dans ce cas sont γ 2 , . . .

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1β1+γ1(malei)ciβ1t=1γ1 car ils interagissent avec vos variables temporelles et mesurent les différences dans les effets partiels de votre variable de genre par rapport à la première période. Cela signifiesi vous observent une augmentation de votre γ 2 , . . . , γ 10 au fil du temps, cela indique un élargissement de l'écart de rémunération entre les hommes et les femmes.γ2,...,γ10γ2,...,γ10

Estimateur de première différence
Si vous voulez connaître l'effet global de la différence entre les hommes et les femmes dans le temps, vous pouvez essayer le modèle suivant: où la variable t = 1 , 2 ,

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
interagit avec le mannequin de genre invariable dans le temps. Maintenant, si vous prenez les premières différences, β 1 et c i abandonnent et vous obtenez y i t - y i ( t - 1 ) = 10 t = 3 β t ( d t - d ( t - 1 ) ) + γ ( t m a l e i -t=1,2,...,10β1ci Puis γ ( t m a l e i - [ ( t - 1 ) m alei])=γ[(t-(t-1))m
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
et vous pouvez identifier la différence entre les sexes dans les gains γ . L'équation de régression finale sera donc: Δ y i t = 10 t = 3 β t Δ d t + γ (γ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ et vous obtenez votre effet d'intérêt. La bonne chose est que cela est facilement implémenté dans n'importe quel logiciel statistique, mais vous perdez une période de temps.
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit


ci1ci2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1iθ^iX¯1i2ciX~2itX2itX¯2iX¯1i

Tout cela peut sembler un peu compliqué, mais il existe des packages prédéfinis pour cet estimateur. Par exemple, dans Stata, la commande correspondante est xthtaylor. Pour plus d'informations sur cette méthode, vous pouvez lire Cameron et Trivedi (2009) "Microeconometrics Using Stata". Sinon, vous pouvez simplement vous en tenir aux deux méthodes précédentes qui sont un peu plus faciles.

Inférence
Pour vos tests d'hypothèse, il n'y a pas grand-chose à considérer autre que ce que vous auriez à faire de toute façon dans une régression à effets fixes. Vous devez prendre soin de l'autocorrélation dans les erreurs, par exemple en regroupant sur la variable ID individuelle. Cela permet une structure de corrélation arbitraire entre les grappes (individus) qui traite de l'autocorrélation. Pour une référence, voir à nouveau Cameron et Trivedi (2009).

Andy
la source
4

L' approche de Mundlak (1978) pour un modèle à effet fixe avec des variables invariantes dans le temps est un autre moyen potentiel pour vous de garder le mannequin de genre . L'approche de Mundlak supposerait que l'effet de genre peut être projeté sur les moyennes de groupe des variables variant dans le temps.

Mundlak, Y. 1978: Sur la mise en commun des séries chronologiques et des données transversales. Econometrica 46: 69-85.

emeryville
la source
2

Une autre méthode consiste à estimer les coefficients invariants dans le temps dans une équation de deuxième étape, en utilisant l'erreur moyenne comme variable dépendante.

βγtu^it

u^ityitXitβ^

u¯i

u¯it=1Tu^iT=yit¯x¯iβ^

Maintenant, considérons l'équation de deuxième étape suivante:

u¯i=δmalei+ci

ciδT


u¯i

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

The expectation of this estimator is:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

If assumptions for FE consistency hold, β^ is an unbiased estimator of β, and E(ϵit)=0. Thus:

E(u¯i)=δmalei+E(ci)

This is, our predictor is an unbiased estimator of the time-invariant components of the model.

Regarding consistency, the probability limit of this predictor is:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Again, our predictor is a consistent estimator of the time-invariant components of the model.

luchonacho
la source
1

The Mundlak chamberlain device is a perfect tool for this. It is usually referred to as the correlated random effects model because it uses the random effect model to implicitly estimate fixed effects for time variant variables while also estimating the random effects for time invariant variables.

However, in statistical softwares, you implement it thesame as the random effect model but you have to add the means of all time variant covariates.

Martin Paul
la source