Dans une étude longitudinale, les résultats des unités sont mesurés à plusieurs reprises aux points temporels avec un total de occasions de mesure fixes (fixe = les mesures sur les unités sont prises en même temps). i t m
Les unités sont assignées au hasard soit à un traitement, , soit à un groupe témoin, . Je veux estimer et tester l'effet moyen du traitement, c'est-à-dire où les attentes sont prises à travers le temps et les individus. J'envisage d'utiliser à cet effet un modèle multiniveau à effets fixes (effets mixtes):G = 0 A T E = E ( Y | G = 1 ) - E ( Y | G = 0 ) ,
avec l'ordonnée à l'origine, l' , une interception aléatoire entre les unités, et le résiduel.β A T E u e
J'envisage maintenant un modèle alternatif
qui contient les effets fixes pour chaque occasion où factice si et sinon. De plus, ce modèle contient une interaction entre le traitement et le temps avec les paramètres . Ce modèle prend donc en compte le fait que l'effet de peut différer dans le temps. C'est informatif en soi, mais je pense que cela devrait aussi augmenter la précision d'estimation des paramètres, car l'hétérogénéité de est prise en compte. t d t = 1 j = t 0 γ G Y
Cependant, dans ce modèle, le coefficient ne semble plus égaler l' . Au lieu de cela, il représente l'ATE à la première occasion ( ). Donc, l'estimation de peut être plus efficace que mais elle ne représente plus l' . ATEt=1 ˜ β βATE
Mes questions sont :
- Quelle est la meilleure façon d'estimer l'effet du traitement dans ce plan d'étude longitudinale?
- Dois-je utiliser le modèle 1 ou existe-t-il un moyen d'utiliser (peut-être plus efficace) le modèle 2?
- Existe-t-il un moyen pour que ait l'interprétation de l' et l'écart spécifique à l'occasion (par exemple en utilisant le codage d'effet)? ATEγ
Réponses:
Répondant à votre question "Je me demande comment sortir l'ATE du modèle 2" dans les commentaires:
Tout d'abord, dans votre modèle 2, tous les sont pas identifiables, ce qui pose le problème du manque de rang dans la matrice de conception. Il est nécessaire de supprimer un niveau, par exemple en supposant que pour . Autrement dit, en utilisant le codage de contraste et en supposant que l'effet du traitement à la période 1 est 0. Dans R, il codera le terme d'interaction avec l'effet du traitement à la période 1 comme niveau de référence, et c'est également la raison pour laquelle a l'interprétation de l'effet du traitement à la période 1. Dans SAS, il codera l'effet du traitement à la période comme niveau de référence, puis a l'interprétation de l'effet du traitement à la périodeγ j = 0 j = 1 ˜ β m ˜ β mγj γj=0 j=1 β~ m β~ m , plus la période 1.
En supposant que le contraste est créé de la manière R, les coefficients estimés pour chaque terme d'interaction (je désignerai toujours ceci par , bien que ce ne soit pas précisément ce que vous avez défini dans votre modèle) ont l'interprétation de la différence d'effet de traitement entre les périodes et période 1. Noter ATE à chaque période , puis pour . Par conséquent, un estimateur pourγj j ATEj γj=ATEj−ATE1 j=2,…,m ATEj β~+γj ATE=β=1m∑mj=1ATEj=β~+(β~+γ2)+⋯+(β~+γm)m=β~+1m(γ2+⋯+γm)
J'ai fait une simulation simple en R pour vérifier cela:
Et les résultats le vérifient:
Je ne sais pas comment changer directement le codage de contraste dans le modèle 2 ci-dessus, donc pour illustrer comment on peut directement utiliser une fonction linéaire des termes d'interaction, ainsi que comment obtenir l'erreur standard, j'ai utilisé le package multcomp:
Et voici la sortie:
Codage des écarts
Production:
la source
beta_t
Pour la première question, je crois comprendre que des moyens «fantaisistes» ne sont nécessaires que lorsqu'il n'est pas immédiatement évident que le traitement est indépendant des résultats potentiels. Dans ces cas, vous devez faire valoir que certains aspects des données permettent une approximation de l'assignation aléatoire au traitement, ce qui nous amène aux variables instrumentales, à la discontinuité de la régression, etc.
Dans votre cas, les unités sont assignées au hasard au traitement, il semble donc crédible que le traitement soit indépendant des résultats potentiels. Ensuite, nous pouvons simplement garder les choses simples: estimez le modèle 1 avec les moindres carrés ordinaires, et vous avez une estimation cohérente de l'ATE. Étant donné que les unités sont assignées au hasard au traitement, il s'agit de l'un des rares cas où une hypothèse d'effets aléatoires est crédible.
la source