Correspondance du score de propension avec un traitement variant dans le temps

8

La procédure d'appariement des scores de propension de base fonctionne avec des données transversales (c'est-à-dire collectées à un certain moment). La commande psmatch2 populaire utilise une variable fictive indiquant qu'une observation appartient au groupe de traitement ou de contrôle.

Cependant, dans mon jeu de données, cette fonction d'indicateur varie dans le temps. Les données se présentent comme suit: j'identifie les individus et les suit sur une période de 12 ans. À un moment donné au cours de cette période, les individus peuvent être traités, de sorte qu'ils «passent du groupe de contrôle au groupe de traitement». Notez que cela peut se produire à tout moment (sic!) Pour chaque individu.

Au-dessus de cela, mon analyse ultérieure dépendrait du temps: à partir du moment où les individus sont traités, je veux estimer le TCA mais uniquement pour l'année suivante (sic!). Ainsi, je ne me soucie plus des personnes traitées 1 an après le début de leur traitement.

psmatch2semble être très restrictif en ce qui concerne cela. Voyez-vous une possibilité sur la façon de procéder? Peut-être qu'il existe également des méthodes de correspondance qui me permettent de le faire.

PS: Il y a une question similaire ici dans le forum, mais cela ne m'a pas aidé à résoudre ce problème.

Jhonny
la source
1
De nombreux «poids» utilisés pour les analyses utilisent des méthodes très similaires et ont des justifications très similaires. Cependant, il est important de s'y référer correctement. À ma connaissance, les scores de propension ne sont pas utilisés pour tenir compte des traitements variant dans le temps. Je pense que vous pensez à des modèles structurels marginaux .
AdamO
Merci pour cet indice, je n'étais pas au courant de ce modèle. Ils semblent être très populaires dans la littérature sur l'épidémiologie et la médecine, mais pas en économie / sciences sociales qui sont mes antécédents.
Jhonny
J'ai posé une question similaire il y a quelques semaines: stats.stackexchange.com/questions/113670/…
Adam Robinsson

Réponses:

6

Peut-être que l'article suivant est pertinent pour votre cas: Lu B. Score de propension correspondant aux covariables dépendantes du temps. Biometrics 2005; 61, 721–728 .

Dans la situation considérée dans l'article, les sujets peuvent commencer le traitement à tout moment pendant une période d'observation. Un individu qui s'expose à tempst est apparié à plusieurs contrôles sélectionnés à partir de l'ensemble de risques correspondant, c'est-à-dire de tous les sujets qui risquent encore d'être exposés à temps t.

L'appariement concerne un score de propension dépendant du temps, défini comme le risque d'être exposé à temps t calculé à partir d'un modèle de risques proportionnels de Cox:

h(t)=h0(t)exp(βx(t))
x(t)est un vecteur de prédicteurs potentiellement variables dans le temps de l'état du traitement. Dans chaque ensemble de risques, l'appariement est en fait effectué sur l'échelle du prédicteur linéaire en fonction de la métrique
d(xi(t),xj(t))=(β^xi(t)β^xj(t))2.
a.arfe
la source
1

Stata 13 a un estimateur des effets de traitement à plusieurs valeurs . Il pourrait être possible de recadrer votre problème comme un traitement à valeurs multiples, où le traitement est indexé par le temps (traité en année 1, traité en année 2, ..., traité en année 12) plutôt que binaire. Le résultat sera mesuré dans l'année suivant le traitement.

Dimitriy V. Masterov
la source
Dans ma configuration, le traitement peut avoir lieu n'importe quel jour pendant les 12 ans, ce qui rend cette solution non pratique (l'ensemble de données comprend plus d'un million d'observations). Au-dessus de cela, le traitement que les individus reçoivent est identique (bien qu'il se produise à différents moments) - ce qui n'est pas considéré d'après ma compréhension de l'estimateur proposé.
Jhonny