Intervalle de confiance pour l'effet moyen du traitement à partir de la pondération du score de propension?

9

J'essaie d'estimer l'effet moyen du traitement à partir de données d'observation en utilisant la pondération du score de propension (spécifiquement IPTW). Je pense que je calcule correctement l'ATE, mais je ne sais pas comment calculer l'intervalle de confiance de l'ATE tout en tenant compte des poids de score de propension inverse.

Voici l'équation que j'utilise pour calculer l'effet moyen du traitement (référence Stat Med. 10 sept. 2010; 29 (20): 2137–2148.): N=nombre total de sujets,Zi=état du traitement,Yi=état du résultat etpi=score de propension.

ATE=1N1NZiYipi1N1N(1Zi)Yi1pi
N=Zi=Yi=pi=

Quelqu'un connaît-il un ensemble R qui calculerait l'intervalle de confiance de l'effet moyen du traitement, en tenant compte des poids? Le surveypackage pourrait-il aider ici? Je me demandais si cela fonctionnerait:

library(survey)
sampsvy=svydesign(id=~1,weights=~iptw,data=df)
svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta')

#which produces this result:
  treatment surgery == "lump"      ci_l      ci_u
   No         0.1644043 0.1480568 0.1817876
   Yes         0.2433215 0.2262039 0.2610724

Je ne sais pas où aller à partir d'ici pour trouver l'intervalle de confiance de la différence entre les proportions (c'est-à-dire l'effet moyen du traitement).

JJM
la source
Je ne peux pas répondre spécifiquement, mais le livre "Complex Surveys: A Guide to Analysis Using R" de l'auteur du module d'enquête couvre IPTW et peut être utile. books.google.com/…
kaz_yos

Réponses:

11

Vous n'avez pas besoin du surveypaquet ou de quelque chose de compliqué. Wooldridge (à partir de 2010, p. 920) «Analyse économétrique des données des sections transversales et des panneaux» a une procédure simple à partir de laquelle vous pouvez obtenir les erreurs standard afin de construire les intervalles de confiance.

p(xi,γ)

di=γp(xi,γ)[Zip(xi,γ)]p(xi,γ)[1p(xi,γ)]
ATEi=[Zip(xi,γ)]Yip(xi,γ)[1p(xi,γ)]
ATE^id^ieiN(ATE^ATE)Var(ei)
[1Ni=1Nei2]12N

Vous pouvez ensuite calculer l'intervalle de confiance de la manière habituelle (voir par exemple les commentaires de la réponse ici pour un exemple de code). Vous n'avez pas besoin d'ajuster à nouveau l'intervalle de confiance pour les pondérations du score de propension inverse, car cette étape était déjà incluse dans le calcul des erreurs standard.

Malheureusement, je ne suis pas un gars R donc je ne peux pas vous fournir le code spécifique mais la procédure décrite ci-dessus devrait être simple à suivre. En remarque, c'est aussi la manière dont la treatrewcommande dans Stata fonctionne. Cette commande a été écrite et introduite dans le Stata Journal par Cerulli (2014) . Si vous n'avez pas accès à l'article, vous pouvez consulter ses diapositives qui décrivent également la procédure de calcul des erreurs standard à partir de la pondération du score de propension inverse. Là, il discute également de légères différences conceptuelles entre l'estimation du score de propension via logit ou probit, mais pour cette réponse, elle n'était pas trop importante, j'ai donc omis cette partie.

Andy
la source