Estimation doublement robuste de la mise en œuvre des effets de causalité

8

Quelqu'un connaît-il une implémentation (autre que la macro SAS) de la méthode d'estimation doublement robuste trouvée dans:

Funk, MJ, Westreich, D. et al (2011). Estimation doublement robuste des effets causaux. American Journal of Epidemiology, 173 (7): 761-767. [DOI] ?

ADB
la source
1
Y at - il une langue que vous voulez dans?
Fomite
Les implémentations dans toutes les langues sont les bienvenues. Je ne peux pas utiliser la macro SAS car je n'ai pas le programme SAS.
ADB
@Michael Merci, je ne sais pas comment la faute de frappe s'y est faufilée
jonsca
@jonsca Vous effectuez beaucoup de modifications et j'ai vérifié bon nombre de vos modifications lorsque les demandes me parviennent. En général, vous faites un très bon travail. Celui-ci était très bon aussi, une seule faute de frappe s'est glissée.
Michael R. Chernick

Réponses:

12

Une estimation doublement robuste n'est en fait pas particulièrement difficile à mettre en œuvre dans la langue de votre choix. Tout ce que vous faites en fait, c'est contrôler les variables de deux manières, plutôt que d'une seule - l'idée étant que tant que l'un des deux modèles utilisés pour le contrôle est correct, vous avez réussi à contrôler la confusion.

À mon avis, la façon la plus simple de procéder consiste à utiliser des pondérations à probabilité inverse de traitement (IPTW) pour pondérer l'ensemble de données, puis à inclure également des variables dans un modèle de régression normal. C'est ainsi que les auteurs abordent le problème dans l'article lié ci-dessus. Il existe également d'autres options, généralement construites à partir des scores de propension utilisés pour l'appariement ou comme covariable dans le modèle.

Il existe de nombreuses introductions à IPTW dans la langue statistique que vous préférez. Je fournirais des extraits de code, mais tous les miens sont en SAS et se liraient probablement beaucoup comme les auteurs.

En bref, ce que vous faites est de modéliser la probabilité d' exposition en fonction de vos covariables en utilisant quelque chose comme la régression logistique et d'estimer la probabilité d'exposition prédite en fonction de ce modèle. Cela vous donne un score de propension. La probabilité inverse du poids de traitement est, comme son nom l'indique, 1 / score de propension. Cela produit parfois des valeurs extrêmes, de sorte que certaines personnes stabilisent le poids en substituant la probabilité marginale d'exposition (obtenue par un modèle de régression logistique du résultat et sans covariables) à 1 dans l'équation ci-dessus.

Au lieu de traiter chaque sujet de votre analyse comme 1 sujet, vous les traitez maintenant comme n copies d'un sujet, où n est leur poids. Si vous exécutez votre modèle de régression en utilisant ces pondérations et en incluant les covariables, il en résulte une estimation doublement robuste.

Une mise en garde cependant: si une estimation robuste doublement (ou triplement, etc.) vous donne plus de chances de spécifier le bon modèle de covariable, elle ne garantit pas que vous le ferez. Et plus important encore, ne peut pas vous sauver de la confusion non mesurée.

Fomite
la source
Merci d'avoir répondu. Existe-t-il une version gratuite / d'essai de SAS?
ADB
@ADB J'espère que quelqu'un viendra avec une implémentation dans R - Je le ferais, mais j'ai des délais urgents à venir. Si vous êtes dans un endroit où vous avez accès à des statisticiens ou à des gens qui aiment le codage, cela devrait être très simple à mettre en œuvre dans le package que vous avez. Sur l'échelle de "je t'achèterai le déjeuner" en termes de pot-de-vin approprié :)
Fomite
1
@ADB Cette vignette pour le paquet twang dans R a une belle vue d'ensemble de l'analyse du score de propension et des estimateurs doublement robustes.
jthetzel
@Fomite Je pense que vous vouliez dire "... certaines personnes stabilisent le poids en substituant la probabilité marginale d'exposition (obtenue par un modèle de régression logistique du traitement et sans covariables) à 1 dans l'équation ci-dessus."
taux de succion
2

Le package tmle R a implémenté l'estimateur basé sur les pertes minimales ciblées, qui est à la fois robuste et efficace dans des conditions. Il a l'avantage supplémentaire d'être un estimateur de substitution, par opposition à l'IPTW augmenté (qui est celui dont je suppose que vous parlez).

Ivan Diaz
la source
2
Bienvenue sur le site, @IvanDiaz. Cela pourrait être utile si vous indiquiez la langue du tmlepackage, peut-être un lien vers plus d'informations, et où l'obtenir.
gung - Réintégrer Monica
1

J'ai l'estimateur décrit dans Funk et al. 2011 (poids de probabilité inverse augmentés), implémenté dans la zEpidbibliothèque Python 3 de la AIPTWclasse. Les détails et la syntaxe sont ICI . La bibliothèque comprend également TMLE, au cas où vous souhaiteriez utiliser les deux approches

pzivich
la source
0

Il existe un package R qui implémente cet estimateur DR de l'ATE (ainsi que d'autres choses), le npcausalpackage: https://github.com/ehkennedy/npcausal

La fonction qui correspond à un estimateur DR est ate()

user1849779
la source