Ajustez tout ce que vous avez dans le score de propension?

9

J'ai une question méthodologique et, par conséquent, aucun échantillon de jeu de données n'est joint.

Je prévois de faire une régression de Cox ajustée au score de propension qui vise à examiner si un certain médicament réduira le risque de résultat. L'étude est observationnelle, comprenant 10 000 individus.

L'ensemble de données contient 60 variables. Je pense que 25 d'entre eux pourraient affecter la répartition des traitements. Je ne ferais jamais d'ajustement pour les 25 dans une régression de Cox, mais j'ai entendu dire que vous pouvez inclure autant de variables comme prédicteurs dans un score de propension, puis inclure uniquement la sous-classe du score de propension et la variable de traitement dans la régression de Cox.

(des covariables qui ne seront pas égales après ajustement du score de prop devront bien entendu être incluses dans la régression de Cox).

En fin de compte, est-il vraiment intelligent d'inclure autant de prédicteurs dans le score d'hélice?


@Dimitriy V. Masterov Merci d'avoir partagé ces faits importants. Contrairement aux livres et articles qui envisagent d'autres cadres de régression, je ne vois aucune directive (en lisant le livre de Rosenbaums) sur la sélection des modèles dans les analyses de score de propension. Alors que les manuels / articles de revue standard semblent toujours recommander une sélection rigoureuse des variables et maintenir le nombre de prédicteurs bas, je n'ai pas vu beaucoup de cette discussion dans les analyses de score d'hélice. Vous écrivez: (1) "Les connaissances théoriques, les connaissances institutionnelles et les bonnes recherches devraient guider la sélection des X". Je suis d'accord mais il y a des circonstances où nous avons une variable à portée de main et ne savons pas vraiment (mais cela pourrait être possible) si la variable affecte l'allocation du traitement ou le résultat. Par exemple: devrais-je inclure la fonction rénale, telle que mesurée par le taux de filtration, dans un score d'hélice visant à ajuster le traitement aux statines. Le traitement aux statines n'a rien à voir avec la fonction rénale et j'ai déjà inclus un tableau de variables qui affecteront le traitement aux statines. Mais il est toujours tentant d'inclure la fonction rénale; il pourrait s'ajuster encore plus. Maintenant, certains diraient qu'elle devrait être incluse car elle affecte le résultat, mais je pourrais vous donner un autre exemple (comme la variable binaire vie urbaine / rurale) d'une variable qui n'affecte pas le traitement ni le résultat, à notre connaissance. Mais je voudrais l'inclure, tant qu'il ne le fait pas t effectuer la précision du score prop. (2)"L'inclusion des X affectés par le traitement, soit ex post soit ex ante en prévision du traitement, invalidera l'hypothèse". Je ne sais pas ce que tu veux dire ici. Mais si j'étudie l'effet des statines sur les résultats cardiovasculaires, j'inclurai diverses mesures des lipides sanguins dans le score de propension. Les lipides sanguins sont effectués par le traitement. Je suppose que j'ai mal compris cette déclaration.

@statsRus merci de partager les faits, en particulier ce que vous appelez "une note sur la sélection des entrées". Je pense que je raisonne de la même manière que vous.

Malheureusement, les méthodes de score prop discutent de diverses stratégies d'ajustement au lieu de stratégies de sélection de modèle. Peut-être que l'ajustement du modèle n'est pas important. Si tel est le cas, je m'ajusterais pour chaque variable disponible qui pourrait affecter le moins possible les résultats et la répartition du traitement. Je ne suis pas statisticien, mais si l'ajustement du modèle n'a pas d'importance, je voudrais m'adapter à toutes les variables susceptibles d'affecter la répartition et les résultats du traitement. Dans de nombreux cas, cela signifierait l'inclusion de variables qui seront affectées par le traitement.

De plus, certaines personnes suggèrent que la régression de Cox subséquente ne devrait inclure que la variable de traitement et la sous-classe de score de prop. Alors que d'autres suggèrent que l'ajustement cox devrait inclure le score prop en plus de toutes les autres variables pour lesquelles vous ajusteriez.

Adam Robinsson
la source

Réponses:

8

Je pose personnellement cette question depuis au moins 5 ans car pour moi, c'est la "grande" question pratique pour utiliser l'appariement des scores de propension sur les données d'observation pour estimer les effets causals. C'est une superbe question et il y a un désaccord subtil qui est profondément ancré dans les communautés des statistiques par rapport aux communautés informatiques.

D'après mon expérience, les statisticiens ont tendance à plaider pour «jeter l'évier de la cuisine» des intrants observables dans l'estimation du score de propension, tandis que les informaticiens ont tendance à préconiser une raison théorique pour les intrants (bien que les statisticiens puissent occasionnellement mentionner l'importance de la théorie pour justifier la sélection de entrées dans le modèle de score de propension). La différence, je crois, vient du fait que les informaticiens (en particulier Judea Pearl) ont tendance à penser le causal en termes de graphiques acycliques dirigés. Lorsque vous visualisez la causalité à travers des graphiques acycliques dirigés, il est assez facile de voir que vous pouvez conditionner une variable dite "collisionneur", qui peut "débloquer" les chemins de porte dérobée et induire en fait un biais dans votre estimation d'un effet causal.

Mon plat à emporter? Si vous avez une théorie solide sur ce qui affecte la sélection dans le traitement, utilisez-la dans l'estimation du score de propension. Effectuez ensuite une analyse de sensibilité pour déterminer dans quelle mesure votre estimation est sensible aux variables de confusion non observées. Si vous n'avez quasiment aucune théorie pour vous guider, jetez-y "l'évier de la cuisine" puis effectuez une analyse de sensibilité.

Une note sur la sélection des entrées pour le modèle de score de propension (cela peut être évident, mais il convient de noter pour d'autres qui ne connaissent pas l'estimation des effets causals à partir de données d'observation): Ne contrôlez pas les variables post-traitement. C'est-à-dire que vous voulez que vos entrées dans le modèle de score de propension soient mesurées avant le traitement et que vos résultats soient mesurés après le traitement. Dans les données d'observation, cela signifie pratiquement que vous avez besoin de trois vagues de données, avec un ensemble détaillé de lignes de base de covariables, le traitement mesuré dans la deuxième vague et le résultat mesuré dans la vague finale.

statsRus
la source
Il s'agit d'un article récent qui aborde la question du conditionnement sur une variable collisionneur (leur article suggère que le biais M est probablement faible, ce qui donne du crédit à l'approche "évier de cuisine" consistant à introduire des intrants dans le modèle de score de propension: arxiv.org/abs /1408.0324
statsRus
7

En l'absence de connaissance du sujet, la surinclusion des variables est généralement meilleure que la sous-inclusion, et il n'y a pas de raison de faire une sélection de modèle pour construire un PS. Ce qui est plus important, c'est de construire un modèle flexible. Mon approche par défaut est de spliner chaque variable continue et de ne pas regarderP-valeurs pour les variables dans le PS, c'est-à-dire que j'utilise un modèle de régression logistique additive flexible.

L'ajustement covariable présente de nombreux avantages à l'aide du logit PS. Je divise généralement le logit de PS pour l'inclure comme une variable d'ajustement de plusieurs degrés de liberté, après avoir fait preuve de diligence raisonnable concernant les régions sans chevauchement. Voir http://www.citeulike.org/user/harrelfe/article/13340175 et http://www.citeulike.org/user/harrelfe/article/13265389 et d'autres articles sur http://www.citeulike.org/ utilisateur / harrelfe / tag / score de propension .

Vous devez être sûr d'inclure également en tant que covariables séparées les prédicteurs vraisemblablement Y comme PS est juste pour l'ajustement du biais, pas pour saisir l'hétérogénéité des résultats.

Je doute de toute méthode d'appariement qui entraîne la suppression des observations pouvant être mises en correspondance ou qui dépend fortement de l'ordre des jeux de données. Les observations rejetées ont beaucoup à dire sur la façon dont les effets de covariables doivent être estimés.

Frank Harrell
la source
Les liens sont rompus. Pouvez-vous expliquer quels sont les avantages d'utiliser logit de PS au lieu de PS brut pour l'appariement?
DS_Enthusiast
Pour l'appariement, cela n'a pas d'importance. Mais je déconseille d'utiliser la correspondance.
Frank Harrell
3

Un aperçu théorique, des connaissances institutionnelles et de bonnes recherches dans le domaine devraient être votre guide Xs pour correspondre. Il n'y a pas de procédure de sélection des variables déterministes qui vous dira quelles variables choisir.

Voici quelques directives générales. L'hypothèse conditionnelle d'indépendance (CIA) sera satisfaite siXcomprend toutes les variables qui affectent à la fois (non plus, mais les deux) la participation et les résultats. ComprenantXs affectés par le traitement, ex post ou ex anteen prévision du traitement, invalidera l'hypothèse. Par exemple, si un agent sait que le vaccin arrive, il peut ajuster son comportement avant le tir. L'inclusion d'instruments - des variables qui affectent la participation et non les résultats - est également une mauvaise idée. Ils n'aideront pas à biais de sélection et peuvent aggraver considérablement le problème de soutien. Par exemple, si certaines personnes sont encouragées à suivre un traitement, vous ne voulez pas vous y conditionner. L'inclusion de variables non pertinentes dans la spécification du score de propension peut augmenter la variance, car certaines des unités traitées doivent être éliminées de l'analyse ou les unités de contrôle doivent être utilisées plus d'une fois ou parce que la bande passante doit augmenter. En bref, l'approche de l'évier de cuisine n'est certainement pas recommandée.

La CIA ne peut pas être testée sans données expérimentales ou hypothèses de «sur-identification» (comme dans le cas du test pré-programme ou d'autres faux tests placebo). Si vous avez suffisamment de données historiques, j'essaierais certainement ces dernières sur votre ensemble soigneusement organisé.


Réponse à modifier:
je ne peux pas commenter les reins car c'est trop loin de ma région (à part les tartes, dont je sais quelque chose). L'urbain semble être une variable qui affecte à la fois la participation et les résultats à travers les coûts associés au voyage à l'hôpital pour le traitement et l'examen. Il pourrait ramasser certains des inobservables qui nous empêchent de dormir la nuit. L'histoire d'anticipation que j'ai en tête est que les gens peuvent ajuster leur comportement s'ils savent qu'ils seront traités à l'avenir, par exemple en changeant leur régime alimentaire.

Dimitriy V. Masterov
la source
2

Parce que le modèle de score de propension est purement prédictif - vous n'êtes pas intéressé par les coefficients - j'ai toujours compris que vous pouvez lancer toutes vos variables qui affectent à la fois l'entrée dans la cohorte et les résultats. Vous pouvez tordre ces variables comme vous le souhaitez - les cadrer, les enraciner, tous les types d'interactions, etc. etc. - tant que vous augmentez la qualité prédictive de votre modèle.

En théorie, vous ne devriez même pas avoir à vous soucier des données restantes pour votre modèle prédictif, car vous ne souhaitez pas généraliser ces résultats au-delà de votre échantillon (en gros, le risque de `` sur-ajustement '' n'est pas un problème). Enfin, vous n'avez pas à vous limiter à la régression logistique; lorsque vous modélisez une sortie binaire, vous pouvez même utiliser un modèle GAM - fondamentalement, n'importe quoi pour améliorer les taux de prédiction.

(Je dois ajouter une note contraire au point d'utilisation de @statsRus: d'après mon expérience, ce sont les informaticiens qui utilisent toutes les variables tandis que les statisticiens examinent attentivement chacune d'elles. Je suppose que des antécédents professionnels différents produisent des habitudes de travail différentes.)

Quant à l'utilisation du score, il est généralement déconseillé de l'utiliser comme covariable - il a moins d'impact - et certainement pas à côté des variables utilisées pour faire la variable de score. Un argument pourrait être avancé si, dans le score de propension, vous avez catégorisé une variable continue - l'âge par exemple - où vous pourriez alors inclure la version continue dans le modèle mais vraiment, ne catégorisez pas la variable en premier lieu ...

L'utilisation du score pour l'appariement (avec des étriers - en particulier l'appariement de la variable 1: N) est populaire, mais je pense que la technique la plus efficace est le poids de traitement proportionnel inverse (IPTW) - bien que je n'aie pas utilisé cette méthode et je ne me souviens pas comment Ça marche.

Essayez de regarder le travail de Peter C. Austin à l'Université de Toronto - il a écrit de nombreux articles sur les scores de propension. En voici un sur l'appariement par exemple.

randonnées
la source