En quoi les scores de propension sont-ils différents de l’addition de covariables dans une régression et quand sont-ils préférés à cette dernière?

41

J'admets que je suis relativement nouveau dans les scores de propension et l'analyse causale.

Une chose qui ne me semble pas évident en tant que nouveau venu est de savoir en quoi l’équilibrage à l’aide des scores de propension est mathématiquement différent de ce qui se produit lorsque nous ajoutons des covariables dans une régression. En quoi l'opération est-elle différente et pourquoi est-elle (ou est-elle) meilleure que l'ajout de covariables de sous-population dans une régression?

Certaines études comparent empiriquement les méthodes, mais je n'ai pas vu de bonne discussion relier les propriétés mathématiques des deux méthodes et expliquer pourquoi PSM se prête à des interprétations causales alors que l'inclusion de covariables de régression ne le fait pas. Il semble également y avoir beaucoup de confusion et de controverse dans ce domaine, ce qui rend les choses encore plus difficiles à comprendre.

Avez-vous des idées à ce sujet ou des indicateurs de bonnes ressources / documents pour mieux comprendre la distinction? (Je fais lentement mon chemin à travers le livre de causalité de Judea Pearl, donc pas besoin de m'indiquer ça)

Frank Barry
la source
3
Vous recommandons de lire Morgan et Winship, 2007 . Les chapitres 4 et 5 font une comparaison et un contraste explicites de la régression et de la correspondance pour l'identification de l'effet de causalité.
conjugateprior
1
Lorsque vous vérifiez les statistiques de solde, vous vous assurez qu'il n'y a pas d'extrapolation entre les groupes de traitement que vous comparez en ce qui concerne l'espace de covariables multidimensionnelles. La régression extrapole simplement sans vérifier, les extrapolations peuvent donc donner de mauvaises prévisions.
StatsStudent

Réponses:

17

Une grande différence est que la régression "contrôle" ces caractéristiques de manière linéaire. L'appariement par les scores de propension élimine l'hypothèse de linéarité, mais comme certaines observations peuvent ne pas correspondre, il se peut que vous ne puissiez rien dire à propos de certains groupes.

Par exemple, si vous étudiez un programme de formation des travailleurs, vous pouvez avoir tous les hommes inscrits, mais la population de contrôle non-participants doit être composée d'hommes et de femmes. En utilisant la régression, vous pouvez régresser, par exemple sur le revenu, sur une variable d'indicateur de participation et sur un indicateur masculin. Vous utiliseriez toutes vos données et pourriez estimer le revenu d'une femme si elle avait participé au programme.

Si vous faisiez correspondre, vous ne pouvez associer les hommes aux hommes. En conséquence, vous n'utiliseriez aucune femme dans votre analyse et vos résultats ne les concerneraient pas.

La régression peut extrapoler en utilisant l'hypothèse de linéarité, mais la correspondance ne peut pas. Toutes les autres hypothèses sont essentiellement les mêmes entre régression et correspondance. L'avantage de l'appariement par rapport à la régression est qu'elle est non paramétrique (sauf que vous devez supposer que vous avez le bon score de propension, si c'est ainsi que vous effectuez l'appariement).

Pour plus de discussion, voir ma page ici pour un cours qui était fortement axé sur les méthodes d'appariement. Voir en particulier Hypothèses de la stratégie d'estimation des effets causaux .

Assurez-vous également de lire l'article de Rosenbaum et Rubin (1983) qui décrit l'appariement du score de propension.

Enfin, la correspondance a parcouru un long chemin depuis 1983. Consultez la page Web de Jas Sekhon pour en savoir plus sur son algorithme de correspondance génétique.

Charlie
la source
3
C'est peut-être parce que je ne suis pas statisticien, mais quand il semble que vous avez supposé une régression linéaire lorsque le PO a posé des questions sur la régression en général. Mais je suppose que l'essentiel est que l'ajout de covariables à n'importe quel type de régresseur suppose certaines hypothèses sur l'espace d'entrée afin qu'il puisse extrapoler à de nouveaux exemples, et l'appariement est plus prudent quant au type de choses pouvant être extrapolées.
Rrenaud
2
Vous faites des hypothèses sur la forme fonctionnelle des variables de confusion lorsque vous estimez la fonction de propension. Vous associez également ultérieurement des individus qui ont des valeurs "proches" de la propension. Par conséquent, je ne supposerais pas immédiatement que l'appariement de propension résout le problème des effets de confusion non linéaires.
AdamO
2
Les liens sont cassés.
Carlos Cinelli
11

La réponse courte est que les scores de propension ne sont pas meilleurs que le modèle équivalent ANCOVA, en particulier en ce qui concerne l'interprétation causale.

Les scores de propension sont mieux compris comme une méthode de réduction des données. Ils constituent un moyen efficace de réduire de nombreuses covariables en un seul score qui peut être utilisé pour ajuster un effet d'intérêt pour un ensemble de variables. Ce faisant, vous économisez des degrés de liberté en vous ajustant pour un score de propension unique plutôt que pour plusieurs covariables. Cela présente un avantage statistique, certes, mais rien de plus.

Une question qui peut se poser lors de l’ajustement de régression avec les scores de propension est de savoir s’il ya un avantage à utiliser le score de propension plutôt qu’à effectuer un ajustement de régression avec toutes les covariables utilisées pour estimer le score de propension inclus dans le modèle. Rosenbaum et Rubin ont montré que "l'estimation ponctuelle de l'effet du traitement à partir d'une analyse de l'ajustement de covariance pour X à plusieurs variables est égale à l'estimation obtenue à partir d'un ajustement de covariance univarié pour le discriminant linéaire de l'échantillon basé sur X, chaque fois que la même matrice de covariance est utilisée tant pour l’ajustement de covariance que pour l’analyse discriminante ". Ainsi, les résultats des deux méthodes devraient conduire aux mêmes conclusions. cependant, L'un des avantages de la procédure en deux étapes est qu'il est possible d'adapter en premier un modèle de score de propension très compliqué avec des interactions et des termes d'ordre supérieur. Étant donné que l'objectif de ce modèle de score de propension est d'obtenir la meilleure probabilité estimée d'assignation de traitement, on ne s'inquiète pas de la paramétrisation excessive de ce modèle.

De:

MÉTHODES DE SCORE DE PROPENSITÉ POUR LA RÉDUCTION DU BIAIS DANS LA COMPARAISON D'UN TRAITEMENT À UN GROUPE DE CONTRÔLE NON ALÉATOIRE

D'Agostino (citant Rosenbaum et Rubin)

D'agostino, RB 1998. Appariement du score de propension à la réduction du biais dans la comparaison d'un traitement à un groupe témoin non randomisé. Statistical Medicine 17: 2265–2281.

Brett
la source
5
(+1) Il y avait aussi un fil conducteur intéressant sur le problème de causalité dans cette question connexe: D'un point de vue statistique, peut-on inférer une causalité en utilisant des scores de propension avec une étude observationnelle? .
chl
3
Je suis d'accord avec la prémisse générale de cette réponse, mais quand on fait correspondre les scores de propension, ce n'est pas la même chose que d'inscrire toutes les covariables dans le modèle (et qu'il ne s'agit donc pas simplement d'une technique de réduction de dimension). Ce n'est pas la même chose si on pondère par les scores de propension non plus.
Andy W
1
Je ne suis pas d'accord avec cette réponse. Les scores de propension estimés sont bons quand ils équilibrent les covariables dans les groupes de traitement et de contrôle et mauvais quand ils ne le sont pas. Tout comme pour une approche de conditionnement par régression. Qu'elles soient «meilleures» ne dépend que de cette propriété, qui varie d'un problème à l'autre.
conjugateprior
1
Je ne suis pas d'accord, car si le critère, l'équilibre, est le même, les deux stratégies sont différentes, de même que leurs forces et leurs faiblesses. On peut ou peut ne pas être une meilleure approche, en fonction du problème. En effet, le « modèle ANCOVA équivalent » me semble mal défini. (Équivalent comment?)
conjugateprior
1
Droite. Je vois maintenant ce que «équivalent» voulait dire, mais la phrase qui commence par «Cependant» dans votre citation introduit la différence pertinente: dans la pratique, prop. les scores sont estimés séparément avec précision, de sorte qu'ils peuvent être beaucoup plus complexes que le modèle d'analyse. (Et il y a une autre différence dans le paragraphe suivant de l'article, non cité.)
conjugateprior
7

Une référence probablement obtuse, mais si par hasard vous y avez accès, je vous recommanderais de lire ce chapitre du livre ( Apel et Sweeten, 2010 ). Il s’adresse aux spécialistes des sciences sociales et n’est donc peut-être pas aussi rigoureux sur le plan mathématique que vous semblez vouloir, mais il devrait aller suffisamment en profondeur pour constituer une réponse plus que satisfaisante à votre question.

Il existe différentes manières pour les personnes de traiter les scores de propension qui peuvent aboutir à des conclusions différentes de la simple inclusion de covariables dans un modèle de régression. Lorsque l'on correspond à des scores, on ne dispose pas nécessairement d'un soutien commun pour toutes les observations (c'est-à-dire que certaines observations semblent ne jamais avoir la chance de faire partie du groupe de traitement et d'autres le sont toujours). On peut aussi pondérer les observations de différentes manières, ce qui peut conduire à des conclusions différentes.

En plus des réponses ici, je vous suggère également de consulter les réponses à la question citée. Les scores de propension ont plus de substance que la simple astuce statistique pour atteindre l’équilibre covariable. Si vous lisez et comprenez les articles très cités de Rosenbaum et Rubin, vous comprendrez mieux pourquoi l'approche est différente de la simple addition de covariables dans un modèle de régression. Je pense qu'une réponse plus satisfaisante à votre question ne se trouve pas nécessairement dans les mathématiques derrière les scores de propension, mais dans leur logique.

Andy W
la source
@Andy W Voir la citation de Rosenbaum et Rubin sur l'équivalence de la régression avec les covariables et l'ajustement du score de propension dans mon message mis à jour.
Brett
0

J'aime penser à PS comme une partie de l'étude qui est complètement séparée de l'analyse. En d’autres termes, vous pouvez penser en termes de conception (PS) et d’analyse (régression, etc.). De plus, le PS offre un moyen de supporter l’échange pour le traitement binaire; d’autres peuvent peut-être indiquer si l’inclusion des covariables dans le modèle de résultats peut effectivement favoriser l’échange, ou si l’on suppose l’échangeabilité avant d’inclure les covariables dans le modèle de résultats.

Théorie de Galois
la source
-3

Méthodes statistiques Med Res. 19 avril 2016.

Une évaluation du biais dans les modèles de régression non linéaire ajustés par le score de propension.

Les méthodes de score de propension sont couramment utilisées pour ajuster les facteurs de confusion observés lors de l'estimation de l'effet du traitement conditionnel dans les études d'observation. Une méthode populaire, l'ajustement covariable du score de propension dans un modèle de régression, s'est avérée empiriquement biaisée dans les modèles non linéaires. Cependant, aucune raison théorique sous-jacente convaincante n'a été présentée. Nous proposons un nouveau cadre pour étudier le biais et la cohérence des effets de traitement ajustés par le score de propension dans les modèles non linéaires, qui utilise une approche géométrique simple pour établir un lien entre la cohérence de l'estimateur du score de propension et la collapsibilité des modèles non linéaires. Dans ce cadre, nous démontrons que l'ajustement du score de propension dans un modèle de résultat entraîne la décomposition des covariables observées en score de propension et en terme restant. L'omission de ce terme restant dans un modèle de régression non compressible conduit à des estimations biaisées du rapport de cotes conditionnel et du ratio de risque conditionnel, mais pas du rapport de taux conditionnel. Nous montrons en outre, via des études de simulation, que le biais de ces estimateurs ajustés par le score de propension augmente avec une taille d'effet de traitement plus grande, des effets de covariable plus grands et une dissimilarité croissante entre les coefficients des covariables dans le modèle de traitement par rapport au modèle de résultats.

dt2016
la source