Les analyses de médiation sont-elles intrinsèquement causales?

19

Je souhaite tester un modèle de médiation simple avec un IV, un DV et un médiateur. L'effet indirect est significatif, comme testé par la macro Preacher et Hayes SPSS, ce qui suggère que le médiateur sert de médiateur statistique à la relation.

En lisant sur la médiation, j'ai lu des choses telles que "Notez qu'un modèle de médiation est un modèle causal." - David Kenny . Je peux certainement apprécier l'utilisation de modèles de médiation comme modèles causaux, et en effet, si un modèle est théoriquement solide, je peux voir cela comme très utile.

Dans mon modèle, cependant, le médiateur (un trait considéré comme une diathèse pour les troubles anxieux) n'est pas causé par la variable indépendante (symptômes d'un trouble anxieux). Plutôt, le médiateur et les variables indépendantes sont liés, et je crois que l'association entre la variable indépendante et la variable dépendante peut s'expliquer en grande partie par la variance entre le IV-médiateur-DV. Essentiellement, j'essaie de démontrer que les rapports précédents de la relation IV-DV peuvent être expliqués par un médiateur apparenté qui n'est pas causé par la IV.

La médiation est utile dans ce cas car elle explique comment la relation IV-DV peut être expliquée statistiquement par la relation IV-Mediator-DV. Mon problème est la question de la causalité. Un examen pourrait-il revenir et nous dire que la médiation n'est pas appropriée parce que la IV ne cause pas en fait le médiateur (ce que je n'aurais jamais argumenté en premier lieu)?

Est-ce que ça a du sens? Toute rétroaction à ce sujet serait grandement appréciée!

Edit : Ce que je veux dire, c'est que X est corrélé avec Y non pas parce qu'il provoque Y, mais parce que Z provoque Y (partiellement) et parce que X et Z sont fortement corrélés. Un peu déroutant, mais c'est tout. Les relations causales dans ce cas ne sont pas vraiment en cause et ce manuscrit n'est pas tellement sur la causalité. Je cherche simplement à démontrer que la variance entre X et Y peut s'expliquer par la variance entre Z et Y. Donc, fondamentalement, que X est corrélé indirectement à Y à Z (le «médiateur» dans ce cas).

Behacad
la source

Réponses:

15

A. La «médiation» signifie conceptuellement la causalité (comme l'indique la citation de Kenny). Les modèles de trajectoire qui traitent une variable en tant que médiateur signifient donc que certains traitements influencent une variable de résultat par son effet sur le médiateur, variance qui à son tour fait varier le résultat. Mais modéliser quelque chose en tant que «médiateur» ne signifie pas qu'il est vraimentun médiateur - c'est la question de la causalité. Votre message et votre commentaire en réponse à Macro suggèrent que vous ayez à l'esprit une analyse de chemin dans laquelle une variable est modélisée comme médiateur mais n'est pas considérée comme "causale"; Mais je ne vois pas vraiment pourquoi. Pensez-vous que la relation est fausse - qu'il y a une troisième variable qui cause à la fois la "variable indépendante" et le "médiateur"? Et peut-être que la «variable indépendante» et le «médiateur» dans votre analyse sont en fait des médiateurs de l'influence de la 3e variable sur la variable de résultat? Dans l'affirmative, un examinateur (ou toute personne réfléchie) voudra savoir quelle est la troisième variable et quelles preuves vous avez qu'elle est responsable des relations fallacieuses entre ce qui sont en fait des médiateurs.

B. Pour étendre le poste de Macro, il s'agit d'un fourré notoire, envahi de dogmes et de scolastique. Mais voici quelques faits saillants:

  1. Certaines personnes pensent que vous ne pouvez "prouver" la médiation que si vous manipulez expérimentalement le médiateur ainsi que l'influence supposée exercer l'effet causal. En conséquence, si vous faisiez une expérience qui ne manipulait que l'influence causale et observiez que son impact sur la variable de résultat était reflété par des changements dans le médiateur, ils le feraient si "non! Pas assez bien!" Fondamentalement, cependant, ils ne pensent tout simplement pas que les méthodes d'observation soutiennent jamais les inférences causales et les médiateurs non manipulés dans les expériences ne sont qu'un cas spécial pour eux.

  2. D'autres personnes, qui n'excluent pas d'emblée les inférences causales, pensent néanmoins que si vous utilisez des méthodes statistiques vraiment vraiment très compliquées (y compris, mais sans s'y limiter, des modèles d'équations structurelles qui comparent la matrice de covariance de la relation de médiation proposée avec celles pour diverses alternatives), vous pouvez effectivement faire taire les critiques que je viens de mentionner. Fondamentalement, c'est Baron & Kenny, mais sous stéroïdes. Empiriquement parlant, ils ne les ont pas réduits au silence; logiquement, je ne vois pas comment ils pourraient.

  3. D'autres encore, notamment Judea Pearl, disent que la solidité des inférences causales dans les études expérimentales ou observationnelles ne peut jamais être prouvée avec des statistiques; la force de l'inférence est inhérente à la validité de la conception. Les statistiques ne font que confirmer l'effet que l'inférence causale envisage ou dépend.

Quelques lectures (qui sont toutes bonnes, pas dogmatiques ou scolastiques):

Enfin et surtout, une partie d'un échange cool entre Gelman et Pearl sur l'inférence causale dans laquelle la médiation était au centre de l'attention: http://andrewgelman.com/2007/07/identification/

dmk38
la source
Merci pour votre réponse. Je vais essayer d'élaborer ma méthode. La littérature a déterminé que X se rapporte à Y, Z se rapporte à Y et que X se rapporte à Z. Personne n'a auparavant envisagé la possibilité que X se rapporte à Y en raison de sa relation avec Z. En faisant une analyse de médiation, j'espérais démontrer que le la relation entre X et Y peut être expliquée par la relation entre X et Z. Fondamentalement, cette variance partagée entre X et Y est due au chevauchement de la variance entre X et Z (et Y). Théoriquement, je souhaite suggérer que Z (plutôt que X) devrait être considéré dans les modèles théoriques.
Behacad
Ce dont je ne suis pas encore tout à fait sûr, c'est de ce que vous entendez par "la possibilité que X soit lié à Y en raison de sa relation avec Z ". Voulez-vous dire que la relation entre X et Y est fausse? Que Z cause les deux? Ou bien que X est un médiateur de l'influence de Z sur Y? D'autres pourraient être en désaccord - nous pouvons entrer dans le fourré - mais c'est là que je pense que Pearl entre en jeu. L'analyse de médiation ne peut pas vous dire laquelle de ces affirmations est vraie: X -> Z -> Y; Z -> X, Z -> Y; ou Z -> X -> Y. Tout pourrait "s'adapter"; l'inférence causale dépend ici d'hypothèses extrinsèques au modèle statistique.
dmk38
Ce que je veux dire, c'est que X est corrélé à Y non pas parce qu'il provoque Y, mais parce que Z provoque Y et parce que X et Z sont fortement corrélés. Un peu déroutant, mais c'est tout. Les relations causales dans ce cas ne sont pas vraiment en cause. Je cherche simplement à démontrer que la variance entre X et Y peut s'expliquer par la variance entre Z et Y. Donc, fondamentalement, que X est corrélé indirectement à Y à Z. Peut-être que tout mon problème appelle cette "médiation" alors que je devrais faire référence à ce phénomène est confondant. Peut-être que McKinnon, Krull et Lockwood (2000) vous aideront.
Behacad
1
Comme le suggèrent McKinnon, Krull et Lockwood, la médiation et la confusion sont statistiquement identiques. Conceptuellement, c'est en quoi ils diffèrent. "Contrairement à l'hypothèse de médiation, la confusion n'implique pas nécessairement une relation causale entre les variables. En fait, au moins une définition d'un effet de confusion exige spécifiquement que la troisième variable ne soit pas une variable" intermédiaire "..." - dionysus.psych .wisc.edu / Lit / Thèmes / Statistiques / Médiation /… .
Behacad
Le "confondeur" est la 3ème variable qui provoque la corrélation parasite. Donc, dans votre cas, Z est le facteur de confusion - s'il provoque à la fois X et Y, et donc vaincre l'inférence X-> Y. Mais vous semblez vouloir dire qu'une "corrélation" entre X et Z "explique" la relation entre X et Y et exclut donc X cause Y. Vous avez besoin de plus que cela. Vous avez besoin d'une inférence causale sur la relation entre Z et X qui exclut X-> Y. Sinon, la corrélation ZX pourrait toujours être cohérente avec X-> YEg, X pourrait médier l'impact de Z sur Y. Les corrélations simples «n'expliquent» pas autant que vous l'espérez.
dmk38
13

Causalité et médiation

  • Un modèle de médiation fait des affirmations théoriques sur la causalité.
    • Le modèle propose que les IVcauses du DVet que cet effet s'explique totalement ou partiellement par une chaîne de causalité par laquelle les IVcauses MEDIATORqui à leur tour provoquent le DV.
  • La prise en charge d'un modèle de médiation ne prouve pas la voie causale proposée.
    • Les tests statistiques de médiation sont généralement basés sur des études observationnelles. La gamme d'interprétations causales alternatives est large (par exemple, troisièmes variables, directions alternatives, réciprocité, etc.)
    • Je ne suis généralement pas convaincu par les arguments (le cas échéant) présentés par les chercheurs qui proposent des allégations causales impliquées dans les modèles de médiation.
  • Le soutien à un modèle de médiation peut fournir des preuves pour compléter d'autres sources de preuves lors de la construction d'un argument pour une allégation causale. En résumé, la corrélation ne prouve pas la causalité, mais elle peut fournir des preuves supplémentaires.
  • Malgré les limites des tests de médiation dans les études observationnelles, (a) les modèles de médiation sont bons pour amener les chercheurs à réfléchir aux voies de causalité, et (b) il existe de meilleures et pires façons de rédiger des modèles de médiation, où de meilleures façons reconnaissent les nuances d'interprétation et fournir une discussion théorique approfondie des preuves à la fois pour la voie causale proposée et les voies causales alternatives ( voir cette page de conseils que j'ai préparés ).
  • @ dmk38 a fourni d'excellentes références et une discussion supplémentaire.

Montrer qu'une variable explique la prédiction d'une autre variable

  • D'après votre description, la médiation ne semble PAS correspondre à votre question de recherche. En tant que tel, j'éviterais d'utiliser le langage de la médiation dans vos analyses.
  • Si je comprends bien, votre question de recherche vise à savoir si la prédiction d'une variable (permet de l'appeler à la X1place de IV) sur le DVest expliquée par une deuxième variable (permet de l'appeler à la X2place de MEDIATOR). Vous pouvez également faire des allégations de causalité comme des X2causes, DVmais X1n'est corrélée qu'avec X2et ne cause pas DV.
  • Il existe plusieurs tests statistiques qui pourraient convenir pour tester cette question de recherche:
    • Comparez l'ordre zéro ( X1avec DV) avec les corrélations semi-partielles ( X1en partant X2avec DV). J'imagine que l'élément intéressant serait le degré de réduction et non pas tant la signification statistique (bien que vous souhaitiez bien sûr obtenir des intervalles de confiance sur cette réduction).
    • Ou de même, comparez le carré R incrémentiel d'une régression hiérarchique où vous ajoutez X2dans le bloc 1 et X1dans le bloc 2 avec le carré R d'un modèle avec juste X1prédire DV.
    • J'imagine que vous pourriez également dessiner un diagramme de chemin qui s'aligne avec vos hypothèses causales (par exemple, des flèches à double tête entre X1et X2et une flèche à tête unique entre X2et DV.
Jeromy Anglim
la source
(+1), très clair et précis.
NRH
Je pense que vous avez réussi. Bien que la réponse de dmk38 soit excellente en termes théoriques sur le problème sous-jacent, voici les soultions. J'irais également avec une corrélation partielle ou une régression hiérarchique pour montrer qu'il doit y avoir une troisième variable provoquant l'effet. Le langage de la médiation est complètement trompeur dans ce contexte car il est intrinsèquement causal.
Henrik
Merci beaucoup, c'est utile. Les relations "causales" sont assez compliquées étant donné la nature des constructions que j'étudie (par exemple, deux types de traits qui s'influencent mutuellement au cours d'une vie), ce qui embrouille encore plus l'eau. Merci encore!
Behacad
0

Je crois que ces variables dont vous parlez devraient peut-être être considérées comme des variables de «contrôle» si le IV ne les cause pas ou comme des modérateurs si vous attendez un effet d'interaction. Essayez-le sur papier et travaillez-le plusieurs fois dans votre esprit ou dessinez les effets hypothétiques.

benji
la source
0

Peut-être un meilleur langage, ou du moins beaucoup moins déroutant, est une fausse corrélation. Un exemple typique de ceci est que la consommation de glaces est en corrélation avec la noyade. Par conséquent, quelqu'un pourrait penser que la consommation de glaces provoque une noyade. Une corrélation parasite se produit lorsqu'une troisième variable "modératrice" est en fait causale par rapport aux deux premières. Dans notre exemple, nous avons examiné les ventes de glaces et les noyades dans le temps, et oublié les effets saisonniers modérés par la température, et, bien sûr, plus de glaces sont consommées quand il fait chaud, et plus de gens se noient, car plus cherchent des secours de la chaleur en nageant et en mangeant des glaces. Quelques exemples humoristiques .

La question se résume donc à quoi pourrait-on utiliser une fausse corrélation? Et, il s'avère, ils sont utilisés parce que les gens ne testent pas leurs théories. Par exemple, la fonction rénale est souvent «normalisée» par rapport à la surface corporelle estimée, comme estimé par une formule de poids et de taille.

Maintenant, la surface corporelle ne provoque pas la formation d'urine, et dans la formule du poids et de la taille, le poids est causal via la loi de Kleiber et la taille rend la formule moins prédictive .

Carl
la source
0

Je suis tombé sur ce post dans mes propres recherches sur l'inférence causale dans le contexte de la génomique. La tentative de discerner la causalité dans ce domaine découle souvent de la façon dont le code génétique d'une personne peut être considéré comme aléatoire (en raison de la façon dont les cellules sexuelles sont formées et finalement associées). En associant cela à des mutations connues associées à la fois à un «médiateur» et à une réponse ultime, on peut raisonner l'effet causal d'un médiateur sur cette réponse selon certaines définitions de la causalité (qui, j'en suis sûr, pourrait déclencher un long débat ici).

Dans le cas où vous utilisez un modèle de médiation et ne prétendez pas le lien de causalité, je ne pouvais pas penser pourquoi le réviseur argumenterait. Bien que vous deviez probablement exclure si l'effet de médiation que vous avez observé est confondu par la troisième variable.

Si vous êtes explicitement intéressé par la causalité, vous voudrez peut-être étudier les méthodes de l'épidémiologie comme la randomisation mendélienne ou le « test d'inférence causale ». Ou commencez par l' analyse des variables instrumentales .

Will C
la source