Régression modérée: pourquoi calculons-nous un terme * produit * entre les prédicteurs?

12

Les analyses de régression modérée sont souvent utilisées en sciences sociales pour évaluer l'interaction entre deux ou plusieurs prédicteurs / covariables.

En règle générale, avec deux variables prédictives, le modèle suivant est appliqué:

Y=β0+β1X+β2M+β3XM+e

Notez que le test de modération est opérationnalisé par le terme produit XM (la multiplication entre la variable indépendante X et la variable modératrice M ). Ma question très fondamentale est: pourquoi calculons-nous réellement un terme de produit entre X et M ? Pourquoi pas, par exemple, la différence absolue |MX|ou juste la somme X+M ?

Fait intéressant, Kenny fait allusion à ce problème ici http://davidakenny.net/cm/moderation.htm en disant: "Comme on le verra, le test de modération n'est pas toujours opérationnalisé par le terme de produit XM" mais aucune autre explication n'est donnée . Une illustration ou une preuve formelle serait éclairante, je suppose / j'espère.

dénominateur
la source

Réponses:

12

Un "modérateur" affecte les coefficients de régression de Y contre X : ils peuvent changer à mesure que les valeurs du modérateur changent. Ainsi, en toute généralité, le modèle de régression simple de modération est

E(Y)=α(M)+β(M)X

où et sont des fonctions du modérateur plutôt que des constantes non affectées par des valeurs de .β M MαβMM

Dans le même esprit dans lequel la régression est fondée sur une approximation linéaire de la relation entre et , nous pouvons espérer que et sont - au moins approximativement - des fonctions linéaires de dans toute la gamme de valeurs de dans les données:Y α β M MXYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

La suppression des termes non linéaires ("big-O"), dans l'espoir qu'ils soient trop petits pour être importants, donne le modèle d'interaction multiplicative (bilinéaire)

(1)E(Y)=α0+β0X+α1M+β1MX.

Cette dérivation suggère une interprétation intéressante des coefficients: est la vitesse à laquelle change l' ordonnée à l'origine tandis que est la vitesse à laquelle change la pente . ( et sont la pente et l'ordonnée à l'origine lorsque est (formellement) mis à zéro.) est le coefficient du "terme de produit" . Il répond à la question de cette manière: M β 1 M α 0 β 0 Mα1Mβ1Mα0β0M M Xβ1MX

Nous modélisons la modération avec un terme de produit lorsque nous nous attendons à le modérateur sera (environ, en moyenne) ont une relation linéaire avec la pente de vs .MMXMXY X


Il est intéressant de noter que cette dérivation ouvre la voie à une extension naturelle du modèle, ce qui pourrait suggérer des moyens de vérifier la qualité de l'ajustement. Si vous n'êtes pas concerné par la non-linéarité dans vous savez ou supposez que le modèle est précis - alors vous voudriez étendre le modèle pour tenir compte des termes qui ont été supprimés:( 1 )X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Tester l'hypothèse évalue la qualité de l'ajustement. L'estimation de et pourrait indiquer de quelle manière le modèle pourrait devoir être étendu: pour incorporer la non-linéarité dans (lorsque ) ou une relation de modération plus compliquée (lorsque ) ou peut-être tous les deux. (Notez que ce test ne serait pas suggéré par une expansion en série de puissance d'une fonction générique .)α 2 β 2 ( 1 ) M α 20 β 20α2=β2=0α2β2(1)Mα20β20f(X,M)


Enfin, si vous deviez découvrir que le coefficient d'interaction n'était pas significativement différent de zéro, mais que l'ajustement est non linéaire (comme en témoigne une valeur significative de ), alors vous (a) qu'il y a de la modération mais ( b) il n'est pas modélisé par un terme , mais plutôt par des termes d'ordre supérieur commençant par . C'est peut-être le genre de phénomène auquel Kenny faisait référence.β 2 M X M 2 Xβ1β2MXM2X

whuber
la source
8

Si vous utilisez la somme des prédicteurs pour modéliser leur interaction, votre équation serait:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

où et . Par conséquent, votre modèle n'aurait aucune interaction. De toute évidence, ce n'est pas le cas avec le produit.β 2 = ββ1=β1+β3β2=β2+β3

Rappelons la définition de la valeur absolue:

|XM|={XM,XMMX,X<M

Bien que vous puissiez réduire le modèle à celui avec seulement et termes, en utilisant la déf. de, la valeur absolue est une "forme de modération spécialisée qui est peu susceptible d'être réaliste dans de nombreuses situations", comme indiqué dans le commentaire ci-dessous.β0+β1X+β2M+β3|XM|+eXM|XM|

Milos
la source
1
En fait, y compris unle terme est manifestement une forme de modération: la valeur de change . Il s'agit cependant d'une forme de modération limitée et spécialisée qui est peu susceptible d'être réaliste dans de nombreuses situations. Il n'est pas correct de dire qu'un tel modèle n'a "que des effets principaux". |XM|Mβ2
whuber
1
Oui, vous avez raison,est une forme de modération, je me suis laissé emporter par la transformation et éditerai la réponse en conséquence. Merci de l'avoir signalé. |XM|
Milos
@Milos: Votre exemple sur la somme des prédicteurs a été révélateur, un peu embarrassant, je dois dire parce que j'aurais déjà dû réaliser les implications mathématiques;) whuber: Pour autant que je le comprenne, la valeur absolue est seulement utile lorsque les deux variables prédictives sont mesurées dans les mêmes unités (par exemple, deux tests psychométriques, utilisant la même métrique, tels que les scores z ou les scores T). La différence absolue entre X et M est une métrique utile , bien qu'elle ne soit pas la seule possible (c'est-à-dire que le terme prodcut pourrait également être utilisé).
dénominateur
6

Vous ne trouverez pas de preuve formelle pour utiliser le modérateur multiplicatif. Vous pouvez soutenir cette approche par d'autres moyens. Par exemple, regardez l'expansion de Taylor-MacLaurin d'une fonction :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Si vous branchez une fonction de cette forme dans l'équation de Taylor, vous obtenez ceci:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Donc, la justification ici est que cette forme multiplicative particulière de la modération est fondamentalement une approximation de Taylor de second ordre d'une relation de modération génériquef(X,M)

MISE À JOUR: si vous incluez des termes quadratiques, comme @whuber l'a suggéré, cela se produira: branchez ceci dans Taylor:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Cela montre que notre nouveau modèle à termes quadratiques correspond à une approximation complète de Taylor de second ordre, contrairement au modèle de modération original .f ( X , M )g(X,M)f(X,M)

Aksakal
la source
Puisque la base de votre argument est l'expansion de Taylor, pourquoi n'avez-vous pas également inclus les deux autres termes quadratiques et ? Certes, ce ne sont pas des formes de modération, mais leur inclusion dans le modèle affectera généralement . M 2 β X MX2M2βXM
whuber
@whuber, j'ai décidé de garder le post court - c'est la raison principale. Sinon, j'ai commencé à écrire sur ma préférence pour inclure des termes de deuxième ordre chaque fois que vous avez un terme croisé, puis le couper.
Aksakal