Comment tracer une interaction entre un facteur et une covariable continue?

Réponses:

11

Si vous parlez d'une interaction dans un modèle linéaire général (par exemple, ANCOVA), et si votre modérateur catégorique a un nombre raisonnablement petit de niveaux, vous pouvez tracer des lignes de régression distinctes pour chaque niveau du modérateur. Si vous les souhaitez sur le même tracé, superposez-les, codez par couleur ou par type de ligne et fournissez une légende. L'un des axes de votre graphique représentera le prédicteur continu (vraisemblablement l' axe horizontal " "), et l'autre représentera la variable dépendante, qui, je suppose, est continue. Si votre prédicteur catégorique (modérateur) a plus de quatre niveaux, cela pourrait devenir un peu trop occupé pour une parcelle, mais je ne connais pas de meilleure méthode pour de telles circonstances qui ne recourt pas à des parcelles distinctes pour chaque niveau.x

Nick Stauner
la source
Merci pour votre réponse! Je fais en effet référence à un GLM (univarié), qui ne me permet que de tracer des moyennes marginales estimées pour les interactions factorielles. Je ne sais pas trop comment superposer comme tu dis ... Je travaille avec SPSS. pourriez-vous détailler un peu plus à ce sujet?
Andreea
1
Pour SPSS, enregistrez simplement les valeurs prédites après avoir estimé le modèle. Ensuite, dans le graphique, tracez les valeurs prédites sur l'axe Y et le prédicteur continu sur l'axe X, puis utilisez la variable catégorielle pour regrouper les lignes ou les points.
Andy W
Merci! juste pour clarifier, quel graphique dois-je produire exactement pour cela? Est-ce un nuage de points avec une ligne de régression? Si c'est le cas, alors je devrais produire 3 graphiques différents pour les 3 niveaux différents de mon modérateur ... comment le mettre sur le même graphique? Aussi juste pour clarifier que les valeurs prévues prennent en considération la régression ajustée avec des covariables?
Andreea
1
@Andreea, j'ai ajouté une réponse pour répondre à votre commentaire.
Penguin_Knight
@AndyW enregistrez-vous les valeurs prévues du modèle estimé avec ou sans le terme d'interaction (ou cela n'a-t-il pas d'importance)?
Jeremyjaytaylor
4

Juste pour répondre au commentaire suivant:

Merci! juste pour clarifier, quel graphique dois-je produire exactement pour cela? Est-ce un nuage de points avec une ligne de régression? Si c'est le cas, alors je devrais produire 3 graphiques différents pour les 3 niveaux différents de mon modérateur ... comment le mettre sur le même graphique? Aussi juste pour clarifier que les valeurs prévues prennent en considération la régression ajustée avec des covariables?

Voici comment procéder dans SPSS. J'utilise les Employee.savdonnées comme exemple. Supposons que nous aimerions utiliser le salaire comme résultat, le salaire de départ comme prédicteur continu et la catégorie d'emploi comme prédicteur catégorique:

entrez la description de l'image ici

Allez dans Graph> Legacy> Scatter:

entrez la description de l'image ici

Choisissez un simple nuage de points est très bien. Remplissez ensuite les variables:

entrez la description de l'image ici

Vous verrez alors le nuage de points. Double-cliquez sur le nuage de points pour ouvrir l'éditeur de graphique. En haut, cliquez sur l'icône pour «ajuster les lignes aux sous-groupes». Voir photo ci-dessous:

entrez la description de l'image ici

Terminé:

entrez la description de l'image ici

Maintenant, que vous utilisiez la variable de salaire d'origine comme résultat ou le salaire prévu comme résultat ajusté pour l'autre tiers ou plusieurs prédicteurs, cela dépend de votre objectif. Le salaire d'origine conviendra mieux à l'exploration, tandis que le salaire prévu conviendra mieux à la présentation de vos résultats de régression.

Penguin_Knight
la source
Merci! Cela confirme que ce que j'ai fait est correct, j'ai d'autres covariables impliquées, donc je dois utiliser le résultat prévu (enregistré comme non standardisé dans le modèle de régression). C'est d'une grande aide!
Andreea
J'ai une autre question: je ne suis pas sûr que je devrais m'en tenir aux prédicteurs continus dans mon analyse de régression, car les associations, bien qu'importantes avant et après ajustement, semblent être motivées par de grandes valeurs aberrantes. Si je divise mon prédicteur en 3 catégories (fréquences nulles, en dessous et au-dessus de la médiane), alors je n'ai plus d'association significative avec le résultat continu. Avez-vous des suggestions sur la meilleure façon de procéder? merci
Andreea
De combien de «grandes valeurs aberrantes» parlons-nous? Avez-vous d'autres informations inhabituelles à leur sujet qui pourraient justifier leur exclusion de votre échantillon? S'il s'agit moins de valeurs aberrantes que d'une distribution non normale, vous pourriez envisager d'adapter un GLM robuste / non paramétrique pour réduire le biais dans vos résultats.
Nick Stauner
Merci pour la suggestion. Mes résultats continus ne semblent pas être normalement distribués lorsque je fais un hystogramme, mais quand je fais un tracé des résidus (enregistrer les résidus standardisés dans GLM), et je cherche une dispersion approximativement rectangulaire, ils semblent correspondre à ce modèle, qui suggère des niveaux de variation similaires à travers la plage de valeur prédite, donc c'est ok je dirais. En termes de valeurs aberrantes, il semble y avoir entre 1 à 3 valeurs aberrantes à en juger par le nuage de points (je n'arrive pas à pouvoir copier-coller les graphiques ici). Je n'ai jamais travaillé avec du GLM non paramétrique, donc je ne sais pas où le trouver dans SPSS
Andreea