La corrélation entre les variables dans une interaction est-elle importante?

8

Supposons que vous ajustiez un modèle . Y a-t-il des implications pratiques pour l'estimation de l'effet d'interaction si et sont corrélés?y=x1+x2+x1×x2x1x2

Je comprends qu'il pourrait y avoir des problèmes de colinéarité si et sont très corrélés, mais cela ne devrait pas affecter le terme d'interaction, n'est-ce pas?x1x2

hlinee
la source
1
Vous semblez rechercher des informations sur la corrélation entre x1x2 et x1 quand x1 et x2sont corrélés. Une façon de se faire une idée de ce qui peut être déduit est de remarquer que, bien que l’ajout d’une constante (disonsc) à l'un des xi ne changera pas leur corrélation, cela changera x1x2 en un plus constant (x1x2+cx1+cx2). Ces deux derniers termes montrent que c a un effet profond sur la corrélation entre x1x2 et xi.Si cela ne suggère pas immédiatement une réponse à votre question, envisagez de dessiner des nuages ​​de points.
whuber
@whuber J'ai du mal à suivre votre logique - y a-t-il une explication étape par étape plus explicite à laquelle vous pouvez lier? J'ai essayé de l'écrire avec la formule de corrélation, mais je n'ai pas pu reproduire votre réponse
hlinee
@whuber En outre, concernant ma question initiale, je pense qu'un certain contexte pourrait aider, car je suis d'accord, elle est assez vague. Ce qui s'est passé, c'est que j'ai présenté mes résultats à la recherche d'un effet d'interaction à un statisticien avec qui j'ai travaillé et la première chose qu'il m'a demandé était de savoir si les deux prédicteurs de mon interaction étaient corrélés. Je n'avais pas examiné la corrélation et je lui ai demandé pourquoi cela importait. Il ne pouvait pas tout à fait expliquer pourquoi mais a dit que cela importait, d'où ma question.
hlinee

Réponses:

9

Il y a une raison pour laquelle votre consultant en statistique n'a pas pu expliquer pourquoi l'introduction d'une interaction dans un modèle linéaire pourrait nuire à la structure de corrélation: cela dépend des circonstances et il n'est généralement pas vrai qu'il y ait un effet négatif. Regardez simplement les ensembles de données montrés dans les matrices de nuages ​​de points ci-dessous pour voir toutes les différentes façons dont deux variables peuvent être liées à leurs produits.

Le reste de cet article explique comment ces chiffres ont été produits et pourraient donner un meilleur aperçu de la situation.


Commençons par l'évidence: écrire x3=x1x2, vous avez une régression multiple impliquant les trois variables x1,x2,x3. L’existence ou non de problèmes de colinéarité dépend des relations linéaires entre les xi. C'est universel.

La particularité de ce problème est la relation entrex3 et l'autre xi; à savoir que x3=x1x2. Ainsi, si quelqu'un vous a conseillé de faire attention, cela doit être dû à une attente que cette relation multiplicative entraîne mathématiquement une sorte de multicolinéarité entre tous lesxi.

Ce n'est tout simplement pas le cas, comme cela peut être démontré en présentant tous les modèles possibles. Je ne veux pas vous épuiser avec la pédanterie de passer par toutes les possibilités, alors laissez-moi juste esquisser quelques-unes des plus illustratives. L'outil de base que je vais utiliser dans cette étude est l'observation que la corrélation entre toutes les variablesx1,x2 reste inchangé lorsque le xisubissent séparément des transformations linéaires. Autrement dit, nous pouvons librement multiplier l'une ou l'autre variable par des constantes et ajouter d'autres constantes aux résultats sans modifier la corrélation. Cependant, ces opérations peuvent modifier profondément les corrélations entrex1x2 et xi.

Produit (presque) constant

Il est possible pour x1x2être constant (ce qui, quand une régression comprend une constante, sera problématique). Pour créer un exemple, générez simplement des valeurs non nulles pourx1 et définir x2=c/x1. Leur produit est égal c par construction.

Vous pouvez perturber cet exemple en modifiant c0 dans une variable aléatoire avec des valeurs proches de c. Faire cela introduira une petite corrélation entre le xiet leur produit, mais pas beaucoup. Voici, par exemple, un exemple oùx1 est tiré d'un Gamma(5) distribution et c a une distribution normale avec une moyenne 1 et l'écart-type de seulement 1/100:

Figure 0

Bien que le Xje avoir une corrélation de ρ12=-0,87 dans cet exemple, leurs corrélations avec X1X2 sont seulement -0,06 et 0,00.

Par conséquent, bien qu'il puisse y avoir un peu de problème en utilisant les deux X1 et X2 dans un modèle linéaire, y compris X1X2 est peu susceptible de l'aggraver.

Produit non constant

Pour rendre les calculs plus clairs, nous pouvons aussi bien supposer que Xjeavoir une variance d'unité. Soit la variance deX1X2 être τ2 et écris ρ12je pour les corrélations entre X1X2 et Xje. Calculons ce qui arrive à ces corrélations lorsque les constantes cje sont soustraits de la Xje. Parce que le Xje jouer des rôles parfaitement symétriques (juste échanger "1" pour "2"dans les index), il suffit de calculer la corrélation avec X1:

(*)Cor((X1-c1)(X2-c2),X1)=Cov((X1-c1)(X2-c2),X1)Var(X1-c1)(X2-c2)VarX1=Cov(X1X2-c2X1-c1X2+c1c2,X1)Var(X1X2-c1X2-c2X1+c1c2)=τρ121-c2-c1ρ12τ2-c1ρ12-c2-2c1ρ122-2c2ρ121+2c1c2ρ12.

Aucune corrélation avec le produit

Quelle que soit la corrélation entre le Xjepourrait être, nous pouvons choisir(c1,c2) pour rendre le produit non corrélé avec le Xje.

D'après l'analyse qui précède, cet objectif sera atteint lorsque le numérateur de () est nul pour je=1,2:

{0=τρ121-c2-c1ρ120=τρ122-c1-c2ρ12

Quand ρ1221, ce système d'équations (c1,c2)a une solution unique. Voici, par exemple, une matrice de nuage de points d'un ensemble de données de100 valeurs dans lesquelles (Xje) avoir une distribution normale bivariée avec corrélation ρ12=-0,99 mais le Xje avoir une corrélation nulle avec X1X2:

Figure 1

Parce que X1X2 est sans corrélation avec ("orthogonal à") à la fois le Xje, l'introduire dans n'importe quel modèle linéaire ne créera aucun problème.

Comme le suggère cet exemple, cette situation est la norme car elle a tendance à se produire lorsque le Xjeont été centrés. En d'autres termes, si vous centrez vos variables avant de créer une interaction, vous n'aurez généralement pas de problèmes avec une colinéarité supplémentaire.

De fortes corrélations avec le produit

Les équations ()peut également être résolu pour produire de fortes corrélations. Nous n'avons même pas besoin d'aller jusqu'à résoudre les équations exactement (ce qui est difficile), car il existe un raccourci simple: en redimensionnant l'un desXjepour être proche de zéro et en y ajoutant une constante, nous ne changerons pas leur corrélation, mais alors le produit sera presque égal à un multiple de l'autre desXje, les rendant ainsi fortement corrélés.

Voici un exemple basé sur le précédent. Dans cet exemple,X2 a été changé en 1+X2/100 pour que X1X2 est approximativement égal à X1, ce qui en fait fortement positivement corrélé avec X1X2. En effet, ρ121=0,999878 et ρ122=-0,9898793 dans cet exemple.

Figure 2

whuber
la source
Parfait! Merci pour l'explication approfondie :)
hlinee