Supposons que vous ajustiez un modèle . Y a-t-il des implications pratiques pour l'estimation de l'effet d'interaction si et sont corrélés?
Je comprends qu'il pourrait y avoir des problèmes de colinéarité si et sont très corrélés, mais cela ne devrait pas affecter le terme d'interaction, n'est-ce pas?
Réponses:
Il y a une raison pour laquelle votre consultant en statistique n'a pas pu expliquer pourquoi l'introduction d'une interaction dans un modèle linéaire pourrait nuire à la structure de corrélation: cela dépend des circonstances et il n'est généralement pas vrai qu'il y ait un effet négatif. Regardez simplement les ensembles de données montrés dans les matrices de nuages de points ci-dessous pour voir toutes les différentes façons dont deux variables peuvent être liées à leurs produits.
Le reste de cet article explique comment ces chiffres ont été produits et pourraient donner un meilleur aperçu de la situation.
Commençons par l'évidence: écrireX3=X1X2, vous avez une régression multiple impliquant les trois variables X1,X2,X3. L’existence ou non de problèmes de colinéarité dépend des relations linéaires entre les Xje. C'est universel.
La particularité de ce problème est la relation entreX3 et l'autre Xje; à savoir que X3=X1X2. Ainsi, si quelqu'un vous a conseillé de faire attention, cela doit être dû à une attente que cette relation multiplicative entraîne mathématiquement une sorte de multicolinéarité entre tous lesXje.
Ce n'est tout simplement pas le cas, comme cela peut être démontré en présentant tous les modèles possibles. Je ne veux pas vous épuiser avec la pédanterie de passer par toutes les possibilités, alors laissez-moi juste esquisser quelques-unes des plus illustratives. L'outil de base que je vais utiliser dans cette étude est l'observation que la corrélation entre toutes les variablesX1,X2 reste inchangé lorsque le Xje subissent séparément des transformations linéaires. Autrement dit, nous pouvons librement multiplier l'une ou l'autre variable par des constantes et ajouter d'autres constantes aux résultats sans modifier la corrélation. Cependant, ces opérations peuvent modifier profondément les corrélations entreX1X2 et Xje.
Produit (presque) constant
Il est possible pourX1X2 être constant (ce qui, quand une régression comprend une constante, sera problématique). Pour créer un exemple, générez simplement des valeurs non nulles pourX1 et définir X2= c /X1. Leur produit est égal c par construction.
Vous pouvez perturber cet exemple en modifiantc ≠ 0 dans une variable aléatoire avec des valeurs proches de c . Faire cela introduira une petite corrélation entre le Xje et leur produit, mais pas beaucoup. Voici, par exemple, un exemple oùX1 est tiré d'un Gamma( 5 ) distribution et c a une distribution normale avec une moyenne 1 et l'écart-type de seulement Une / 100 :
Bien que leXje avoir une corrélation de ρ1 ⋅ 2= - 0,87 dans cet exemple, leurs corrélations avec X1X2 sont seulement - 0,06 et 0,00.
Par conséquent, bien qu'il puisse y avoir un peu de problème en utilisant les deuxX1 et X2 dans un modèle linéaire, y compris X1X2 est peu susceptible de l'aggraver.
Produit non constant
Pour rendre les calculs plus clairs, nous pouvons aussi bien supposer queXje avoir une variance d'unité. Soit la variance deX1X2 être τ2 et écris ρ12 ⋅ i pour les corrélations entre X1X2 et Xje. Calculons ce qui arrive à ces corrélations lorsque les constantes cje sont soustraits de la Xje. Parce que le Xje jouer des rôles parfaitement symétriques (juste échanger "1 " pour "2 "dans les index), il suffit de calculer la corrélation avec X1:
Aucune corrélation avec le produit
Quelle que soit la corrélation entre leXje pourrait être, nous pouvons choisir(c1,c2) pour rendre le produit non corrélé avec le Xje.
D'après l'analyse qui précède, cet objectif sera atteint lorsque le numérateur de( ∗ ) est nul pour i = 1 , 2 :
Quandρ21 ⋅ 2≠ 1 , ce système d'équations (c1,c2) a une solution unique. Voici, par exemple, une matrice de nuage de points d'un ensemble de données de100 valeurs dans lesquelles (Xje) avoir une distribution normale bivariée avec corrélation ρ1 ⋅ 2= - 0,99 mais le Xje avoir une corrélation nulle avec X1X2 :
Parce queX1X2 est sans corrélation avec ("orthogonal à") à la fois le Xje, l'introduire dans n'importe quel modèle linéaire ne créera aucun problème.
Comme le suggère cet exemple, cette situation est la norme car elle a tendance à se produire lorsque leXje ont été centrés. En d'autres termes, si vous centrez vos variables avant de créer une interaction, vous n'aurez généralement pas de problèmes avec une colinéarité supplémentaire.
De fortes corrélations avec le produit
Les équations( ∗ ) peut également être résolu pour produire de fortes corrélations. Nous n'avons même pas besoin d'aller jusqu'à résoudre les équations exactement (ce qui est difficile), car il existe un raccourci simple: en redimensionnant l'un desXje pour être proche de zéro et en y ajoutant une constante, nous ne changerons pas leur corrélation, mais alors le produit sera presque égal à un multiple de l'autre desXje, les rendant ainsi fortement corrélés.
Voici un exemple basé sur le précédent. Dans cet exemple,X2 a été changé en 1 +X2/ 100 pour que X1X2 est approximativement égal à X1, ce qui en fait fortement positivement corrélé avec X1X2. En effet, ρ12 ⋅ 1= 0,999878 et ρ12 ⋅ 2= - 0,9898793 dans cet exemple.
la source