On peut concevoir une "interaction" entre les variables régressives et comme un écart par rapport à une relation parfaitement linéaireX1X2 dans laquelle la relation entre un régresseur et la réponse est différente pour différentes valeurs des autres régresseurs. Le "terme d'interaction" habituel est, dans un sens à expliquer ci-dessous, un tel "plus simple" départ.
Définitions et concepts
"Relation linéaire" signifie simplement le modèle habituel dans lequel nous supposons qu'une réponse diffère d'une combinaison linéaire de (et d'une constante) par des erreurs indépendantes de moyenne nulleOuiXjeε :
Oui=β0+β1X1+β2X2+ ε .(*)
"Interaction", au sens le plus général, signifie que les paramètres peuvent dépendre d'autres variables.βje
Plus précisément, dans cet exemple de seulement deux régresseurs, nous pourrions écrire de manière générique
β1=β1(X2) et β2=β2(X1) .
Une analyse
Maintenant, dans la pratique, personne, sauf un physicien théoricien, ne croit vraiment que le modèle est entièrement exact: il s'agit d'une approximation de la vérité et, nous l'espérons, proche. Poursuivant cette idée plus loin, nous pourrions nous demander si nous pourrions également rapprocher les fonctions avec les fonctions linéaires au cas où nous aurions besoin de modéliser une sorte d'interaction. Plus précisément, nous pourrions essayer d'écrire( ∗ )βje
β1(X2) =γ0+γ1X2+ petite erreur1;
β2(X1) =δ0+δ1X1+ petite erreur2.
Voyons où cela mène. Le fait de brancher ces approximations linéaires dans donne( ∗ )
Oui=β0+β1(X2)X1+β2(X1)X2+ ε=β0+ (γ0+γ1X2+ petite erreur1)X1+ (δ0+δ1X1+ petite erreur2)X2+ ε=β0+γ0X1+δ0X2+ (γ1+δ1)X1X2+ …
où " " représente l'erreur totale,…
… = ( petite erreur1)X1+ ( petite erreur2)X2+ ε .
Avec un peu de chance, multiplier ces deux "petites erreurs" par des valeurs typiques de sera (a) sans conséquence par rapport à ou (b) peut être traité comme des termes aléatoires qui, lorsqu'ils sont ajoutés à (et peut-être en ajustant le terme constant pour tenir compte de tout biais systématique) peut être traité comme un terme d'erreur aléatoire. Xjeεεβ0
Dans les deux cas, avec un changement de notation, nous voyons que ce modèle d'approximation linéaire en interaction prend la forme
Oui=β0+β1X1+β2X2+β12X1X2+ ε ,(**)
qui est précisément le modèle de régression "d'interaction" habituel. (Notez qu'aucun des nouveaux paramètres, ni lui-même, n'est la même quantité représentée à l'origine par ces termes en )ε( ∗ ) .
Observez comment apparaît à travers la variation des deux paramètres d'origine. Il capture la combinaison de (i) comment le coefficient de dépend de (à savoir, par ) et (ii) comment le coefficient de dépend de (à ).β12X1X2γ1X2X1δ1
Quelques conséquences
C'est une conséquence de cette analyse que si nous fixons tous les régresseurs sauf un, alors ( conditionnellement ) la réponse est toujours une fonction linéaire du régresseur restant. Y Par exemple, si nous fixons la valeur de alors nous pouvons réécrire le modèle d'interaction commex2,(∗∗)
Y=(β0+β2x2)+(β1+β12x2)x1+ε,
où l'ordonnée à l'origine est et la pente (c'est-à-dire le coefficient ) est Cela permet une description et un aperçu faciles. Géométriquement, la surface donnée par la fonctionβ0+β2x2x1β1+β2x2.
f(x1,x2)=β0+β1x1+β2x2+β12x1x2
est réglé: lorsque nous le coupons parallèlement à l'un des axes de coordonnées, le résultat est toujours une ligne. (Cependant, la surface elle-même n'est pas plane sauf lorsque En effet, elle a partout une courbure gaussienne négative.)β12=0.
Enfin, si notre espoir pour (a) ou (b) ne se concrétise pas, nous pourrions étendre le comportement fonctionnel du d' origine pour inclure des termes de second ordre ou plus. La même analyse montre que cela introduira des termes de la forme etc. dans le modèle. En ce sens, l' inclusion d'un terme d'interaction (produit) n'est que la première - et la plus simple - étape vers la modélisation des relations non linéaires entre la réponse et les régresseurs au moyen de fonctions polynomiales.βix21, x22, x1x22, x21x2,
Enfin, dans son manuel EDA (Addison-Wesley 1977), John Tukey a montré comment cette approche peut être mise en œuvre de manière beaucoup plus générale. Après avoir d'abord "ré-exprimé" (c'est-à-dire appliqué des transformations non linéaires appropriées) aux régresseurs et à la réponse, il arrive souvent que le modèle s'applique aux variables transformées ou, sinon, le modèle peuvent facilement être ajustés (en utilisant une analyse robuste des résidus). Cela permet à une grande variété de relations non linéaires d'être exprimées et interprétées comme des réponses conditionnellement linéaires.(∗)(∗∗)