Lorsque A et B sont des variables positivement liées, peuvent-elles avoir un effet opposé sur leur variable de résultat C?

22

A est positivement lié à B.

C est le résultat de A et B, mais l'effet de A sur C est négatif et l'effet de B sur C est positif.

Cela peut-il arriver?

Reen
la source
Ceci est une relation dans le modèle en SEM
Reen
1
stats.stackexchange.com/q/33888/3277 est une question étroitement liée. Pas identique, mais les réponses pourraient être extrapolées ici.
ttnphns

Réponses:

43

Les autres réponses sont vraiment merveilleuses - elles donnent des exemples concrets.

Je veux expliquer pourquoi cela peut arriver malgré notre intuition contraire.

Voyez cela géométriquement !

La corrélation est le cosinus de l'angle entre les vecteurs. Essentiellement, vous demandez s'il est possible que

  • UNE fait unangleaiguavecB (corrélationpositive)
  • B fait unangleaiguavecC (corrélationpositive)
  • UNE fait unangleobtusavecC (corrélationnégative)

Oui bien sûr:

entrez la description de l'image ici

Dans cet exemple ( ρ désigne la corrélation):

  • A=(0.6,0.8)
  • B=(1,0)
  • C=(0,6,-0,8)
  • ρ(UNE,B)=0,6>0
  • ρ(B,C)=0,6>0
  • ρ(UNE,C)=-0,28<0

Votre intuition a raison!

Cependant, votre surprise n'est pas déplacée.

L'angle entre les vecteurs est une métrique de distance sur la sphère unitaire, il satisfait donc l'inégalité du triangle:

UNEBUNEC+BC

ainsi, puisque cosUNEB=ρ(UNE,B) ,

arccosρ(UNE,B)arccosρ(UNE,C)+arccosρ(B,C)

par conséquent (puisque cos est décroissante sur [0,π] )

ρ(A,B)ρ(A,C)×ρ(B,C)(1ρ2(A,C))×(1ρ2(B,C))

Alors,

  • si ρ(A,C)=ρ(B,C)=0.9 , alors ρ(A,B)0.62
  • si ρ(A,C)=ρ(B,C)=0.95 , alors ρ(A,B)0.805
  • si ρ(A,C)=ρ(B,C)=0.99 , alors ρ(A,B)0.9602
sds
la source
32

Oui, deux conditions concomitantes peuvent avoir des effets opposés.

Par exemple:

  • Faire des déclarations scandaleuses (A) est positivement lié au divertissement (B).
  • Faire des déclarations scandaleuses (A) a un effet négatif sur la victoire aux élections (C).
  • Être divertissant (B) a un effet positif sur la victoire aux élections (C).
Matthew Gunn
la source
20
Nous avons les meilleures réponses. Le meilleur. Tout le monde le dit.
Matthew Drury
1
Bien que je sois d'accord avec cette opinion politique, je pense que c'est une mauvaise forme d'utiliser une réponse sur ce site comme véhicule pour une opinion politique non pertinente.
Kodiologist
14
@Kodiologist Cette réponse ne prend position sur aucun candidat ni aucun problème. Cela fait des observations assez banales (à mon humble avis) que: (1) les candidats divertissants ont un avantage (par exemple, Ronald Reagan, Bill Clinton, Willie Brown) et (2) les déclarations très provocantes ont tendance à faire plus de mal qu'elles ne l'aident (c'est pourquoi les politiciens ont tendance à ne pas faire ces types de déclarations). S'il s'agit d'une zone sans plaisir, je peux la supprimer, mais je pense que ce que j'ai écrit est incroyablement bénin et sans controverse.
Matthew Gunn
19
Je ne vois aucune référence politique directe dans la réponse. Il peut y avoir une référence implicite, mais je ne pense pas que cela affecte en aucune façon la validité ou la pertinence de la réponse.
Glen_b -Reinstate Monica
28

J'ai entendu cette analogie de voiture qui s'applique bien à la question:

  • La conduite en montée (A) est positivement liée au fait que le conducteur marche sur le gaz (B)
  • La conduite en montée (A) a un effet négatif sur la vitesse du véhicule (C)
  • Marcher sur le gaz (B) a un effet positif sur la vitesse du véhicule (C)

La clé ici est l'intention du conducteur de maintenir une vitesse constante (C), donc la corrélation positive entre A et B découle naturellement de cette intention. Vous pouvez ainsi construire des exemples sans fin de A, B, C avec cette relation.

L'analogie provient d'une interprétation du thermostat de Milton Friedman et d'une analyse intéressante de la politique monétaire et de l'économétrie, mais cela n'a rien à voir avec la question.

congusbongus
la source
2
Bel exemple. Cependant, je ne suis pas sûr que vous utilisiez les termes «positivement liés» et «négativement liés» comme relations statistiques (par exemple corrélation), ce qui, je suppose, est ce que signifie l'op.
Lior Kogan
8

Oui, c'est trivial à démontrer avec une simulation:

Simulez 2 variables, A et B qui sont positivement corrélées:

> require(MASS)
> set.seed(1)
> Sigma <- matrix(c(10,3,3,2),2,2)
> dt <- data.frame(mvrnorm(n = 1000, rep(0, 2), Sigma))
> names(dt) <- c("A","B")
> cor(dt)

          A         B
A 1.0000000 0.6707593
B 0.6707593 1.0000000

Créez la variable C:

> dt$C <- dt$A - dt$B + rnorm(1000,0,5)

Voir:

> (lm(C~A+B,data=dt))

Coefficients:
(Intercept)            A            B  
    0.03248      0.98587     -1.05113  

cor(UNE,B)>0cor(UNE,C)>0cor(B,C)<0

> set.seed(1)
> Sigma <- matrix(c(1,0.5,0.5,0.5,1,-0.5,0.5,-0.5,1),3,3)
> dt <- data.frame(mvrnorm(n = 1000, rep(0,3), Sigma, empirical=TRUE))
> names(dt) <- c("A","B","C")
> cor(dt)
    A    B    C
A 1.0  0.5  0.5
B 0.5  1.0 -0.5
C 0.5 -0.5  1.0
Robert Long
la source
Je pense qu'il est préférable de regarder cor(C, A)et cor(C, B)que lm(C ~ A + B)ici. Nous nous intéressons, par exemple, à la relation incontrôlée de A et C plutôt qu'à cette relation contrôlée pour B.
Kodiologist
@Kodiologist the OP dit dans leur commentaire que le contexte est un SEM, ce qui impliquerait une régression linéaire, je pense.
Robert Long
@Kodiologist voir la mise à jour de ma réponse :)
Robert Long
0

C=mB+n(UNE-projB(UNE))

puis

C,UNE=mB,UNE+nUNE,UNE-nB,UNE

La covariance entre C et A pourrait alors être négative dans deux conditions:

  1. n>m, UNE,UNE<B,UNE(n-m)/n
  2. n<-m, UNE,UNE>B,UNE(n-m)/n
Zhu Jinxuan
la source