Est-il possible que 3 vecteurs aient toutes des corrélations négatives par paires?

16

Étant donné trois vecteurs , b et c , est-il possible que les corrélations entre a et b , a et c et b et c soient toutes négatives? Est-ce possible?abcabacbc

corr(a,b)<0corr(a,c)<0corr(b,c)<0
Antti A
la source
3
Les corrélations négatives signifient, géométriquement, que les vecteurs centrés font mutuellement des angles obtus. Vous ne devriez avoir aucun problème à dessiner une configuration de trois vecteurs dans le plan qui ont cette propriété.
whuber
Ils ne peuvent pas être complètement corrélés négativement ( ), mais en général, il peut y avoir une corrélation négative, là encore des limites fixées par les autres corrélations. ρ=1
karakfa
2
@whuber Votre commentaire semble contredire la réponse de Heikki Pulkkinen, qui prétend que c'est impossible pour les vecteurs dans un avion. Si vous le maintenez, vous devriez transformer votre commentaire en réponse.
RM
2
@RM Il n'y a pas de contradiction entre whuber et Heikki. Cette question concerne la matrice de données de taille n × 3 . Normalement, nous parlerions de n points de données en 3 dimensions, mais ce Q parle de trois "vecteurs" en n dimensions. Heikki dit que toutes les corrélations négatives ne peuvent pas se produire si n = 2 (en effet, deux points après le centrage sont toujours parfaitement corrélés, donc les corrélations doivent être ± 1 et ne peuvent pas être toutes - 1 ). Whuber dit que 3 vecteurs en n dimensions peuvent effectivement se trouver dans un sous-espace à 2 dimensions (c'est-à-dire XXn×3nnn=2±11nX est de rang 2) et suggère d'imaginer un logo Mercedes.
amibe dit Réintégrer Monica
1
Connexe: Bound pour la corrélation de trois variables aléatoires . (cc, @amoeba)
gung - Reinstate Monica

Réponses:

19

Cela est possible si la taille du vecteur est de 3 ou plus. Par exemple

a=(1,1,1)b=(1,9,3)c=(2,3,1)

Les corrélations sont

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

On peut prouver que pour des vecteurs de taille 2 ce n'est pas possible:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

a1a2, b1 has to be larger than b1 to make the correlation negative.

Similarly for correlations between (a,c) and (b,c) we get

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.

Heikki Pulkkinen
la source
3
Another example of something unexpected that only happens in dimension three or higher.
nth
1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry
9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.

Kozolovska
la source
7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.

karakfa
la source
2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

John Coleman
la source