È possibile che 3 vettori abbiano tutte correlazioni negative a coppie?


16

Dati tre vettori a , b e c , è possibile che le correlazioni tra a e b , a e c e b e c siano tutte negative? Cioè è possibile?

corr(a,b)<0corr(a,c)<0corr(b,c)<0

3
Correlazioni negative significano, geometricamente, che i vettori centrati fanno reciprocamente angoli ottusi. Non dovresti avere problemi a disegnare una configurazione di tre vettori nel piano con questa proprietà.
whuber

Non possono essere completamente correlate negativamente ( ), ma in generale può esserci una correlazione negativa, ancora limiti stabiliti dalle altre correlazioni. ρ=1
Karakfa,

2
@whuber Il tuo commento sembra contraddire la risposta di Heikki Pulkkinen, che afferma che è impossibile per i vettori in un aereo. Se lo segui, dovresti trasformare il tuo commento in una risposta.
RM

2
@RM Non c'è contraddizione tra whuber ed Heikki. Questa domanda pone una matrice di dati di dimensioni n × 3 . Normalmente si parla di n punti dati in 3 dimensioni, ma questa Q parla di tre "vettori" in n dimensioni. Heikki afferma che tutte le correlazioni negative non possono verificarsi se n = 2 (in effetti, due punti dopo il centraggio sono sempre perfettamente correlati, quindi le correlazioni devono essere ± 1 e non possono essere tutte - 1 ). Whuber afferma che 3 vettori in n dimensioni possono effettivamente trovarsi in un sottospazio bidimensionale (cioè XXn×3nnn=2±11nX è di grado 2) e suggerisce di immaginare un logo Mercedes.
ameba dice Reinstate Monica

Risposte:


19

È possibile se la dimensione del vettore è 3 o più grande. Per esempio

a=(1,1,1)b=(1,9,3)c=(2,3,1)

Le correlazioni sono

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

Possiamo dimostrare che per i vettori di dimensione 2 ciò non è possibile:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

The formula makes sense: if a1 is larger than a2, b1 has to be larger than b1 to make the correlation negative.

Similarly for correlations between (a,c) and (b,c) we get

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.


3
Another example of something unexpected that only happens in dimension three or higher.
nth

1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry

9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.


7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.



2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.