Quando A e B sono variabili correlate positivamente, possono avere un effetto opposto sulla loro variabile di risultato C?


22

A è positivamente correlato a B.

C è il risultato di A e B, ma l'effetto di A su C è negativo e l'effetto di B su C è positivo.

Questo può succedere?


Questa è una relazione nel modello in SEM
Reen

1
stats.stackexchange.com/q/33888/3277 è una domanda strettamente correlata. Non identico, ma le risposte potrebbero essere estrapolate qui.
ttnphns,

Risposte:


43

Le altre risposte sono davvero meravigliose: forniscono esempi di vita reale.

Voglio spiegare perché questo può accadere nonostante la nostra intuizione del contrario.

Vedi questo geometricamente !

La correlazione è il coseno dell'angolo tra i vettori. In sostanza, stai chiedendo se è possibile quello

  • A crea unangoloacutoconB (correlazionepositiva)
  • B fa unangoloacutoconC (correlazionepositiva)
  • A rende unangoloottusoconC (correlazionenegativa)

Sì, naturalmente:

inserisci qui la descrizione dell'immagine

In questo esempio ( ρ indica correlazione):

  • A=(0.6,0.8)
  • B=(1,0)
  • C=(0.6,0.8)
  • ρ(A,B)=0.6>0
  • ρ(B,C)=0.6>0
  • ρ(UN,C)=-0,28<0

La tua intuizione è giusta!

Tuttavia, la tua sorpresa non è fuori luogo.

L'angolo tra i vettori è una metrica della distanza sulla sfera dell'unità, quindi soddisfa la disuguaglianza del triangolo:

ABAC+BC

quindi, poiché cosAB=ρ(A,B) ,

arccosρ(A,B)arccosρ(A,C)+arccosρ(B,C)

quindi (poiché cos sta diminuendo su [0,π] )

ρ(A,B)ρ(A,C)×ρ(B,C)(1ρ2(A,C))×(1ρ2(B,C))

Così,

  • se ρ(A,C)=ρ(B,C)=0.9 , quindi ρ(A,B)0.62
  • se ρ(A,C)=ρ(B,C)=0.95 , quindi ρ(A,B)0.805
  • se ρ(A,C)=ρ(B,C)=0.99 , quindi ρ(A,B)0.9602

32

Sì, due condizioni simultanee possono avere effetti opposti.

Per esempio:

  • Fare affermazioni scandalose (A) è positivamente correlato all'essere divertente (B).
  • Fare dichiarazioni scandalose (A) ha un effetto negativo sulle elezioni vincenti (C).
  • Essere divertenti (B) ha un effetto positivo sulle elezioni vincenti (C).

20
Abbiamo le migliori risposte. Il migliore. Lo dicono tutti.
Matthew Drury,

1
Sebbene sia d'accordo con questa opinione politica, penso che sia una cattiva forma usare una risposta su questo sito come veicolo per un'opinione politica irrilevante.
Kodiologo il

14
@Kodiologist Questa risposta non prende posizione su alcun candidato o problema. Rende le osservazioni piuttosto insignificanti (imho) secondo cui: (1) i candidati divertenti hanno un vantaggio (ad es. Ronald Reagan, Bill Clinton, Willie Brown) e (2) dichiarazioni altamente provocatorie tendono a ferire più di quanto aiutino (motivo per cui i politici tendono a non fare questo tipo di dichiarazioni). Se questa non è una zona divertente, posso eliminarla, ma penso che ciò che ho scritto sia incredibilmente benigno e non controverso.
Matthew Gunn,

19
Non vedo alcun riferimento politico diretto nella risposta. Potrebbe esserci un riferimento implicito, ma non credo che influisca in alcun modo sulla validità o l'idoneità della risposta.
Glen_b -Restate Monica

28

Ho sentito questa analogia per auto che si applica bene alla domanda:

  • La guida in salita (A) è positivamente correlata al fatto che il conducente salga sul gas (B)
  • La guida in salita (A) ha un effetto negativo sulla velocità del veicolo (C)
  • Fare un passo sul gas (B) ha un effetto positivo sulla velocità del veicolo (C)

La chiave qui è l'intenzione del guidatore di mantenere una velocità costante (C), quindi la correlazione positiva tra A e B segue naturalmente da tale intenzione. In questo modo puoi costruire infiniti esempi di A, B, C con questa relazione.

L'analogia deriva da un'interpretazione del termostato di Milton Friedman e da un'interessante analisi della politica monetaria e dell'econometria, ma questo è irrilevante per la questione.


2
Bell'esempio Tuttavia, non sono sicuro che tu stia usando i termini "correlato positivamente" e "negativamente correlato" come relazioni statistiche (ad esempio correlazione), che suppongo sia il significato dell'operazione.
Lior Kogan,

8

Sì, questo è banale da dimostrare con una simulazione:

Simula 2 variabili, A e B che sono correlate positivamente:

> require(MASS)
> set.seed(1)
> Sigma <- matrix(c(10,3,3,2),2,2)
> dt <- data.frame(mvrnorm(n = 1000, rep(0, 2), Sigma))
> names(dt) <- c("A","B")
> cor(dt)

          A         B
A 1.0000000 0.6707593
B 0.6707593 1.0000000

Crea variabile C:

> dt$C <- dt$A - dt$B + rnorm(1000,0,5)

Ecco:

> (lm(C~A+B,data=dt))

Coefficients:
(Intercept)            A            B  
    0.03248      0.98587     -1.05113  

Modifica: in alternativa (come suggerito da Kodiologist), simulando da una normale multivariata tale che cor(UN,B)>0, cor(UN,C)>0 e cor(B,C)<0

> set.seed(1)
> Sigma <- matrix(c(1,0.5,0.5,0.5,1,-0.5,0.5,-0.5,1),3,3)
> dt <- data.frame(mvrnorm(n = 1000, rep(0,3), Sigma, empirical=TRUE))
> names(dt) <- c("A","B","C")
> cor(dt)
    A    B    C
A 1.0  0.5  0.5
B 0.5  1.0 -0.5
C 0.5 -0.5  1.0

I think it's better to look at cor(C, A) and cor(C, B) than lm(C ~ A + B) here. We're interested in, e.g., the uncontrolled relationship of A and C rather than this relationship controlled for B.
Kodiologist

@Kodiologist the OP says in their comment that the context is a SEM, which would imply a linear regression, I think.
Robert Long

@Kodiologist see the update to my answer :)
Robert Long

0

C=mB+n(AprojB(A))

then

C,A=mB,A+nA,AnB,A

Then covariance between C and A could be negative in two conditions:

  1. n>m, A,A<B,A(nm)/n
  2. n<m, A,A>B,A(nm)/n
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.