Nessuna correlazione non implica alcuna causalità?


73

So che la correlazione non implica la causalità ma un'assenza di correlazione implica l'assenza di causalità?


46
Per citare Andrew Gelman, "La correlazione non implica nemmeno la correlazione".
Mike Hunter,

9
No. A può essere la causa di B, ma influire solo non linearmente.
Neil G,

3
"La correlazione è correlata alla causalità. (Solo non molto.)"
Adrian,

7
Si prega di guardare questa pagina per il contrapositivo. Se la causalità non implica correlazione, allora nessuna correlazione non implica alcuna causalità.
EdM,

4
Mentre è un buon inizio per segnalare che la correlazione non implica la causalità e quindi discutere i dettagli, ho pensato a lungo perché individuare la correlazione? Lo metto giù per assonanza e l'idea attraente per gli insegnanti (anche io) che gli studenti con un certo sforzo possono ricordare uno slogan e usarlo nel loro pensiero. Ma la verità è che non molto nelle statistiche implica causalità. Altrimenti, questo avvertimento arriva spesso nel capitolo sulla correlazione o nella lezione sulla correlazione, ma appartiene ovunque.
Nick Cox,

Risposte:


76

l'assenza di correlazione implica l'assenza di causalità?

No. Qualsiasi sistema controllato è un controesempio.

Senza relazioni causali il controllo è chiaramente impossibile, ma un controllo efficace significa - in termini approssimativi - che una certa quantità viene mantenuta costante, il che implica che non sarà correlata a nulla, incluso qualsiasi cosa lo stia rendendo costante.

Quindi, in questa situazione, concludere che nessuna relazione causale per mancanza di correlazione sarebbe un errore.

Ecco un esempio un po 'attuale .


Un modo intuitivo per pensarci
Repmat

+1, introito interessante. Tuttavia, sembra implicare che la causalità potrebbe essere presente mentre la correlazione di qualsiasi tipo è assente. Questo non può essere vero. Se un evento ne causa un altro, ci sarà un "tipo di correlazione presente, la costante che hai menzionato sarà sotto forma di correlazione non lineare
Aksakal,

1
+1 Bra vo! Quando ho visto il titolo della domanda nella barra laterale, ero tutto "Questo deve rispondere dal punto di vista dei sistemi". L'hai inchiodato.
Alexis,

Se da un'assenza di correlazione si rimuove la causalità, il restante funzionamento sarà candidato per etichettare "casualità"?
ttnphns,

1
Non sono sicuro di capire la domanda di @ ttnphns, ma penso che la risposta sia: se spezzi il cavo del freno (o scolleghi il pedale dell'acceleratore), le colline inizieranno effettivamente a mostrare il loro impatto causale sulla velocità di un'auto.
conjugateprior

30

No. Principalmente perché per correlazione si intende molto probabilmente una correlazione lineare . Due variabili possono essere correlate in modo non lineare e non possono mostrare alcuna correlazione lineare . È facile costruire un esempio del genere, ma ti darò un esempio più vicino alla tua (più ristretta) domanda.

Diamo un'occhiata alla variabile casuale e alla funzione non casuale f ( x ) = x 2 , con la quale creiamo una variabile casuale y = f ( x ) . Quest'ultima è chiaramente causata dalla prima variabile, non solo correlata. Disegniamo un diagramma a dispersione:Xf(X)=X2y=f(X)

inserisci qui la descrizione dell'immagine

Immagine di correlazione non lineare piacevole e chiara , ma in questo caso è anche causalità diretta. Tuttavia, il coefficiente di correlazione lineare non è significativo, ovvero non esiste alcuna correlazione lineare nonostante l'evidente correlazione non lineare e persino la causalità:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

AGGIORNAMENTO: @Kodiologist ha ragione nel commento. Si può dimostrare matematicamente che il coefficiente di correlazione lineare per queste due variabili è effettivamente zero. Nel mio esempio è la variabile normale standard, quindi abbiamo quanto segue: E [ x ] = 0 E [ x 2 ] = 1 E [ x x 2 ] = E [ x 3 ] = 0 Quindi, la covarianza (e successivamente la correlazione) è zero: C o v [ x , x 2X

E[X]=0
E[X2]=1
E[XX2]=E[X3]=0
Cov[X,X2]=E[XX2]-E[X]E[X2]=0

U[-1,1]


8
La non significatività non implica la verità dell'ipotesi nulla. La cosa importante nel tuo esempio è che il coefficiente di correlazione della popolazione è 0.
Kodiologo

1
Perché credi che PO significhi correlazione lineare?
user253751

@immibis, perché la causalità deve tradursi in una sorta di correlazione non lineare.
Aksakal,

E[X3]-E[X2]E[X]XE[X3]E[X2]E[X]X

X

18

No . In particolare, le variabili casuali possono essere dipendenti ma non correlate.

X[-1,1]YX-XXYX[-1,1]YX=X(X,Y)XY

P(X<-12)P(|Y|<12)=1412=180=P(X<-12,|Y|<12).

XY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]-E[X]E[Y]σXσY=0-00σXσY=0.

1
In realtà, questo è un cattivo esempio secondo me. X non causa Y. Una variabile binaria assente dal modello PresenceOfX è la causa effettiva con una correlazione di 1. Quello che dimostri è in realtà che il valore di X non influenza Y.
user2088176

6
XY

5
XYxYx=12Y12-12X=34Y34-34XYXY

1
X[0,1]

3
X~N(0,1)X2χ2(1)X2X

14

Forse guardarlo da una prospettiva computazionale aiuterà.

Ad esempio concreto, prendi un generatore di numeri pseudocasuale.

Kesimo

Esiste una correlazione misurabile?


7

La migliore risposta alla domanda è che la correlazione è una relazione statistica, matematica e / o fisica mentre la causalità è una relazione metafisica. Non si può ottenere LOGICAMENTE dalla correlazione (o non correlazione) alla causalità, senza un (ampio) insieme di ipotesi che legano la metafisica alla fisica. (Un esempio è che ciò che due persone potrebbero concordare di essere "un osservatore razionale" è in larga misura arbitrario e probabilmente ambiguo). Se A paga B per fare C che si traduce in D, qual è la causa di D? Non c'è semplicemente alcun motivo razionale per scegliere C o B o A (o uno qualsiasi degli eventi precursori di A). La teoria del controllo riguarda i sistemi nei regni in cui sono sotto controllo. Un modo per tenere sotto controllo una variabile dipendente è ridurre la risposta di quella variabile al possibile intervallo di variazione (controllata) della variabile indipendente al rumore statistico. Ad esempio, sappiamo che la pressione dell'aria è correlata alla salute (basta provare a respirare il vuoto), ma se controlliamo la pressione dell'aria a 1 +/- 0,001 atm, con quale probabilità QUALSIASI variazione della pressione dell'aria influisce sulla salute?


La distinzione che stai cercando è 'osservata in un campione' (correlazione) vs dipendenza che esiste indipendentemente dal fatto che sia osservata o meno in un campione (fisica). Non c'è alcun ruolo per la metafisica in questa spiegazione (anche se alcuni per l'assunzione fisica). Le molle hanno limiti elastici se le raggiungono o meno. O in un esempio più familiare: un cubo di zucchero è solubile - un concetto chiaramente causale che implica, approssimativamente, che se lo lasci cadere nel tè si dissolverà. Ma questa proprietà causale è puramente dovuta alla sua struttura fisica . I cubetti di zucchero sarebbero solubili anche se non avessimo mai pensato di dissolverli.
conjugateprior,

1
Hai ragione, ovviamente, che senza ipotesi causali in una discussione, non ne traggono conclusioni causali. Ma non c'è davvero nulla di molto metafisico al riguardo!
conjugateprior,

dopo che la teoria controfattuale della causalità (ad esempio Pearl o Woodward) è stata progettata esattamente per dare un senso a "Se A paga B per fare C che si traduce in D, qual è la causa di D? Semplicemente non c'è ragione razionale per scegliere C o B o A" . L'unica nozione antiquata e quella inutile che queste teorie mettono a tacere è che possiamo sempre prendere in giro l'idea che c'è la causa di qualcosa. Certo che no.
conjugateprior,

5

, contrariamente alle risposte precedenti. Prenderò la domanda come non tecnica, in particolare la definizione di "correlazione". Forse lo sto usando in modo troppo ampio, ma vedi il mio secondo proiettile. Spero che sarà considerato appropriato discutere qui altre risposte, perché illuminano diverse parti della domanda. Sto attingendo all'approccio di Pearl alla causalità, e in particolare la mia opinione su alcuni articoli con Kevin Korb. Woodward ha probabilmente il conto non tecnico più chiaro.

  • XyXyXyyXy

  • y=X2yXXyXy

  • y=Uniof(X,-X)|y|=|X|

  • π

  • UNBCDUND ma la correlazione esiste perché esiste una storia causale.

Non so che cosa avesse in mente @ user2088176, ma penso che se prendiamo la domanda molto in generale, la risposta è sì. Almeno penso che questa sia la risposta richiesta dalla letteratura sulla scoperta causale e dal racconto interventista della causalità. Le cause sono differenze che fanno la differenza. E quella differenza verrà rivelata, in alcuni esperimenti, come associazione persistente.


1
Speravo di affrontarlo da una prospettiva più semplice e non tecnica, come hai fatto tu. Cosa significa "causa"? Presumibilmente comporta un cambiamento in qualcosa che porta a un cambiamento in qualcos'altro. Non riesco a capire la causalità senza un qualche tipo di correlazione.
Behacad,

1
@ Behacad Penso che il contrasto sia tra un qualche tipo di correlazione (il tipo di cosa che puoi osservare) e un qualche tipo di dipendenza (che potrebbe non essere mai innescata). Esistono dipendenze non attivate ma non esistono correlazioni non osservate. Questo è il motivo per cui la causalità ha un elemento controfattuale nella sua definizione, mentre la correlazione no.
conjugateprior,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.