Relazioni tra correlazione e causalità


19

Dalla pagina di Wikipedia intitolata correlazione non implica causalità ,

Per due eventi correlati, A e B, le diverse relazioni possibili includono:

  1. A causa B (causalità diretta);
  2. B causa A (causalità inversa);
  3. A e B sono conseguenze di una causa comune, ma non si causano a vicenda;
  4. A e B causano entrambi C, che è (esplicitamente o implicitamente) condizionato;
  5. A causa B e B causa A (causalità bidirezionale o ciclica);
  6. A causa C che causa B (causalità indiretta);
  7. Non esiste alcuna connessione tra A e B; la correlazione è una coincidenza.

Cosa significa il quarto punto. A e B causano entrambi C, che è (esplicitamente o implicitamente) condizionato. Se A e B causano C, perché A e B devono essere correlati.



2
Nonostante il detto mi aspetterei che ci sia un'alta correlazione tra correlazione e causalità ...
Mehrdad,


Risposte:


18

"Condizionamento" è una parola della teoria della probabilità: https://en.wikipedia.org/wiki/Conditional_probability

Il condizionamento su C significa che stiamo solo guardando i casi in cui C è vero. "Implicitamente" significa che potremmo non rendere esplicita questa restrizione, a volte nemmeno consapevoli di farlo.

Il punto significa che, quando A e B causano entrambe C, osservando una correlazione tra A e B nei casi in cui C è vera, non significa che esiste una relazione reale tra A e B. È solo condizionamento su C (forse involontariamente) che crea una correlazione artificiale.

Facciamo un esempio.

In un paese esistono esattamente due tipi di malattie, perfettamente indipendenti. Chiamata A: "la persona ha la prima malattia", B: "la persona ha la seconda malattia". Supponiamo che , P ( B ) = 0.1 .P(A)=0.1P(B)=0.1

Ora qualsiasi persona che ha una di queste malattie va dal medico e solo allora. Chiama C: "la persona va a vedere il dottore". Abbiamo .C=A or B

Ora calcoliamo alcune probabilità:

  • P(C)=0.19
  • P(A|C)=P(B|C)=0.10.190.53
  • P(A and B|C)=0.010.190.053
  • P(A|C)P(B|C)0.28

Chiaramente, se condizionati su C, e B sono molto lontani dall'essere indipendenti. In realtà, condizionati in C, n o t A sembra "causa" BABnotAB .

Se si utilizza l'elenco delle persone che dove registrato dal medico (s) come fonte di dati per l'analisi, poi sembra che ci sia una forte correlazione tra le malattie e B . Potresti non essere consapevole del fatto che l'origine dati è in realtà un condizionamento. Questo è anche chiamato "bias di selezione".AB


13

Il quarto punto è un esempio del paradosso di Berkson , noto anche come condizionamento su un collider , noto anche come fenomeno di spiegazione .

AttractiveAcceptCharming
AttractiveCharmingAccept , che assume valori 0 o 1 se gli scarti donna o accetta la proposta data, rispettivamente .

AttractiveCharmingAccept=1. Ora supponiamo che ti parli di un uomo che la donna ha accettato di frequentare, e ti dico che (secondo la donna) non è affatto attraente. Bene, sappiamo che la donna ha accettato di uscire con lui comunque, quindi dovremmo ragionevolmente dedurre che deve essere davvero piuttosto affascinante. Al contrario, se venissimo a conoscenza di un uomo la cui data è stata accettata e che non è affascinante, potremmo ragionevolmente dedurre che deve essere piuttosto attraente.

Accept=1AttractiveCharmingAccept


5

Il paradosso di Simpson e il paradosso di Berkson possono entrambi fornire esempi di "A e B, entrambi causano C, che è (esplicitamente o implicitamente) condizionato"

100010010%20020%20 dei miei francobolli sono sia belli che rari.

28020%100%


Questo è un esempio del paradosso di Berkson, non del paradosso di Simpson (vedi la mia risposta).
Jake Westfall,

@JakeWestfall Probabilmente hai ragione: sapevo di aver scritto l'esempio dei francobolli prima da qualche parte, ma ho dimenticato dove e risulta essere la pagina di Wikipedia per il paradosso di Berkson
Henry,

4

Il paragrafo inizia con "Per due eventi correlati, A e B, ...", quindi la mia ipotesi è che la correlazione sia assunta all'inizio. In altre parole, non è necessario che siano correlati per causare contemporaneamente C, ma se sono stati correlati e hanno entrambi causato C, ciò non implica che esista una relazione causale tra di loro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.