Differenza tra i gradini due e tre nella Scala della Causazione


12

Nel "Libro del perché" della Giudea Pearl parla di ciò che chiama la Scala della Causazione, che è essenzialmente una gerarchia composta da diversi livelli di ragionamento causale. Il più basso riguarda i modelli di associazione nei dati osservati (ad es. Correlazione, probabilità condizionata, ecc.), Il successivo si concentra sull'intervento (cosa succede se cambiamo deliberatamente il processo di generazione dei dati in un modo prespecificato?), E il terzo è controfattuale (cosa accadrebbe in un altro mondo possibile se qualcosa fosse successo o meno)?

Quello che non capisco è come differiscono i gradini due e tre. Se facciamo una domanda controfattuale, non stiamo semplicemente ponendo una domanda sull'intervento in modo da negare qualche aspetto del mondo osservato?


È davvero in tema? Chiedere per curiosità
Firebug il

5
@Firebug è la causalità sull'argomento? Se vuoi calcolare la probabilità dei controfattuali (come la probabilità che un farmaco specifico fosse sufficiente per la morte di qualcuno) devi capirlo.
Carlos Cinelli,

Risposte:


13

Non vi è alcuna contraddizione tra il mondo reale e l'azione di interesse a livello interventistico. Ad esempio, fumare fino ad oggi ed essere costretti a smettere di fumare a partire da domani non sono in contraddizione tra loro, anche se si potrebbe dire che uno "nega" l'altro. Ma ora immagina il seguente scenario. Conosci Joe, un fumatore a vita che ha il cancro ai polmoni, e ti chiedi: e se Joe non avesse fumato per trent'anni, oggi sarebbe in salute? In questo caso abbiamo a che fare con la stessa persona, allo stesso tempo, immaginando uno scenario in cui azione e risultato sono in diretta contraddizione con fatti noti.

Pertanto, la principale differenza di interventi e controfattuali è che, mentre negli interventi stai chiedendo cosa accadrà in media se esegui un'azione, nei controfattuali stai chiedendo cosa sarebbe successo se avessi intrapreso un diverso corso di azione in una situazione specifica , dato che hai informazioni su ciò che è realmente accaduto. Nota che, poiché sai già cosa è successo nel mondo reale, devi aggiornare le tue informazioni sul passato alla luce delle prove che hai osservato.

Questi due tipi di query sono matematicamente distinti perché richiedono una risposta a diversi livelli di informazioni (i controfattuali necessitano di maggiori informazioni per rispondere) e un linguaggio ancora più elaborato per essere articolato !.

Con le informazioni necessarie per rispondere alle domande di Rung 3 puoi rispondere alle domande di Rung 2, ma non viceversa. Più precisamente, non è possibile rispondere a domande controfattuali con solo informazioni interventistiche. Esempi in cui si verifica lo scontro di interventi e controfattuali sono già stati forniti qui nel CV, vedere questo post e questo post . Tuttavia, per completezza, includerò anche un esempio qui.

L'esempio seguente è riportato in Causalità, sezione 1.4.4.

Considera di aver eseguito un esperimento randomizzato in cui i pazienti sono stati assegnati in modo casuale (50% / 50%) al trattamento ( ) e alle condizioni di controllo ( ) e in entrambi i gruppi di trattamento e controllo è stato recuperato il 50% ( ) e il 50% è deceduto ( ). Questo è .x=1x=0y=0y=1P(y|x)=0.5   x,y

Il risultato dell'esperimento ti dice che l'effetto causale medio dell'intervento è zero. Questa è una domanda a gradino 2, .P(Y=1|do(X=1))P(Y=1|do(X=0)=0

Ma ora facciamo la seguente domanda: quale percentuale di quei pazienti che sono morti sotto trattamento sarebbero guariti se non avessero preso il trattamento? Matematicamente, vuoi calcolare . P(Y0=0|X=1,Y=1)

Non è possibile rispondere a questa domanda solo con i dati interventistici che hai. La dimostrazione è semplice: posso creare due diversi modelli causali che avranno le stesse distribuzioni interventistiche, ma diverse distribuzioni controfattuali. I due sono forniti di seguito:

inserisci qui la descrizione dell'immagine

Qui, equivale a fattori non osservati che spiegano come il paziente reagisce al trattamento. Puoi pensare a fattori che spiegano l'eterogeneità del trattamento, per esempio. Notare che la distribuzione marginale di entrambi i modelli concorda.UP(y,x)

Si noti che, nel primo modello, nessuno è interessato dal trattamento, quindi la percentuale di quei pazienti che sono morti sotto trattamento che si sarebbero ripresi se non avessero preso il trattamento è zero.

Tuttavia, nel secondo modello, ogni paziente è interessato dal trattamento e abbiamo una miscela di due popolazioni in cui l'effetto causale medio risulta essere zero. In questo esempio, la quantità controfattuale ora passa al 100% --- nel Modello 2, tutti i pazienti che sono morti sotto trattamento sarebbero guariti se non avessero preso il trattamento.

Pertanto, esiste una chiara distinzione tra ramo 2 e ramo 3. Come mostra l'esempio, non è possibile rispondere a domande controfattuali con solo informazioni e ipotesi sugli interventi. Ciò è chiarito con i tre passaggi per il calcolo di un controfattuale:

  1. Step 1 (rapimento): aggiorna la probabilità di fattori non osservati alla luce delle prove osservateP(u)P(u|e)
  2. Passaggio 2 (azione): eseguire l'azione nel modello (ad esempio .do(x))
  3. Passaggio 3 (previsione): prevedere nel modello modificato.Y

Questo non sarà possibile calcolare senza alcune informazioni funzionali sul modello causale o senza alcune informazioni sulle variabili latenti.


Risposta interessante! Un paio di follow-up: 1) Dici " Con le informazioni di Rung 3 puoi rispondere alle domande di Rung 2, ma non viceversa ". Ma nel tuo esempio di fumo, non capisco come sapere se Joe sarebbe stato sano se non avesse mai fumato risponde alla domanda "Sarebbe sano se smettesse domani dopo 30 anni di fumo". Sembrano domande distinte, quindi penso che mi manchi qualcosa.
mkt - Ripristina Monica il

Inoltre, l'esempio di lavoro successivo si basa sul fatto che le 2 variabili non osservate vengono distribuite in modo non casuale tra il trattamento e il controllo. Ma lo hai descritto come un esperimento randomizzato, quindi non è un caso di cattiva randomizzazione? Con una corretta randomizzazione, non vedo come ottieni due risultati così diversi a meno che non mi manchi qualcosa di base.
mkt - Ripristina Monica il

@mkt dall'ultimo al primo. La variabile non osservata viene casualmente distribuita tra trattamento e controllo, hai esattamente il 50% di ogni categoria di u in entrambe le braccia. Per informazioni intendiamo la specifica parziale del modello necessaria per rispondere a domande controfattuali in generale, non la risposta a una domanda specifica. Per rispondere a domande controfattuali è necessaria la struttura causale + alcune informazioni funzionali o informazioni sulla distribuzione delle variabili latenti.
Carlos Cinelli,

0

Ecco la risposta che Judea Pearl ha dato su Twitter :

I lettori chiedono: perché l'intervento (Rung-2) è diverso dal controfattuale (Rung-3)? L'intervento non nega alcuni aspetti del mondo osservato?

Ans. Gli interventi cambiano ma non contraddicono il mondo osservato, perché il mondo prima e dopo l'intervento comporta variabili distinte nel tempo. Al contrario, "Se fossi morto" contraddice i fatti noti. Per una discussione recente, vedere questa discussione .

Nota: sia il gruppo #causalinference di Harvard che il potenziale quadro di risultati di Rubin non distinguono Rung-2 da Rung-3.

Questa, credo, è una resistenza radicata culturalmente che verrà corretta in futuro. Deriva dall'origine di entrambi i framework nella metafora "come se randomizzata", in contrapposizione alla metafora "ascolto" fisica di #Bookofwhy

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.