Non vi è alcuna contraddizione tra il mondo reale e l'azione di interesse a livello interventistico. Ad esempio, fumare fino ad oggi ed essere costretti a smettere di fumare a partire da domani non sono in contraddizione tra loro, anche se si potrebbe dire che uno "nega" l'altro. Ma ora immagina il seguente scenario. Conosci Joe, un fumatore a vita che ha il cancro ai polmoni, e ti chiedi: e se Joe non avesse fumato per trent'anni, oggi sarebbe in salute? In questo caso abbiamo a che fare con la stessa persona, allo stesso tempo, immaginando uno scenario in cui azione e risultato sono in diretta contraddizione con fatti noti.
Pertanto, la principale differenza di interventi e controfattuali è che, mentre negli interventi stai chiedendo cosa accadrà in media se esegui un'azione, nei controfattuali stai chiedendo cosa sarebbe successo se avessi intrapreso un diverso corso di azione in una situazione specifica , dato che hai informazioni su ciò che è realmente accaduto. Nota che, poiché sai già cosa è successo nel mondo reale, devi aggiornare le tue informazioni sul passato alla luce delle prove che hai osservato.
Questi due tipi di query sono matematicamente distinti perché richiedono una risposta a diversi livelli di informazioni (i controfattuali necessitano di maggiori informazioni per rispondere) e un linguaggio ancora più elaborato per essere articolato !.
Con le informazioni necessarie per rispondere alle domande di Rung 3 puoi rispondere alle domande di Rung 2, ma non viceversa. Più precisamente, non è possibile rispondere a domande controfattuali con solo informazioni interventistiche. Esempi in cui si verifica lo scontro di interventi e controfattuali sono già stati forniti qui nel CV, vedere questo post e questo post . Tuttavia, per completezza, includerò anche un esempio qui.
L'esempio seguente è riportato in Causalità, sezione 1.4.4.
Considera di aver eseguito un esperimento randomizzato in cui i pazienti sono stati assegnati in modo casuale (50% / 50%) al trattamento ( ) e alle condizioni di controllo ( ) e in entrambi i gruppi di trattamento e controllo è stato recuperato il 50% ( ) e il 50% è deceduto ( ). Questo è .x = 1x = 0y= 0y= 1P( y| x)=0,5∀x,y
Il risultato dell'esperimento ti dice che l'effetto causale medio dell'intervento è zero. Questa è una domanda a gradino 2, .P( Y= 1 | do ( X= 1 ) ) - P( Y= 1 | do ( X= 0 ) = 0
Ma ora facciamo la seguente domanda: quale percentuale di quei pazienti che sono morti sotto trattamento sarebbero guariti se non avessero preso il trattamento? Matematicamente, vuoi calcolare . P( Y0= 0 | X= 1 , Y= 1 )
Non è possibile rispondere a questa domanda solo con i dati interventistici che hai. La dimostrazione è semplice: posso creare due diversi modelli causali che avranno le stesse distribuzioni interventistiche, ma diverse distribuzioni controfattuali. I due sono forniti di seguito:
Qui, equivale a fattori non osservati che spiegano come il paziente reagisce al trattamento. Puoi pensare a fattori che spiegano l'eterogeneità del trattamento, per esempio. Notare che la distribuzione marginale di entrambi i modelli concorda.UP( y, x )
Si noti che, nel primo modello, nessuno è interessato dal trattamento, quindi la percentuale di quei pazienti che sono morti sotto trattamento che si sarebbero ripresi se non avessero preso il trattamento è zero.
Tuttavia, nel secondo modello, ogni paziente è interessato dal trattamento e abbiamo una miscela di due popolazioni in cui l'effetto causale medio risulta essere zero. In questo esempio, la quantità controfattuale ora passa al 100% --- nel Modello 2, tutti i pazienti che sono morti sotto trattamento sarebbero guariti se non avessero preso il trattamento.
Pertanto, esiste una chiara distinzione tra ramo 2 e ramo 3. Come mostra l'esempio, non è possibile rispondere a domande controfattuali con solo informazioni e ipotesi sugli interventi. Ciò è chiarito con i tre passaggi per il calcolo di un controfattuale:
- Step 1 (rapimento): aggiorna la probabilità di fattori non osservati alla luce delle prove osservateP( u )P( u | e )
- Passaggio 2 (azione): eseguire l'azione nel modello (ad esempio .do ( x ) )
- Passaggio 3 (previsione): prevedere nel modello modificato.Y
Questo non sarà possibile calcolare senza alcune informazioni funzionali sul modello causale o senza alcune informazioni sulle variabili latenti.