Sto leggendo Il libro del perché di Judea Pearl, e mi sta prendendo in giro 1 . In particolare, mi sembra che stia incondizionatamente basando le statistiche "classiche" sollevando un argomento da pagliaccia secondo cui le statistiche non sono mai, mai in grado di indagare sulle relazioni causali, che non sono mai interessate alle relazioni causali e che le statistiche "sono diventate un modello riduzione dei dati ". La statistica diventa una brutta parola nel suo libro.
Per esempio:
Gli statistici sono stati immensamente confusi su quali variabili dovrebbero e non dovrebbero essere controllate, quindi la pratica di default è stata quella di controllare tutto ciò che si può misurare. [...] È una procedura comoda e semplice da seguire, ma è allo stesso tempo dispendiosa e piena di errori. Un risultato chiave della rivoluzione causale è stato quello di porre fine a questa confusione.
Allo stesso tempo, gli statistici sottovalutano notevolmente il controllo, nel senso che detestano parlare della causalità [...]
Tuttavia, i modelli causali sono stati nelle statistiche come, per sempre. Voglio dire, un modello di regressione può essere utilizzato essenzialmente come modello causale, dal momento che stiamo essenzialmente assumendo che una variabile sia la causa e un'altra sia l'effetto (quindi la correlazione è un approccio diverso dalla modellazione della regressione) e testando se questa relazione causale spiega gli schemi osservati .
Un'altra citazione:
Non sorprende che gli statistici in particolare abbiano trovato difficile comprendere questo enigma [il problema di Monty Hall]. Sono abituati, come affermava RA Fisher (1922), "alla riduzione dei dati" e ignorando il processo di generazione dei dati.
Questo mi ricorda la risposta che Andrew Gelman scrisse al famoso cartone animato xkcd su bayesiani e frequentisti: "Tuttavia, penso che il fumetto nel suo insieme sia ingiusto in quanto confronta un sensibile bayesiano con uno statistico frequentista che segue ciecamente i consigli di libri di testo superficiali ".
La quantità di false dichiarazioni della parola S che, come la percepisco, esiste nel libro di Judea Pearls mi ha fatto chiedermi se l'inferenza causale (che finora ho percepito come un modo utile e interessante di organizzare e testare un'ipotesi scientifica 2 ) è discutibile.
Domande: pensi che Judea Pearl stia travisando le statistiche e, se sì, perché? Solo per far sembrare l'inferenza causale più grande di quello che è? Pensi che l'inferenza causale sia una rivoluzione con una grande R che cambia davvero tutto il nostro pensiero?
Modificare:
Le domande di cui sopra sono il mio problema principale, ma dal momento che sono, certamente, supponente, risponda a queste domande concrete (1) qual è il significato della "Rivoluzione causale"? (2) in cosa differisce dalle statistiche "ortodosse"?
1. Anche perché lui è come un ragazzo modesto.
2. Intendo in senso scientifico, non statistico.
EDIT : Andrew Gelman ha scritto questo post sul blog sul libro Judea Pearls e penso che abbia fatto un lavoro molto migliore spiegando i miei problemi con questo libro rispetto a me. Ecco due citazioni:
A pagina 66 del libro, Pearl e Mackenzie scrivono che le statistiche "sono diventate un'impresa di riduzione dei dati alla cieca." Ehi! Di che diavolo stai parlando?? Sono uno statistico, ho fatto statistiche per 30 anni, lavorando in settori che vanno dalla politica alla tossicologia. "Riduzione dei dati alla cieca"? Sono solo cazzate. Utilizziamo sempre modelli.
E un altro:
Guarda. Conosco il dilemma del pluralista. Da un lato, Pearl crede che i suoi metodi siano migliori di tutto ciò che è venuto prima. Belle. Per lui e per molti altri, sono i migliori strumenti là fuori per studiare l'inferenza causale. Allo stesso tempo, come pluralista o studente di storia scientifica, ci rendiamo conto che ci sono molti modi per preparare una torta. È difficile mostrare rispetto per gli approcci che non lavori davvero per te, e ad un certo punto l'unico modo per farlo è fare un passo indietro e rendersi conto che le persone reali usano questi metodi per risolvere problemi reali. Ad esempio, penso che prendere decisioni usando i valori di p sia un'idea terribile e logicamente incoerente che ha portato a molti disastri scientifici; allo stesso tempo, molti scienziati riescono a usare i valori di p come strumenti per l'apprendimento. Lo riconosco. Allo stesso modo, Consiglio a Pearl di riconoscere che l'apparato statistico, la modellizzazione della regressione gerarchica, le interazioni, la post-stratificazione, l'apprendimento automatico, ecc. Ecc., Risolvono problemi reali nell'inferenza causale. I nostri metodi, come quelli di Pearl, possono anche sbagliare - GIGO! - e forse Pearl ha ragione sul fatto che saremmo tutti meglio a passare al suo approccio. Ma non penso che sia d'aiuto quando rilascia dichiarazioni inesatte su ciò che facciamo.