Gli statistici del settore privato cercano di determinare la causalità?


12

Gli econometrici accademici sono spesso interessati a determinare la causalità. Sembra che tutti i lavori di scienza statistica / dati del settore privato di cui ho sentito siano solo alla ricerca di modelli predittivi.

Ci sono lavori nel settore privato (o lavori governativi) che ricercano la causalità?


5
Ogni volta che vogliamo fare un intervento, scommetti che ci importa. Pensa a tutti i test A / B eseguiti da Google per apportare una semplice modifica al design.
Matthew Drury,

8
Ovviamente. Quasi ogni caso legale alla fine dipende da questioni di causalità. Quasi ogni decente schema di controllo della qualità riguarda la causalità. Ingegneri e scienziati ci tengono molto.
whuber

6
Un'altra classica domanda del settore privato è "Le mie pubblicità causano più vendite?"
Matthew Gunn,

2
@MatthewGunn: +1. In generale: "Questo cambiamento (costoso) farà la differenza?" Supporre che un'azienda debba rimanere a galla (e possibilmente prosperare) avendo un certo grado di comprensione delle dinamiche causali del suo mercato è cruciale.
usεr11852,

4
Inizialmente mi sono astenuto dal convertire questo thread in CW, ritenendo possibile che potesse essere offerta una risposta autorevole, basata su dati / fatti. Dal momento che non sta andando in quel modo, per vari motivi che molti potrebbero trovare interessanti e utili, l'ho convertito in CW. Grazie a tutti per aver contribuito!
whuber

Risposte:


15

Sono un economista in tecnologia che lavora sull'inferenza causale con dati sperimentali osservativi o imperfetti. La maggior parte delle principali aziende tecnologiche avrà persone come me in giro a fare ricerca applicata su prezzi, marketing e design del prodotto. Ci sono anche team di politiche pubbliche in alcune aziende.

Ci sono anche molte persone che lavorano sulla sperimentazione web. Questo è un gruppo molto più grande.

Infine, ci sono anche particolari tipi di consulenza economica, in particolare anti-trust, dove questo è l'obiettivo principale.


7

[Le prime cinque risposte emotive sono state censurate.]

Questa è una delle domande più strane sul sito, francamente. E mostra quanta disconnessione c'è tra ciò che dicono i tuoi professori e la vita reale, cioè la vita fuori dalla torre d'avorio. È positivo che tu stia sbirciando fuori da esso ... ma tu (intendendo, dottorandi in economia) sicuramente devi farlo più spesso.

Sì, ci sono lavori al di fuori del mondo accademico in cui le persone (sorpresa, sorpresa) usano metodi di inferenza causale. E (sorpresa, sorpresa) pubblica articoli. Le mie risposte sono specifiche per gli Stati Uniti, ma sono sicuro che puoi trovare organizzazioni simili in altri paesi.

  • Esempio 1 (solo perché lo conosco internamente nel mio lavoro). Lavoro in una filiale di una grande organizzazione di ricerca a contratto, Abt Associates . Impiega circa 2.300 persone in 50 paesi e la maggior parte di loro lavora per condurre o supportare ricerche di valutazione e implementare interventi. Uno dei primi 6 tecnici (indicato come Senior Fellows ), Jacob Klerman, è l'editore di Review Review, supervisionando un collegio dei quali circa il 5/6 ha affiliazioni accademiche. Quindi questo è un esempio del settore privato per te. (Controlla gli annunci sulla posizione dell'azienda per vedere in particolare quale tipo di competenze potrebbe cercare un'azienda come quella - Non sono del tutto sicuro che tutti pubblicizzino su JOE perché è costoso; posso facilmente nominare un'altra dozzina negli Stati Uniti che sarebbe felice assumere un econometrico artigiano.)
  • Esempio 2 (ho una familiarità passeggera con quello perché conosco persone che hanno iniziato questo progetto da altre sedi): What Works Clearinghousepresso il Dipartimento federale dell'educazione degli Stati Uniti è un sito web dedicato alla meta-analisi dell'analisi pubblicata dei programmi educativi. Il WWC opera attraverso una rete di revisori ai quali vengono fornite istruzioni specifiche su ciò che è considerato uno studio che ha un rigore sufficiente a supportare le affermazioni causali e ciò che non lo è. Si scopre che gran parte di quella ricerca pubblicata è una schifezza assoluta. Come in cazzate. Nessun gruppo di controllo. Nessun controllo del saldo sulle covariate demografiche / equivalenza di base. Solo circa il 3-5% degli studi (pubblicati nella letteratura peer-review, per l'amor del cielo) "soddisfano gli standard senza riserve" - ​​nel senso che avevano una certa parvenza di randomizzazione, logoramento controllato e contaminazione incrociata dei bracci dell'esperimento, e ha fatto l'analisi in modo più o meno accettabile lungo la linea. (Secondo il teorema di Bayes, quando senti qualcuno dire "Ma ho visto che la gomma da masticare aumenta il rendimento in matematica", puoi rispondere "BS", e avresti ragione il 90 +% delle volte.) Ad ogni modo, questo è un dipartimento, quindi questo è un esempio per te in cui un'agenzia governativa rivede l'uso corretto degli strumenti di inferenza causale. (Getta il tuo nome nel cappello come revisore dello studio, questa sarà una grande esperienza educativa per te. Se insegnassi la valutazione del programma, lo farei diventare un requisito per i miei studenti.) (Per i biostatisti che lavorano con la FDA, dove tu devi inviare il codice di analisi prima di raccogliere qualsiasi dato, gli standard WWC sono ancora molto lassisti.) avrei ragione il 90 +% delle volte.) Ad ogni modo, si tratta di un progetto del dipartimento federale, quindi questo è un esempio per te in cui un'agenzia governativa rivede l'uso corretto degli strumenti di inferenza causale. (Getta il tuo nome nel cappello come revisore dello studio, questa sarà una grande esperienza educativa per te. Se insegnassi la valutazione del programma, lo farei diventare un requisito per i miei studenti.) (Per i biostatisti che lavorano con la FDA, dove tu devi inviare il tuo codice di analisi prima di raccogliere qualsiasi dato, gli standard WWC sono ancora molto lassisti.) avrei ragione il 90 +% delle volte.) Ad ogni modo, si tratta di un progetto del dipartimento federale, quindi questo è un esempio per te in cui un'agenzia governativa rivede l'uso corretto degli strumenti di inferenza causale. (Getta il tuo nome nel cappello come revisore dello studio, questa sarà una grande esperienza educativa per te. Se insegnassi la valutazione del programma, lo farei diventare un requisito per i miei studenti.) (Per i biostatisti che lavorano con la FDA, dove tu devi inviare il codice di analisi prima di raccogliere qualsiasi dato, gli standard WWC sono ancora molto lassisti.)

Non credo che i professori di economia affermino che non usi metodi causali nella pratica (nessuno inizia a parlare con "ecco alcuni metodi statistici di cui nessuno si preoccuperà"), ma piuttosto lo studente è preoccupato che l'inferenza causale sia solo un avorio argomento della torre (come la stima della densità log-concava: ti assicuro che nessuno nel settore lo fa, e per una buona ragione). Inoltre, non è chiaro come l'esempio 2 mostri le persone nell'industria che usano metodi causali?
Cliff AB,

@CliffAB L'OP ha richiesto esempi di settore e di governo, quindi il secondo posto è perfetto. Penso anche che il punto di StasK sulla scarsa conoscenza della vita al di fuori della torre d'avorio tra gli studenti di dottorato in economia, e in misura minore i loro professori, sia piuttosto accurato, anche se c'è molta eterogeneità tra campi e dipartimenti e persino il tempo.
Dimitriy V. Masterov,

@ DimitriyV.Masterov: # 2 sembra un esempio di non usare strumenti causali adeguati. E ho letto (forse frainteso) la risposta di StasK come sottintesa che i professori stanno dicendo "nessuno al di fuori degli accademici usa metodi causali". Se un professore specializzato in metodi causali lo dicesse, stanno ammettendo il fallimento; se stai creando metodi statistici applicati che nessuno al di fuori del mondo accademico utilizza, questo non è considerato una buona cosa. La teoria statistica è ovviamente una storia diversa.
Cliff AB,

La mia lettura (di nuovo, forse fraintesa) della domanda del PO è che i professori stanno dicendo loro "la statistica causale è importante!", E la loro risposta è "è davvero importante? Le persone nell'industria usano effettivamente questi metodi?". Ma di nuovo, forse sto leggendo male.
Cliff AB,

1
@CLIFF WWCH esamina la ricerca accademica, separando il grano dalla paglia per quanto riguarda l'inferenza causale, quindi in realtà è un ottimo esempio di un'area in cui gli standard sono più alti nel governo che in alcune parti del mondo accademico.
Dimitriy V. Masterov,

6

Nelle statistiche farmaceutiche e in una serie di settori correlati, il nesso causale tra intervento ed esito sanitario è la questione chiave di interesse quando si decide se un intervento debba essere utilizzato. Esistono numerosi sottocampi come studi randomizzati (clinici o preclinici), studi non randomizzati o su braccio singolo, esperimenti di laboratorio, meta-analisi, sorveglianza della sicurezza farmacologica basata sulla segnalazione spontanea di eventi avversi, epidemiologia (incluso idee come la randomizzazione mandeliana) e la ricerca sull'efficacia (ad es. utilizzo di dati osservativi come database di sinistri assicurativi). Naturalmente negli esperimenti randomizzati progettati (come studi clinici randomizzati) l'attribuzione della causalità è in qualche modo più semplice che in alcune altre applicazioni.


Suppongo che un'impostazione di sviluppo della medicina sarebbe uno dei pochi posti in cui le persone si preoccupano della causa delle persone che migliorano piuttosto che se migliorano, perché alla fine è necessario "essere al sicuro" in tutta la popolazione. - Quindi, sicuramente una bella risposta, ma come dici tu, un caso abbastanza speciale.
Dennis Jaheruddin,

4

Sono un ricercatore presso A Place for Mom, il più grande servizio di rimpatrio vivente senior della nazione. Abbiamo progettato un sondaggio per capire come il passaggio a una comunità vivente assistita influenza la qualità della vita. L'inferenza causale è fondamentale per questa ricerca e i metodi di analisi causale (ad es. Abbinamento, modellizzazione dei processi di selezione, stima degli effetti medi del trattamento) sono essenziali.


-3

Nella maggior parte delle situazioni del settore privato non ti interesserai della causalità

In pratica, nonostante l'uso tipico del linguaggio, le persone sono molto più spesso interessate all'impatto ben compreso , piuttosto che alla causalità (ben compresa).

Da un punto di vista accademico, è molto interessante sapere:

Se faccio A, per questo il risultato sarà B

Ma da un punto di vista pratico, in quasi tutte le situazioni il seguente è ciò che le persone vogliono davvero sapere:

Se faccio A, il risultato sarà B

Sicuramente potresti essere interessato all'impatto di A, ma se è davvero la causa, o se c'è una causa nascosta che accade per creare questa correlazione di solito non è così interessante.

Nota sulle limitazioni

Potresti pensare: ok, ma se non sappiamo che A causa B, allora è molto rischioso lavorare su quell'ipotesi.

Questo è vero in un certo senso, ma di nuovo in pratica ti preoccuperai solo: funzionerà o ci sono delle eccezioni?

Per illustrare ciò, è possibile notare che questa situazione:

Se faccio A, nella situazione X, a causa di A il risultato sarà B e a causa di X il risultato si discosterà di delta

Non è molto più utile di questa situazione (supponendo che sia possibile quantificare gli impatti equamente):

Se faccio A, nella situazione X, il risultato sarà B e il risultato si discosterà dal delta

Esempio semplice: correlazione con la causa

  • A: Rabboccare l'olio motore
  • B: riduzione del freno
  • C: controllo dell'auto

La logica: C causa sempre A e B

Relazione risultante: se A sale, B sale ma non esiste alcuna relazione causale tra A e B.

Il mio punto: puoi modellare l'impatto di A su B. A non causa B, ma il modello sarà comunque corretto e se hai informazioni su A, avrai informazioni su B.

La persona interessata al freno di stazionamento con informazioni su A si preoccuperà solo di conoscere la relazione tra A e B e si preoccuperà solo se la relazione è corretta, indipendentemente dal fatto che questa relazione sia causale o meno.


1
Non credo di essere l'unico a essere confuso dalla tua distinzione tra "causa" e "impatto". I tuoi esempi sembrano chiarire un po ': svelare i dettagli della catena causale potrebbe non essere particolarmente importante. L'acquisto di altre inserzioni di costo-per-click causare un aumento delle vendite - non importa come - e questo è ciò che conta per il vostro cliente.
Scortchi - Ripristina Monica

@Scortchi Cosa intendo per causa: 'Se A, allora a causa di quella B'. Cosa intendo per impatto (forse non la definizione più tipica, ma non si tratta di linguaggio): "Se A allora B". - Esempio da manuale di una differenza rilevante: C causa A e B. Pertanto A non causa B, ma direi che avrebbe senso modellare l'impatto di A su B. - Dopo aver riletto il mio commento, forse 'impatto "potrebbe essere sostituito da" relazione effettiva con il ritardo ".
Dennis Jaheruddin,

5
Non credo di essere d'accordo con l'esempio pubblicitario: se devo decidere se acquistare più annunci online, mi preoccupo se farlo comporterà più vendite rispetto a non acquistare questi annunci (attraverso più click-through o da altri significa = causalità), che potrebbe essere diverso dal fatto che le aziende che hanno aumentato la loro pubblicità online nell'ultimo anno abbiano registrato aumenti delle vendite più elevati rispetto alle società che non lo hanno fatto (correlazione). La causalità non riguarda l'esatto mezzo con cui si verifica il risultato (sarebbe bello sapere, ovviamente), ma piuttosto se si verifica qualcosa a causa del fare o meno A.
Björn,

6
ABAB

Non credo di essere d'accordo con questo commento, sebbene nella mia esperienza sia in qualche modo vera la causalità non sia ricercata, sebbene in molti problemi dovrebbe. In pratica, lo considero quasi equivalente alla distinzione tra modelli predittivi e modelli esplicativi.
Thomas Speidel,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.