Perché la statistica bayesiana sta diventando un argomento di ricerca sempre più popolare? [chiuso]


10

Navigando attraverso l'area di ricerca dei primi 100 programmi statistici delle notizie statunitensi, quasi tutti sono pesanti nelle statistiche bayesiane. Tuttavia, se vado a scuola di livello inferiore, la maggior parte di loro sta ancora facendo ricerche di statistica classica / frequentista. Ad esempio, la mia scuola attuale (classificata tra 150 e 200 nella classifica mondiale QS per le statistiche, quindi non considerata una scuola di alto livello) ha un solo professore che si concentra sulle statistiche bayesiane e c'è quasi un risentimento verso le statistiche bayesiane. Alcuni studenti universitari con cui ho parlato affermano persino che gli statistici bayesiani stanno facendo statistiche bayesiane per il bene di cui ovviamente non sono molto d'accordo.

Tuttavia, mi chiedo perché sia ​​così. Sto avendo diverse ipotesi istruite:

(a) non c'è abbastanza spazio per progressi nella metodologia delle statistiche classiche / frequentanti e l'unica ricerca praticabile nella ricerca delle statistiche classiche / frequentiste è sulle applicazioni che saranno al centro delle scuole di livello inferiore poiché le scuole di livello superiore dovrebbero essere più propenso alla ricerca teorica e metodologica.

(b) Dipende fortemente dal campo. Alcuni rami delle statistiche sono semplicemente più adatti per le statistiche bayesiane come molte applicazioni scientifiche del metodo delle statistiche, mentre altri rami sono più adatti per le statistiche classiche come l'area finanziaria. (correggimi se sbaglio) Dato questo, mi sembra che le scuole di livello superiore abbiano molte facoltà di statistica che fanno applicazioni in campo scientifico mentre il dipartimento di statistiche delle scuole di livello inferiore sta concentrando principalmente le applicazioni nell'area finanziaria poiché ciò le aiuta a generare reddito e finanziamenti.

(c) Esistono enormi problemi con il metodo frequentista che non possono essere risolti, ad esempio il rischio di sovralimentazione di MLE, ecc. E Bayesian sembra fornire soluzioni brillanti.

(d) Il potere computazionale è qui, quindi il calcolo bayesiano non è più un collo di bottiglia come lo era 30 anni fa.

(e) Questa potrebbe essere la supposizione più supponente che io abbia. C'è una resistenza da parte dello statistico classico / frequentista che proprio non ama una nuova ondata di metodologia che può potenzialmente superare il ruolo delle statistiche classiche. Ma come ha detto Larry Wasserman, dipende da cosa stiamo cercando di fare e tutti dovrebbero avere una mente aperta, specialmente come ricercatore.


1
Mentre le opinioni degli abitanti dei CV varieranno e tale opinione è considerata fuori tema, vale la pena sottolineare che si risponde esattamente a questa domanda nei capitoli introduttivi dei testi moderni sull'analisi bayesiana. In particolare, capitolo 1 di Gelman, et al Bayesian Data Analysis 3rd Ed. Si riduce a a) "buon senso" eb) l'intervallo di confidenza del frequentatore altamente problematico che il 99% di noi non può fare a meno di interpretare erroneamente. Il modo in cui interpretiamo erroneamente è intrinsecamente bayesiano, quindi potremmo anche fare l'analisi bayesiana fin dall'inizio.
Peter Leopold,

3
@Peter Leopold Half sul serio: 99%? e chi è "noi"? Molti ingenui utenti di statistiche hanno effettivamente seri malintesi sugli IC, ma se ti rivolgi alla comunità CV, spero che il 99% non si adatti davvero. Le persone statistiche possono essere altrettanto cattive di chiunque altro nel fare i numeri in assenza di dati concreti!
Nick Cox,

@NickCox Mi stavo rivolgendo al PO, e "noi" è pensato per essere empatico e inclusivo. Si spera che il "99%" sia riconosciuto come un ordine di grandezza stimato . È anche la più grande frazione del tropico di avere / non avere nella cultura popolare, dove i non abbienti in questo contesto indicano l'evento: "Ho preso le statistiche 101, ma non ho completamente interiorizzato l'interpretazione frequentista e bayesiana degli intervalli di confidenza vs. intervalli credibili ". E ora che mi hai chiamato, ti dirò (: D) che è il mio precedente ufficiale per quell'evento! Naturalmente, sono disposto a convincermi diversamente! : D102
Peter Leopold,

Risposte:


8

Personalmente, mi azzarderei ad indovinare:

(1) Le statistiche bayesiane hanno visto un enorme aumento di popolarità negli ultimi due decenni. Parte di ciò era dovuta ai progressi nella MCMC e ai miglioramenti delle risorse computazionali. Le statistiche bayesiane sono passate dall'essere teoricamente veramente carine ma applicabili solo ai problemi dei giocattoli a un approccio che potrebbe essere applicato in modo più universale. Ciò significa che diversi anni fa, affermando che hai lavorato sulle statistiche bayesiane probabilmente ti ha reso un noleggio molto competitivo.

Ora, direi che le statistiche bayesiane sono ancora un vantaggio, ma quindi sta lavorando a problemi interessanti senza usare i metodi bayesiani. Una mancanza di preparazione nelle statistiche bayesiane sarebbe sicuramente un aspetto negativo per la maggior parte dei comitati di assunzione, ma ottenere un dottorato di ricerca in statistica senza una formazione sufficiente sui metodi bayesiani sarebbe piuttosto sorprendente.

(2) Gli statistici bayesiani menzioneranno "bayesiano" nel loro CV. I frequentisti di solito non inseriranno "Frequentist" nel loro CV, ma molto più tipicamente nell'area in cui lavorano (ad es. Analisi di sopravvivenza, modellazione predittiva, previsione, ecc.). Ad esempio, gran parte del mio lavoro sta scrivendo algoritmi di ottimizzazione, il che immagino implica che diresti che faccio un lavoro frequentista. Ho anche scritto una buona parte degli algoritmi bayesiani, ma è certamente nella minoranza del mio lavoro. Le statistiche bayesiane sono sul mio CV, le statistiche frequentiste no.

(3) In una certa misura, anche ciò che hai detto nella tua domanda contiene verità. Un efficiente calcolo generale bayesiano ha più problemi aperti rispetto al regno frequentista. Ad esempio, Hamiltonian Monte Carlo è recentemente diventato un algoritmo molto eccitante per il campionamento generico da modelli bayesiani. Non c'è molto spazio per il miglioramento del genericoottimizzazione in questi giorni; Gli algoritmi di Newton Raphson, L-BFGS ed EM coprono molte basi. Se vuoi migliorare questi metodi, generalmente devi specializzarti molto sul problema. Come tale, ti piace più dire "Lavoro sull'ottimizzazione ad alta dimensione dei modelli geospaziali" piuttosto che "Lavoro sulla stima della massima verosimiglianza ad alta dimensione". Il mondo dell'apprendimento automatico è un po 'un'eccezione a questo, poiché c'è molta eccitazione nello scoprire nuovi metodi di ottimizzazione stocastica (cioè SGD, Adam, ecc.), Ma questa è una bestia leggermente diversa per alcuni motivi.

Allo stesso modo, c'è del lavoro da fare per trovare buoni priori per i modelli. Metodi frequentista fare hanno un equivalente a questo (fino a venire con buone sanzioni, vale a dire, LASSO, glmnet), ma non c'è terra probabilmente più fertile per oltre priori sanzioni.

(4) Infine, e questa è sicuramente un'opinione più personale, molte persone associano Frequentist a valori p. Dato l'abuso generale di valori di p osservato in altri campi, molti statistici vorrebbero prendere le distanze il più possibile dagli attuali abusi di valori di p.


3
Quindi la risposta al perché è diventato più popolare include (1) è diventato più popolare. Perplesso da ciò, ma immagino sia solo una questione di bisogno di una riformulazione.
Nick Cox,

@NickCox: il mio punto è che è più popolare, ma anche la sua popolarità può essere in qualche modo sopravvalutata. Cioè, l'OP ha visto che Bayesian Statistics era nel CV di quasi tutti i professori in un campione di università di alto livello. Ma ciò non significa che ognuno di quei professori faccia solo statistiche bayesiane. Un altro punto su (1) è che penso che ci sia stato un tempo in cui fare statistiche bayesiane dato che la tua area di ricerca era molto importante per ottenere una posizione di alto livello. Non sono più sicuro del requisito più rigoroso, ma molti dei professori che vedi ora sono stati assunti in quel periodo.
Cliff AB,

Oh, vedo il tuo punto. Mi stavo concentrando sulla discussione del "È perché non c'è abbastanza spazio per avanzare nelle statistiche classiche / frequentiste?" e non tanto sul "perché sta succedendo questo?"
Cliff AB,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.