Ci sono differenze nell'approccio bayesiano e frequentista all'EDA?


14

In parole povere: ci sono differenze nell'approccio bayesiano e frequentista all'analisi dei dati esplorativi?

Non conosco alcun pregiudizio intrinseco nei metodi EDA poiché un istogramma è un istogramma, un diagramma a dispersione è un diagramma a dispersione, ecc., Né ho trovato esempi di differenze nel modo in cui l'EDA viene insegnato o presentato (ignorando un articolo particolarmente teorico di A. Gelman) . Infine, ho esaminato CRAN, l'arbitro di tutte le cose applicate: non ho trovato pacchetti su misura per un approccio bayesiano. Tuttavia, ho pensato che CV potesse avere alcune persone in grado di far luce su questo.

Perché dovrebbero esserci differenze?

Per i principianti:

  1. Quando si identificano le distribuzioni precedenti appropriate, non si dovrebbe investigare visivamente?
  2. Nel riassumere i dati e suggerire se usare un modello frequentista o bayesiano, l'EDA non dovrebbe suggerire quale direzione prendere?
  3. I due approcci presentano differenze molto chiare su come gestire i modelli di miscele. Identificare che un campione probabilmente proviene da una miscela di popolazioni è difficile e direttamente correlato alla metodologia utilizzata per stimare i parametri della miscela.
  4. Entrambi gli approcci incorporano modelli stocastici e la selezione del modello è guidata dalla comprensione dei dati. Dati più complessi o modelli più complessi richiedono più tempo in EDA. Con tali distinzioni tra modelli stocastici o processi generatori, ci sono differenze nelle attività EDA, quindi non dovrebbero esserci distinzioni derivanti da diversi approcci stocastici?

Nota 1: Non mi occupo delle filosofie di nessuno dei due "campi": voglio solo colmare eventuali lacune nel mio kit di strumenti e metodi EDA.

Risposte:


17

Nella mia mente, Bayes vs frequentista parla di inferenza formale, e l'analisi dei dati esplorativi non lo è.

Certamente, quando si tratta di valutazione del modello / bontà di adattamento e analisi di sensibilità, in cui classificherei i tuoi punti (1), (3) e (4), ci saranno differenze nel modo in cui si procederebbe, ma questo perché la natura delle differenze tra l'analisi e i metodi computazionali piuttosto che sulla filosofia.

Per quanto riguarda il tuo (2), generalmente non vedo i risultati dell'EDA come un riferimento verso l'approccio bayesiano o frquentista, ma piuttosto penso che l'obiettivo dello studio sia quello che conta di più.

Personalmente, l'EDA (oltre alla profonda introspezione) mi indirizzerebbe verso un modello, e se potessi trovare un approccio frequentista naturale che risponda ragionevolmente bene alla domanda scientifica, lo farei, ma se per la natura della situazione , nessun metodo frequentista avrebbe funzionato bene, e se ci fosse stato un ragionevole precedente, avrei usato Bayes.


(+1) Molto ben detto, specialmente "L'EDA (più la profonda introspezione) mi indirizzerebbe verso un modello"
suncoolsu,

+1 pure. L'EDA in realtà non riguarda la scelta di una prospettiva, ma la comprensione dei dati per prendere decisioni più informate.
Fomite

+1 Per una buona risposta. Sfortunatamente, penso che la domanda originale sia stata fraintesa. Non stavo chiedendo di usare l'EDA per decidere tra modelli bayesiani o frequentisti. Dovrò rivedere il modo in cui l'ho formulato se sembra che diverse persone abbiano lo stesso malinteso.
Iteratore

@Iteratore Comprendo la tua domanda principale: ci sono differenze tra gli approcci dei bayesiani e dei frequentisti all'EDA? La mia risposta è: no; L'EDA non è né frequentista né bayesiano.
Karl,

3
Penso che la mia definizione di "analisi dei dati esplorativi" sia più stretta della tua. Dal mio punto di vista, ogni buona analisi dei dati implica l'esplorazione. Ciò che distingue "analisi dei dati esplorativi" è la mancanza di un modello o qualsiasi sforzo verso l'inferenza formale.
Karl,

0

Penso che l'EDA ti aiuti a costruire un modello, fare alcune ipotesi e (se necessario) aggiornare il modello e le sue ipotesi. Seleziono un approccio pragmatico da utilizzare per l'adattamento e la valutazione del modello.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.