In parole povere: ci sono differenze nell'approccio bayesiano e frequentista all'analisi dei dati esplorativi?
Non conosco alcun pregiudizio intrinseco nei metodi EDA poiché un istogramma è un istogramma, un diagramma a dispersione è un diagramma a dispersione, ecc., Né ho trovato esempi di differenze nel modo in cui l'EDA viene insegnato o presentato (ignorando un articolo particolarmente teorico di A. Gelman) . Infine, ho esaminato CRAN, l'arbitro di tutte le cose applicate: non ho trovato pacchetti su misura per un approccio bayesiano. Tuttavia, ho pensato che CV potesse avere alcune persone in grado di far luce su questo.
Perché dovrebbero esserci differenze?
Per i principianti:
- Quando si identificano le distribuzioni precedenti appropriate, non si dovrebbe investigare visivamente?
- Nel riassumere i dati e suggerire se usare un modello frequentista o bayesiano, l'EDA non dovrebbe suggerire quale direzione prendere?
- I due approcci presentano differenze molto chiare su come gestire i modelli di miscele. Identificare che un campione probabilmente proviene da una miscela di popolazioni è difficile e direttamente correlato alla metodologia utilizzata per stimare i parametri della miscela.
- Entrambi gli approcci incorporano modelli stocastici e la selezione del modello è guidata dalla comprensione dei dati. Dati più complessi o modelli più complessi richiedono più tempo in EDA. Con tali distinzioni tra modelli stocastici o processi generatori, ci sono differenze nelle attività EDA, quindi non dovrebbero esserci distinzioni derivanti da diversi approcci stocastici?
Nota 1: Non mi occupo delle filosofie di nessuno dei due "campi": voglio solo colmare eventuali lacune nel mio kit di strumenti e metodi EDA.