Le mie attuali domande sono negli ultimi due paragrafi, ma per motivarle:
Se sto tentando di stimare la media di una variabile casuale che segue una distribuzione normale con una varianza nota, ho letto che mettere una divisa prima della media si traduce in una distribuzione posteriore che è proporzionale alla funzione di probabilità. In queste situazioni, l'intervallo credibile bayesiano si sovrappone perfettamente con l'intervallo di confidenza del frequentatore e la stima massima a posteriori bayesiana è uguale alla stima della massima verosimiglianza del frequentatore.
In una semplice impostazione di regressione lineare,
mettere un precedente uniforme su e un precedente inverso-gamma su con valori di parametro piccoli produce un posteriore che sarà molto simile al frequentista e un intervallo credibile per la distribuzione posteriore di che sarà molto simile all'intervallo di confidenza attorno alla stima della massima verosimiglianza. Non saranno esattamente gli stessi perché il precedente su esercita una piccola quantità di influenza e se la stima posteriore viene effettuata tramite simulazione MCMC che introdurrà un'altra fonte di discrepanza, ma l'intervallo credibile bayesiano attorno alσ 2 β M A P β M L E β | X σ 2 β M A P β M L Ee l'intervallo di confidenza frequentista attorno a sarà abbastanza vicino l'uno all'altro, e naturalmente all'aumentare della dimensione del campione dovrebbero convergere mentre l'influenza della probabilità cresce per dominare quella del precedente.
Ma ho letto che ci sono anche situazioni di regressione in cui queste equivalenze vicine non valgono. Ad esempio, regressioni gerarchiche con effetti casuali o regressione logistica: si tratta di situazioni in cui, a quanto ho capito, non vi sono "buoni" obiettivi o precedenti di riferimento.
Quindi la mia domanda generale è questa: supponendo che io voglia fare deduzione sue che non ho informazioni preliminari che voglio incorporare, perché non posso procedere con la stima della massima verosimiglianza da parte del frequentatore in queste situazioni e interpretare le stime dei coefficienti risultanti e gli errori standard come stime MAP bayesiane e deviazioni standard e trattarle implicitamente stime "posteriori" come risultanti da un precedente che deve essere stato "non informativo" senza tentare di trovare la formulazione esplicita del precedente che porterebbe a un simile posteriore? In generale, nell'ambito dell'analisi di regressione, quando va bene procedere su questa linea (di trattare la probabilità come un posteriore) e quando non va bene? Che dire dei metodi frequentisti che non sono basati sulla verosimiglianza, come i metodi di quasi verosimiglianza,
Le risposte dipendono dal fatto che il mio obiettivo di inferenza sia la stima del punto di coefficiente, o la probabilità che un coefficiente si trovi all'interno di un determinato intervallo o quantità della distribuzione predittiva?