Esempio di come le statistiche bayesiane possono stimare parametri che sono molto difficili da stimare attraverso metodi frequentisti


9

Gli statistici bayesiani sostengono che "Le statistiche bayesiane possono stimare parametri che sono molto difficili da stimare attraverso metodi frequentisti". La seguente citazione tratta da questa documentazione SAS dice la stessa cosa?

Fornisce inferenze che sono condizionate dai dati e sono esatte, senza fare affidamento sull'approssimazione asintotica. L'inferenza di piccolo campione procede come se si avesse un campione grande. L'analisi bayesiana può anche stimare direttamente qualsiasi funzione dei parametri, senza utilizzare il metodo "plug-in" (un modo per stimare i funzionali collegando i parametri stimati ai funzionali).

Ho visto una dichiarazione simile in alcuni libri di testo ma non ricordo dove. Qualcuno può spiegarmelo con un esempio?


Qual è la probabilità che il sole sorga domani? en.wikipedia.org/wiki/Sunrise_problem Questo esempio potrebbe essere più banale di quanto speravi
Hugh,

Puoi inserire il preventivo direttamente nella tua domanda? Il titolo sembra non correlato al secondo punto elenco.
Hugh,

1
L'affermazione in quella citazione non è eccezionale in quanto (a) "esatto" non significa nulla lì e (b) la critica del plug-in si applica solo quando si considera l'intera stima posteriore e non un'altra, più a seconda della funzione di perdita scelta per la stima. Vedi questa altra domanda per alcune risposte .
Xi'an,

Risposte:


8

Ho obiezioni con quella citazione:

  1. "Frequenzialismo" è un approccio all'inferenza basato sulle proprietà di frequenza degli stimatori scelti. Questa è una vaga nozione in quanto non afferma nemmeno che gli stimatori devono convergere e se lo fanno in base a come devono convergere. Ad esempio, l'imparzialità è una nozione frequentista ma non può valere per qualsiasi funzione [del parametro ] di interesse poiché la raccolta di trasformazioni di che consentono uno stimatore imparziale è molto limitata. Inoltre, uno stimatore frequentista non è prodotto dal paradigma ma deve essere scelto prima di essere valutato. In tal senso, uno stimatore bayesiano è uno stimatore frequentista se soddisfa alcune proprietà frequentiste.θθθ
  2. L'inferenza prodotta da un approccio bayesiano si basa sulla distribuzione posteriore, rappresentata dalla sua densità . Non capisco come il termine "esatto" possa essere associato a . È associato in modo univoco a una distribuzione precedente ed è esattamente derivato dal teorema di Bayes. Ma non restituisce inferenza esatta in quanto la stima puntuale non è il vero valore del parametro e produce dichiarazioni di probabilità esatte solo all'interno del framework fornito dalla coppia prima della probabilità xπ ( θ | D ) π ( θ ) θπ(θ|D)π(θ|D)π(θ)θ. La modifica di un termine nella coppia modifica il posteriore e l'inferenza, mentre non esiste alcun argomento generico per difendere un singolo precedente o probabilità.
  3. Allo stesso modo, altre dichiarazioni di probabilità come "il vero parametro ha una probabilità di 0,95 di cadere in un intervallo credibile del 95%" trovate nella stessa pagina di questa documentazione SAS hanno un significato relativo alla struttura della distribuzione posteriore ma non in valore assoluto.
  4. f(x|θ)=g(x,z|θ)dz
    g(x,z|θ)(X,Z)Zθ(θ,Z), dove l'evoluzione delle popolazioni di un antenato comune comporta eventi latenti su alberi binari. Questo modello può essere gestito da un'inferenza bayesiana [approssimativa] attraverso un algoritmo chiamato ABC, anche se esistono anche risoluzioni software non bayesiane .
  5. Tuttavia, anche in questi casi, non penso che l'inferenza bayesiana sia l'unica soluzione possibile. Le tecniche di apprendimento automatico come reti neurali, foreste casuali, apprendimento profondo, possono essere classificate come metodi frequentisti poiché si allenano su un campione mediante validazione incrociata, riducendo al minimo un errore o un criterio di distanza che può essere visto come un'aspettativa [secondo il vero modello] approssimato da una media campionaria. Ad esempio, il modello coalescente di Kingman può anche essere gestito con risoluzioni software non bayesiane .
  6. h(θ)h(θ^)θ

La risposta è buona fino in fondo. Mi oppongo al punto 5, poiché attribuisce ai metodi ML una prestazione superiore che deve ancora essere giustificata dalla teoria. Cosa significa anche "... vero modello ..."? Senza dubbio, questi metodi sono popolari, ma quella popolarità è in genere giustificata dalla loro capacità di "ridimensionarsi". Sfortunatamente, molte delle intuizioni diagnostiche offerte da metodi bayesiani non ML e da frequentisti vengono perse quando vengono utilizzati tali approcci. In particolare, la convalida incrociata può produrre tassi di errore più elevati rispetto ad altre tecniche Vedi Efron, 1983, 1986, JASA.
Jan Galkowski,

Grazie. In realtà, non conferisco ai metodi ML poteri "superiori", ma menziono semplicemente che alcune risposte ML possono essere proposte per modelli complessi. E per "modelli veri" intendo la valutazione delle prestazioni di un metodo ipotizzando (erroneamente) che i dati siano prodotti da detto modello. Quale è un difetto della maggior parte delle analisi statistiche imo.
Xi'an,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.