Dimensione effettiva del campione per l'inferenza posteriore dal campionamento MCMC


13

Quando si ottengono campioni MCMC per fare deduzione su un particolare parametro, quali sono le buone guide per il numero minimo di campioni efficaci a cui si dovrebbe puntare?

E questo consiglio cambia man mano che il modello diventa più o meno complesso?


La mia ipotesi è che probabilmente dipenderà dalla "costante" in errore, che varia tra i modelli. O(n12)
probabilityislogic

Risposte:


15

La domanda che stai ponendo è diversa dalla "diagnostica di convergenza". Diciamo che hai eseguito tutta la diagnostica di convergenza (scegli i tuoi preferiti) e ora sei pronto per iniziare il campionamento dal posteriore.

Esistono due opzioni in termini di dimensioni effettive del campione (ESS), è possibile scegliere un ESS univariato o un ESS multivariato. Un ESS univariato fornirà una dimensione del campione efficace per ciascun parametro separatamente e, secondo i metodi conservativi, scegli la stima più piccola. Questo metodo ignora tutte le correlazioni incrociate tra i componenti. Questo è probabilmente ciò che la maggior parte delle persone usa da un po 'di tempo

Di recente è stata introdotta una definizione multivariata di ESS. L'ESS multivariato restituisce un numero per la dimensione effettiva del campione per le quantità che si desidera stimare; e lo fa tenendo conto di tutte le correlazioni incrociate nel processo. Personalmente preferisco di gran lunga l'ESS multivariato. Supponiamo che tu sia interessato al vettore dei mezzi della distribuzione posteriore. Il mESS è definito come segue mESS = n ( | Λ |p Qui

mESS=n(|Λ||Σ|)1/p.
  1. è la struttura della covarianza del posteriore (anche la covarianza asintotica nel CLT se si avessero campioni indipendenti)Λ
  2. è la matrice di covarianza asintotica nella catena Markov CLT (diversa da Λ poiché i campioni sono correlati.ΣΛ
  3. è il numero di quantità stimate (o in questo caso, la dimensione del posteriore.p
  4. è il determinante.||

mESS può essere stimato usando la matrice di covarianza del campione per stimare e il lotto significa matrice di covarianza per stimare Σ . Questo è stato codificato nella funzione nel pacchetto R mcmcse .ΛΣmultiESS

Questo recente documento fornisce un limite inferiore teoricamente valido del numero di campioni effettivi richiesti. Prima della simulazione, devi decidere

  1. ϵϵ
  2. α
  3. p

mESS22/pπ(pΓ(p/2))2/pχ1α,p2ϵ2,

Γ()minESS

p=2095%ϵ=.05

> minESS(p = 20, alpha = .05, eps = .05)
[1] 8716

Questo è vero per qualsiasi problema (in condizioni di regolarità). Il modo in cui questo metodo si adatta da un problema all'altro è che mescolare lentamente le catene di Markov impiega più tempo a raggiungere quel limite inferiore, poiché MESS sarà più piccolo. Quindi ora puoi controllare un paio di volte usando multiESSse la tua catena Markov ha raggiunto quel limite; in caso contrario vai a prendere altri campioni.


(+1) Risposta eccellente. Sai se la funzione multiESSè stata codificata per altre lingue, come MATLAB? (o sarebbe difficile reimplementarlo?)
lacerbi

1
Σ

1
Σ

1
@lacerbi Sono contento che tu sia riuscito a codificarlo in Matlab. Se possibile, rispondi a questo commento quando è attivo, così posso utilizzarlo. Grazie
Greenparker,

1
La mia implementazione MATLAB di multiESS è disponibile qui . È una versione funzionante anche se avrebbe bisogno di ulteriori test (non ho familiarità con R, altrimenti lo confronterei con l'implementazione di R).
Lacerbi,

2

La convergenza dipende da diverse cose: il numero di parametri, il modello stesso, l'algoritmo di campionamento, i dati ...

Suggerirei di evitare qualsiasi regola generale e di utilizzare un paio di strumenti diagnostici di convergenza per rilevare il burn-in appropriato e il numero di assottigliamento delle iterazioni in ciascun esempio specifico. Vedi anche http://www.johnmyleswhite.com/notebook/2010/08/29/mcmc-diagnostics-in-r-with-the-coda-package/, http://users.stat.umn.edu/~geyer/mcmc/diag.html.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.