Diagnostica di convergenza di Gelman e Rubin, come generalizzare per lavorare con i vettori?


14

La diagnostica Gelman e Rubin viene utilizzata per verificare la convergenza di più catene mcmc eseguite in parallelo. Confronta la varianza all'interno della catena con la varianza tra le catene, l'esposizione è inferiore:

Passaggi (per ogni parametro):

  1. Eseguire m ≥ 2 catene di lunghezza 2n da valori iniziali sovradispersi.
  2. Scarta le prime n estrazioni in ogni catena.
  3. Calcola la varianza all'interno della catena e tra le catene.
  4. Calcola la varianza stimata del parametro come somma ponderata della varianza all'interno della catena e tra le catene.
  5. Calcola il potenziale fattore di riduzione della scala.
  6. Voce di elenco

Voglio usare questa statistica ma le variabili con cui voglio usarla sono vettori casuali.

Ha senso prendere la media delle matrici di covarianza in questo caso?

Risposte:


17

Un consiglio: basta calcolare il PSRF separatamente per ciascun componente scalare

L'articolo originale di Gelman & Rubin [1], così come la Bayesian Data Analysis libro di testo di Gelman et al. [2], raccomanda di calcolare il fattore di riduzione della scala potenziale (PSRF) separatamente per ciascun parametro scalare di interesse. Per dedurre la convergenza, è quindi necessario che tutti i PSRF siano vicini a 1. Non importa che i parametri siano interpretati come vettori casuali, i loro componenti sono scalari per i quali è possibile calcolare i PSRF.

Brooks & Gelman [3] hanno proposto un'estensione multivariata del PSRF, che esaminerò nella prossima sezione di questa risposta. Tuttavia, per citare Gelman & Shirley [4]:

[...] questi metodi possono talvolta rappresentare un eccesso di capacità: i singoli parametri possono essere ben stimati anche se la convergenza approssimativa delle simulazioni di una distribuzione multivariata può richiedere molto tempo.

Alternativa: estensione multivariata di Brooks & Gelman

Brooks & Gelman [3] propongono un'estensione multivariata del PSRF, dove in effetti si calcola la matrice di covarianza stimata (fase 4) come somma ponderata delle matrici di covarianza all'interno della catena ( ) e tra le catene ( B ) fase 3): V = n - 1WB dovenè la lunghezza della catena. Quindi, si ha la necessità di definire alcuni scalari metrica per la distanza tra la covarianza matrici V ,W. Gli autori propongono R =maxaunaT V un

V^=n1nW+1nB,
nV^,W dovemè il numero di catene, l'uguaglianza è mostrato nell'articolo conλ1è il più grande autovalore positivoW-1 V /n. Poi, gli autori affermano che sotto convergenza delle catene,À10e quindi con grandenquesta multivariata R deve convergere vicino 1.
R^=maxaaTV^aaTWa=n1n+(m+1m)λ1,
mλ1W1V^/nλ10nR^

Riferimenti

[1] Gelman, Andrew e Donald B. Rubin. "Inferenza dalla simulazione iterativa usando sequenze multiple." Statistical Science (1992): 457-472.

[2] Gelman, Andrew, et al. Analisi dei dati bayesiani. CRC press, 2013.

[3] Brooks, Stephen P. e Andrew Gelman. "Metodi generali per il monitoraggio della convergenza di simulazioni iterative." Journal of Computational and Graphical Statistics 7.4 (1998): 434-455.

[4] Gelman, Andrew e Kenneth Shirley. "Inferenza da simulazioni e monitoraggio della convergenza". (Capitolo 6 in Brooks, Steve, et al., Eds. Manuale di Markov Chain Monte Carlo. CRC Press, 2011.)

Tutti gli articoli tranne il libro di testo [2] sono disponibili sul sito Web di Andrew Gelman Sito Web di Andrew Gelman .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.