Domanda: con una catena MCMC a 10 dimensioni, diciamo che sono pronto a consegnarti una matrice dei disegni: 100.000 iterazioni (righe) per 10 parametri (colonne), come posso identificare al meglio le modalità posteriori? Mi occupo soprattutto di più modalità.
Sfondo:Mi considero uno statistico esperto di calcolo, ma quando un collega mi ha fatto questa domanda, mi vergognavo di non poter trovare una risposta ragionevole. La preoccupazione principale è che possano comparire più modalità, ma solo se si considerano almeno otto delle dieci dimensioni. Il mio primo pensiero sarebbe quello di utilizzare una stima della densità del kernel, ma una ricerca attraverso R non ha rivelato nulla di promettente per problemi di dimensioni superiori a tre dimensioni. Il collega ha proposto una strategia di binning ad hoc in dieci dimensioni e alla ricerca di un massimo, ma la mia preoccupazione è che la larghezza di banda potrebbe portare a significativi problemi di scarsità o alla mancanza di risoluzione per discernere più modalità. Detto questo, accetterei volentieri suggerimenti per suggerimenti di larghezza di banda automatizzata, collegamenti a uno stimatore della densità del kernel 10 o qualsiasi altra cosa tu sappia.
preoccupazioni:
Riteniamo che la distribuzione possa essere piuttosto distorta; pertanto, desideriamo identificare le modalità posteriori e non i mezzi posteriori.
Siamo preoccupati che possano esserci diverse modalità posteriori.
Se possibile, preferiremmo un suggerimento basato su R. Ma qualsiasi algoritmo funzionerà finché non sarà incredibilmente difficile da implementare. Immagino che preferirei non implementare uno stimatore di densità del kernel Nd con selezione automatica della larghezza di banda da zero.