Risultati delle stime di Monte Carlo prodotte dal campionamento per importanza


13

Ho lavorato su campionamenti importanti abbastanza da vicino nell'ultimo anno e ho alcune domande aperte con le quali speravo di ottenere un aiuto.

La mia esperienza pratica con importanti schemi di campionamento è stata che occasionalmente possono produrre fantastiche stime a bassa varianza e a bassa propensione. Più frequentemente, tuttavia, tendono a produrre stime ad alto errore che presentano una varianza del campione bassa ma una distorsione molto elevata.

Mi chiedo se qualcuno può spiegare esattamente quali tipi di fattori influenzano la validità delle stime di campionamento di importanza? In particolare, mi chiedo:

1) Le stime di campionamento di importanza sono garantite per convergere al risultato corretto quando la distribuzione di differenziazione ha lo stesso supporto della distribuzione originale? Se è così, perché questo sembra richiedere così tanto tempo in pratica?

2) Esiste una relazione quantificabile tra l'errore in una stima prodotta attraverso il campionamento per importanza e la "qualità" della distribuzione di differenziazione (ovvero quanto corrisponde alla distribuzione a varianza zero)

3) Parzialmente basato su 1) e 2) - c'è un modo per quantificare "quanto" devi sapere su una distribuzione prima di poter utilizzare un design di campionamento importante piuttosto che un semplice metodo Monte Carlo.

Risposte:


8

Il campionamento dell'importanza ha esattamente la stessa validazione dell'approccio base di Monte Carlo. Al suo centro, è Monte Carlo di base . In effetti, è semplicemente un cambiamento della misura di riferimento, che va da a h ( x ) f ( x )

h(x)f(X)dX
Pertanto la convergenza è garantita dalla legge di grandi numeri in entrambi i casi, ovvero se si simula dafo dag. Inoltre, se il termine h2(x)f2(x)
h(x)f(x)g(x)g(x)dx
fg è finito, si applica anche il teorema limite centrale e la velocità di convergenza èO(1/
h2(x)f2(x)g(x)dx
. Se "impiega così tanto tempo", è perché il fattore di varianza sopra riportato nel CLT può essere abbastanza grande. Ma, e insisto, la velocità è la stessa del normale Monte Carlo,O(1/O(1/n).O(1/n)

La qualità di un'importante distribuzione di campionamento è quindi direttamente correlata al suddetto fattore di varianza, che va a zero per la "distribuzione di varianza zero" proporzionale a .|h(x)|f(x)


2
Ho il sospetto, dato che l'OP sta segnalando stimatori di varianza di piccole dimensioni che sono distorti, ma sembrano avere una varianza di piccole dimensioni, che potrebbe chiedere informazioni sul campionamento di importanza auto-normalizzato. Vedere l'espressione di Radford Neal sullo stimatore della media armonica per un buon esempio, che prende quella che sarebbe una stima campionaria di importanza con 0 varianza e restituisce assurdità. Non sono sicuro che ciò non accada mai nel campionamento di importanza regolare, ma è certamente raro.
dal

Anche se questa non fosse l'intenzione del PO, sarei interessato ad alcuni suggerimenti su come capire quando l'auto-normalizzazione andrà terribilmente storto.
dal

@deinst Non ero a conoscenza della procedura di auto-normalizzazione e delle sue insidie, quindi grazie per questo! In ogni caso, penso che i problemi possano essere rilevanti per le proprietà del mio schema IS, quindi vorrei esplorare ulteriormente questa idea se qualcuno di voi ha idee.
Berk U.

@deinst Lo schema IS che sto usando è progettato per funzionare senza una distribuzione campionaria a portata di mano. Lo schema utilizza innanzitutto una procedura MCMC per simulare punti M x 1 . . x M dalla distribuzione della varianza zero g ( x ) = h . . x M per produrre ^ g ( x ) . Con ^ g ( x ) in mano, posso quindi campionare Ng(x)Mx1..xMg(x)=h(x)f(x)/h(x)f(x)dxx1..xMg(x)^g(x)^Ny1...yN

L'uso di una stima non parametrica introduce la variabilità di un ordine superiore alla variabilità di Monte Carlo, quindi non lo consiglierei.
Xi'an,

7

fg

δ=h(x)f(x)dx
x1,,xng(x)
δ^=Σio=1nh(X)f(X)/g(X)Σio=1nf(X)/g(X).
X/Yω(X)=f(X)/g(X)
Eg(δ^)δ+δVarg(ω(X))-Covg(ω(X),h(X)ω(X))n
Varg(δ^)Varg(h(X)ω(X))2δCovg(ω(X),h(X)ω(X))+δ2Varg(ω(X))n.

Varg(ω(X))Covg(ω(X),h(X)ω(X))


Grazie per questo. Sono solo un po 'incerto sulla notazione / non sono sicuro che ci sia un refuso. Per chiarire, cosa sono esattamenteX/Y e solnella tua spiegazione?
Berk U.

@BerkUstun La G maiuscola è un refuso per un piccolo che risolverò prontamente. X / Y è solo un rapporto generico di variabili casuali. IIRC tutto questo è spiegato nel libro Monte Carlo di Liu (qualcosa di scientifico nel titolo.)
dal

@deinst: ottimo punto! In effetti, le proprietà delle versioni auto-normalizzate sono abbastanza diverse da quelle dello stimatore del campionamento di importanza imparziale. In teoria, sarebbe necessario un campionatore di importanza separato per stimare il denominatore.
Xi'an,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.