Come distribuire in modo ottimale i disegni quando si calcolano più aspettative


9

Supponiamo di voler calcolare alcune aspettative:

EYEX|Y[f(X,Y)]

Supponiamo di voler approssimare questo usando la simulazione Monte Carlo.

EYEX|Y[f(X,Y)]1RSr=1Rs=1Sf(xr,s,yr)

Ma supponiamo che è costoso per prelevare dei campioni da entrambe le distribuzioni, in modo che abbiamo solo permetterci di disegnare un numero fisso . K

Come dovremmo allocare ? Gli esempi includono pareggi per ogni distribuzione, o all'estremo, un pareggio in esterno e disegna in interno, viceversa ecc .....K / 2 K - 1KK/2K1

La mia intuizione mi dice che avrà a che fare con la varianza / entropia delle distribuzioni l'una rispetto all'altra. Supponiamo che quello esterno è un punto di massa, allora la divisione di che minimizza l'errore MC sarebbe disegnare 1 della e disegnare del . Y K - 1 X | YKYK1X|Y

Spero che sia stato chiaro.


Risolto il problema per te
Wolfsatthedoor,

1
Il "viceversa" e il tuo commento alla risposta di @ Xi'ans sembrano indicare che consideri possibile disegnare la variabile esterna più volte della variabile interna, ma come potrebbe avere senso - non sono tutti esterni per cui gli interiori vengono sprecati? 0
Juho Kokkala,

Abbastanza giusto, almeno un pareggio per esterno immagino. Oppure potresti pensare di programmarlo per salvare il sorteggio suppongo
wolfsatthedoor

1
@robertevansanders Conferma se l'interpretazione della tua domanda nelle prime due frasi della risposta di Xi'an è corretta
Juho Kokkala,

Come hai detto, sì, ma cambia y e x
wolfsatthedoor il

Risposte:


4

Questa è una domanda molto interessante con poca documentazione nella letteratura di Monte Carlo, tranne in relazione alla stratificazione e alla Rao-Blackwellisation . Ciò è probabilmente dovuto al fatto che i calcoli della varianza condizionale attesa e della varianza dell'aspettativa condizionale sono raramente fattibili.

Innanzitutto, supponiamo che tu esegua simulazioni da , e per ogni simulato , esegui simulazioni da , . La vostra stima Monte Carlo è quindi La la varianza di questa stima è scomposta come segue π X x 1 , , x R x r S π Y | X = x r y 1 r , , y s r δ ( R , S ) = 1RπXx1,,xRxrSπY|X=xry1r,,ysr var { δ ( R , S ) }

δ(R,S)=1RSr=1Rs=1Sf(xr,yrs)
R=KS=1K=RSxr
var{δ(R,S)}=1R2S2Rvar{s=1Sf(xr,yrs)}=1RS2varXEY|X{s=1Sf(xr,yrs)|xr}+1RS2EXvarY|X{s=1Sf(xr,yrs)|xr}=1RS2varX{SEY|X[f(xr,Y)|xr]}+1RS2EX[SvarY|X{f(xr,Y)|xr}]=1RvarX{EY|X[f(xr,Y)|xr]}+1RSEX[varY|X{f(xr,Y)|xr}]=K=RS1RvarX{EY|X[f(xr,Y)|xr]}+1KEX[varY|X{f(xr,Y)|xr}]
Pertanto, se si desidera ridurre al minimo questa varianza, la scelta ottimale èR=K. Implica che . Tranne quando il termine della prima varianza è nullo, nel qual caso non ha importanza. Tuttavia, come discusso nei commenti, l'ipotesi non è realistica in quanto non tiene conto della produzione di un [o presuppone che ciò gratuitamente].S=1K=RSxr

Ora supponiamo diversi costi di simulazione e il vincolo di bilancio , il che significa che il 's costo volte di più per simulare quello ' s. La suddetta decomposizione della varianza è quindi che può essere ridotto a icona in come [il numero intero più vicino sotto i vincoli e ], tranne quando la prima varianza è uguale a zero, nel qual casoy r s a x r 1R+aRS=byrsaxrRR=b/1+{aEX[varY| X{f(xr,Y)| xr}/varX

1RvarX{EY|X[f(xr,Y)|xr]}+1R(bR)/aREX[varY|X{f(xr,Y)|xr}]
R R 1 S 1 R = 1 E X [ var Y | X { f ( x r , Y ) | x r } ] = 0 R S = 1
R=b/1+{aEX[varY|X{f(xr,Y)|xr}/varX{EY|X[f(xr,Y)|xr]}}1/2
R1S1R=1 . Quando , la varianza minima corrisponde a una massima , che porta a nell'attuale formalismo.EX[varY|X{f(xr,Y)|xr}]=0RS=1

Si noti inoltre che questa soluzione deve essere confrontata con la soluzione simmetrica quando l'integrale interno è in dato e l'integrale esterno è contro la marginale (assumendo che le simulazioni sono possibili anche in questo ordine).Y YXYY

Un'interessante estensione della domanda sarebbe quella di considerare un diverso numero di simulazioni per ogni simulato , a seconda del valore .S(xr)xrvarY|X{f(xr,Y)|xr}


2
Nella conclusione finale, sembra che tu stia assumendo ma nell'impostazione della domanda poiché si presume che vengano conteggiati anche i disegni della variabile esterna. Il risultato qui dice che se il campionamento della variabile esterna fosse libero, ovviamente si dovrebbe campionare un nuovo esterno per ogni interno. (Inoltre, il ruolo di ed sono commutati qui rispetto alla domanda, ma che ovviamente non importa). K=RSK=RS+Rxy
Juho Kokkala,

2
Sì, ma possiamo decidere il valore di ... Considera l'impostazione degenerata in cui la var esterna è costante. È meglio campionare la costante una volta e volte, piuttosto che la costante volte e volte (che è ciò che implicherebbe)? O sto completamente fraintendendo la domanda? (Ho letto solo ora la seconda frase del tuo commento - non è il presupposto dichiarato nella domanda che hanno lo stesso costo)RXY K1K/2Y K/2S=1
Juho Kokkala,

@ Xi'an sì Calcutta è corretta, la tua soluzione non può generalmente essere valida. Supponiamo ora che la variabile interna abbia una distribuzione degenerata e che l'esterno abbia una varianza significativa, quindi vorresti campionare il minor numero possibile di disegni interni
wolfsatthedoor

Penso che la tua risposta non possa essere giusta. Supponiamo che la distribuzione interna sia degenerata e che l'esterno presenti una grande varianza, come può essere S 1
wolfsatthedoor

@robertevansanders: se la distribuzione interna è degenerata, , quindi e selezioniamo il numero intero più vicino sotto i vincoli e , che significa prendere per rendere più vicino possibile a . R = b R S 1 R ( 1 + a S ) b S = 1 R bvarY|X{f(xr,Y)|xr}=0R=bRS1R(1+aS)bS=1Rb
Xi'an,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.