Integrazione Monte Carlo per funzioni integrabili non quadrate


9

Spero che questo sia il posto giusto per chiedere, se non sentitevi liberi di spostarlo in un forum più appropriato.

Mi sto chiedendo da un po 'di tempo come trattare le funzioni integrabili non quadrate con Monte Carlo Integration. So che MC fornisce ancora una stima corretta, ma l'errore è irraggiungibile (divergente?) Per quel tipo di funzioni.

Limitiamoci a una dimensione. L'integrazione di Monte Carlo significa che approssimiamo l'integrale

I=01dxf(x)

usando il preventivo

E=1Ni=1Nf(xi)

con punti casuali distribuiti uniformemente. La legge dei grandi numeri fa in modo che . La varianza del campioneE Ixi[0,1]EI

S2=1N1i=1N(f(xi)E)2

approssima la varianza della distribuzione indotta da . Tuttavia, se non è integrabile al quadrato, ovvero l'integrale della funzione quadrata diverge, ciò implica f fσ2ff

σ2=01dx(f(x)I)2=01dxf2(x)I2

nel senso che anche la varianza diverge.

Un semplice esempio è la funzione

f(x)=1x

per cui e .σ2=10dxI=01dx1x=2σ2=01dx(1x2)=[lnx2x]01

Se è finito, si può approssimare l'errore della media di , ma cosa succede se non è integrabile al quadrato? E Sσ2E f(x)SNσNf(x)


1
Non capisco: si inizia notando che nessuna ha una varianza e poi si chiede se la varianza della loro media sarebbe una stima ragionevole di quella varianza inesistente! Oppure ho letto male questa domanda: forse con "stime statisticamente indipendenti" hai in mente uno stimatore diverso (forse robusto) dell'integrale? Ei
whuber

Non ho detto che non ha una varianza, solo che non posso definirne una varianza per . Quindi la domanda è se posso definire un errore a tutti e se è un candidato ragionevole. Per statisticamente indipendente intendo che gli sono ottenuti usando numeri casuali diversi, ad es. Usando generatori di numeri casuali con seme diverso (spero che sia il termine giusto allora). S 2 ˉ S 2 E iES2S¯2Ei
cschwan,

Spiega cosa intendi non potendo "definire una varianza per esso con ". Non riesco a dare un senso a questo utilizzando le definizioni standard di varianza e . S 2S2S2
whuber

Bene, la funzione non è integrabile al quadrato quindi, se non sbaglio, dovrebbe divergere . In questo caso, la definizione di non ha senso in primo luogo, giusto? Tramite il teorema del limite centrale, tuttavia, convergerà comunque al vero valore dell'integrale, ma senza un errore questo valore da solo non ha senso (quanto "buono" è questo risultato?). S 2 ES2S2E
cschwan,

Scusate, volevo dire "legge dei grandi numeri" ovviamente, non CLT.
cschwan,

Risposte:


2

Potresti semplicemente usare altre misure di scala / dispersione come l'intervallo interquantile, che non sono influenzate dagli asintotici della coda e quindi integrabilità quadrata. Con l'ulteriore vantaggio che spesso sono generalmente più robusti comunque.

Ovviamente è necessario applicarli a un ricampionamento / bootstrap seguito dallo stimatore medio, non direttamente solo all'output non elaborato dal campionamento MC della funzione prima della media. Puoi anche controllare in L stimatori L generali e adattare uno di essi per unire questi due passaggi in uno per prestazioni, ma mentalmente le due distribuzioni non devono essere confuse, anche se lo stimatore PDF erediterà naturalmente alcune caratteristiche (inclusa forse la mancanza di quadrati integrabilità).


+1, dovrei aggiungere che la legge dei grandi numeri non richiede secondi istanti, quindi questo è un consiglio perfettamente valido.
mpiktas,

Grazie per la tua risposta! Devo ammettere che ho letto quei termini per la prima volta, ma osservandoli in WP penso che la tua risposta mi indichi nella giusta direzione. Potresti tu o qualcun altro suggerire alcuni articoli o libri che spiegano gli argomenti in modo più dettagliato?
cschwan,

Adesso noto che forse la mia risposta non è chiara. Dato che stai simulando non hai davvero bisogno di ricampionamento / bootstrap, in teoria potresti semplicemente aggiungere ulteriori nuovi campioni e ottenere una distribuzione empirica per lo stimatore medio. Solo se le risorse sono un problema, puoi precalcolare le medie parziali e ricampionarle, ma le statistiche non saranno banali se ben fatte. Non sono un esperto di boostrap, quindi lascerò consigli su questo ad altri, volevo solo indicarlo se hai bisogno di andare oltre la semplice formulazione. Concentrati prima sulle misure di dispersione, ottimizza in seguito.
Quarzo,

Lo stimatore medio proposto non presenta una varianza finita. Non importa se si aggiungono ulteriori campioni, la distribuzione empirica dello stimatore avrà anche una varianza non finita. Puoi confermarlo con alcune simulazioni.
rajb245,

1
Certo, in effetti è quello che si stava discutendo e il motivo per cui si dovrebbe usare un'altra misura di dispersione.
Quarzo,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.