Sto cercando di imparare l'apprendimento per rinforzo e questo argomento mi confonde davvero. Ho preso un'introduzione alle statistiche, ma non riuscivo a capire questo argomento in modo intuitivo.
Sto cercando di imparare l'apprendimento per rinforzo e questo argomento mi confonde davvero. Ho preso un'introduzione alle statistiche, ma non riuscivo a capire questo argomento in modo intuitivo.
Risposte:
Il campionamento dell'importanza è una forma di campionamento da una distribuzione diversa dalla distribuzione degli interessi in modo da ottenere più facilmente stime migliori di un parametro dalla distribuzione degli interessi. In genere, ciò fornirà stime del parametro con una varianza inferiore rispetto a quella che si otterrebbe campionando direttamente dalla distribuzione originale con le stesse dimensioni del campione.
È applicato in vari contesti. In generale, il campionamento dalla diversa distribuzione consente di prelevare più campioni in una porzione della distribuzione di interesse dettata dall'applicazione (regione importante).
Un esempio potrebbe essere quello di voler avere un campione che includa più campioni dalle code della distribuzione di quanti ne fornirebbe un puro campionamento casuale dalla distribuzione degli interessi.
L' articolo di Wikipedia che ho visto su questo argomento è troppo astratto. È meglio guardare vari esempi specifici. Tuttavia include collegamenti ad applicazioni interessanti come le reti bayesiane.
Un esempio di campionamento di importanza negli anni '40 e '50 è una tecnica di riduzione della varianza (una forma del metodo Monte Carlo). Vedi ad esempio il libro Monte Carlo Methods di Hammersley e Handscomb pubblicato come Monografia / Chapman and Hall di Methuen nel 1964 e ristampato nel 1966 e successivamente da altri editori. La sezione 5.4 del libro tratta il campionamento dell'importanza.
Il campionamento dell'importanza è una simulazione o metodo Monte Carlo inteso per l'approssimazione di integrali. Il termine "campionamento" è alquanto confuso in quanto non intende fornire campioni da una determinata distribuzione.
L'intuizione alla base del campionamento per importanza è che un integrale ben definito, come può essere espresso come aspettativa per una vasta gamma di distribuzioni di probabilità: I = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Una volta compresa questa proprietà elementare, l'implementazione dell'idea è quella di fare affidamento sulla Legge dei Grandi Numeri come in altri metodi Monte Carlo, vale a dire simulare [tramite un generatore pseudo-casuale] un campione iid distribuiti da f e usare il ravvicinamento I = 1quale
A seconda della scelta della distribuzione , sopra stimatore che può o non può avere una varianza finita. Tuttavia, esistono sempre scelte di f che consentono una varianza finita e persino una varianza arbitrariamente piccola (sebbene tali scelte possano non essere disponibili nella pratica). E esistono anche scelte di f che rendono il campionamento importanza stimatore ho un pessimo ravvicinamento delle io . Ciò include tutte le scelte in cui la varianza diventa infinita, anche se un recente articolo di Chatterjee e Diaconis studia come confrontare i campionatori di importanza con la varianza infinita. L'immagine qui sotto è presa dail mio blog la discussione della carta e illustra la scarsa convergenza di stimatori di varianza infinite.
Campionamento dell'importanza con distribuzione di importanza una distribuzione target di distribuzione Exp (1) una distribuzione Exp (1/10) e funzione di interesse . Il vero valore dell'integrale è 10 .
[Quanto segue è riprodotto dal nostro libro Metodi statistici Monte Carlo .]
Compared with , the reduction in variance brought by is of order , which implies, in particular, that this evaluation requires times fewer simulations than to achieve the same precision.