Dovresti prima conoscere i modelli di spazio degli stati più facili da codificare e il filtro a forma chiusa (ad es. Filtri kalman, modelli markov nascosti). Matthew Gunn ha ragione sul fatto che puoi arrivare sorprendentemente lontano con concetti semplici, ma a mio modesto parere, dovresti renderlo un obiettivo intermedio perché:
1.) Relativamente parlando, ci sono più parti mobili nei modelli dello spazio degli stati. Quando apprendi SSM o modelli markov nascosti, c'è molta notazione. Ciò significa che ci sono più cose da tenere nella memoria di lavoro mentre giochi con la verifica delle cose. Personalmente, quando stavo imparando prima i filtri Kalman e gli SSM lineari gaussiani, in pratica pensavo "eh, sono solo proprietà dei vettori normali multivariati ... Devo solo tenere traccia di quale matrice è quale". Inoltre, se passi da un libro all'altro, cambiano spesso notazione.
Successivamente ci ho pensato come "eh, questa è solo la regola di Bayes in ogni momento". Una volta che ci pensi in questo modo capisci perché le famiglie coniugate sono carine, come nel caso del filtro Kalman. Quando codifichi un modello markov nascosto, con il suo spazio di stato discreto, vedi perché non devi calcolare alcuna probabilità e il filtraggio / smoothing è facile. (Penso che sto deviando dal gergo hmm conventuale qui.)
2.) Tagliare i denti sulla codifica di molti di questi ti farà capire quanto sia generale la definizione di un modello di spazio degli stati. Molto presto annoti i modelli che vuoi usare e allo stesso tempo vedrai perché non puoi. Per prima cosa vedrai che non puoi scriverlo in una di queste due forme a cui sei abituato. Quando ci pensi un po 'di più, scrivi la regola di Bayes e vedi che il problema è la tua incapacità di calcolare una sorta di probabilità per i dati.
Quindi alla fine non riuscirai a calcolare queste distribuzioni posteriori (livellando o filtrando le distribuzioni degli stati). Per occuparsene, ci sono un sacco di roba di filtro approssimativa là fuori. Il filtro antiparticolato è solo uno di questi. Il principale takeaway del filtraggio delle particelle: simuli da queste distribuzioni perché non puoi calcolarle.
Come si simula? La maggior parte degli algoritmi sono solo alcune varianti del campionamento di importanza. Ma diventa anche più complicato qui. Raccomando quel tutorial di Doucet e Johansen ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ). Se vedi come funziona il filtro a forma chiusa, introducono l'idea generale del campionamento per importanza, quindi l'idea generale del metodo monte carlo e poi ti mostrano come utilizzare queste due cose per iniziare con un esempio di serie temporali finanziarie. IMHO, questo è il miglior tutorial sul filtro antiparticolato che ho incontrato.
Oltre ad aggiungere due nuove idee al mix (campionamento di importanza e metodo monte carlo), ora c'è più notazione. Alcune densità da cui stai campionando da ora; alcuni stai valutando e quando li valuti, stai valutando a campioni. Il risultato, dopo aver codificato tutto, sono campioni ponderati, considerati particelle. Cambiano dopo ogni nuova osservazione. Sarebbe molto difficile raccogliere tutto in una volta. Penso che sia un processo.
Mi scuso se mi trovo criptico o handwavy. Questa è solo la cronologia della mia personale familiarità con l'argomento. Il post di Matthew Gunn probabilmente risponde più direttamente alla tua domanda. Ho appena pensato che avrei lanciato questa risposta.