Ecco la mia vecchia domanda
Vorrei chiedere se qualcuno conosce la differenza (se c'è qualche differenza) tra i modelli Hidden Markov (HMM) e Particle Filter (PF), e di conseguenza Kalman Filter, o in quali circostanze utilizziamo quale algoritmo. Sono uno studente e devo fare un progetto, ma prima devo capire alcune cose.
Quindi, secondo la bibliografia, entrambi sono modelli dello spazio degli stati , inclusi stati nascosti (o latenti o non osservati). Secondo Wikipedia (Hidden_Markov_model) “in HMM, lo spazio degli stati delle variabili nascoste è discreto, mentre le osservazioni stesse possono essere discrete (in genere generate da una distribuzione categoriale) o continue (in genere da una distribuzione gaussiana). I modelli nascosti di Markov possono anche essere generalizzati per consentire spazi di stato continui. Esempi di tali modelli sono quelli in cui il processo di Markov su variabili nascoste è un sistema dinamico lineare, con una relazione lineare tra variabili correlate e dove tutte le variabili nascoste e osservate seguono una distribuzione gaussiana. In casi semplici, come il sistema dinamico lineare appena menzionato, l'inferenza esatta è tracciabile (in questo caso, usando il filtro Kalman); tuttavia, in generale, l'inferenza esatta negli HMM con variabili latenti continue è impossibile e devono essere utilizzati metodi approssimativi,”
Ma per me questo è un po 'confuso ... In parole semplici significa che segue (basato anche su più ricerche che ho fatto):
- In HMM, lo spazio degli stati può essere discreto o continuo . Anche le osservazioni stesse possono essere discrete o continue . Anche HMM è un sistema dinamico lineare e gaussiano o non gaussiano.
- In PF, lo spazio degli stati può essere discreto o continuo . Anche le osservazioni stesse possono essere discrete o continue . Ma PF è un sistema dinamico non lineare (e non gaussiano?) (È questa la differenza?).
- Il filtro Kalman (anche a me sembra lo stesso dell'HMM) viene utilizzato quando abbiamo un sistema dinamico lineare e gaussiano .
Inoltre, come faccio a sapere quale algoritmo scegliere, perché a me sembrano tutti uguali ... Inoltre ho trovato un documento (non in inglese) che dice che PF sebbene possa avere dati lineari (ad esempio dati grezzi da un sensore-kinect che riconosce un movimento), il sistema dinamico può essere non lineare. Questo può succedere? È corretto? Come?
Per il riconoscimento dei gesti, i ricercatori possono utilizzare HMM o PF, ma non spiegano perché selezionano ciascun algoritmo ... Qualcuno sa come posso essere aiutato a distinguere questi algoritmi, a capire le loro differenze e come scegliere l'algoritmo migliore?
Mi dispiace se la mia domanda è troppo grande o alcune parti sono ingenue ma non ho trovato da qualche parte una risposta convincente e scientifica. Grazie mille in anticipo per il tuo tempo!
Ecco la mia NUOVA domanda (secondo l'aiuto di @ conjugateprior)
Quindi, con ulteriori letture, vorrei aggiornare alcune delle mie parti del mio commento precedente e assicurarmi di aver compreso un po 'di più quello che sta succedendo.
- Ancora una volta in parole semplici, l'ombrello è rappresentato dalle reti bayesiane dinamiche in cui sono inclusi i modelli di HMM e lo spazio degli stati (sottoclassi) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
- Inoltre, la differenza iniziale tra i 2 modelli è che, in HMM, le variabili di stato nascoste sono discrete , mentre le osservazioni possono essere discrete o continue . In PF le variabili di stato nascoste sono continue (vettore di stato nascosto con valori reali) e le osservazioni hanno distribuzioni gaussiane .
- Inoltre, secondo @conjugateprior ogni modello ha i 3 seguenti compiti: filtraggio, livellamento e previsione. Nel filtraggio, il modello HMM utilizza per le variabili di stato nascoste discrete il metodo Algoritmo Forward, lo spazio degli stati utilizza per le variabili continue e il sistema dinamico lineare il filtro Kalman, ecc.
- Tuttavia, HMM può anche essere generalizzato per consentire spazi di stato continui .
- Con queste estensioni di HMM, i 2 modelli sembrano concettualmente identici (come è anche menzionato in Hidden Markov Model vs Markov Transition Model vs State-Space Model ...? ).
Penso che sto usando un po 'più accurata la terminologia, ma comunque tutto mi è sfocato. Qualcuno può spiegarmi qual è la differenza tra il modello HMM e il modello Space State ?
Perché non riesco davvero a trovare una risposta che si adatti alle mie esigenze.
Grazie ancora!