Ho lavorato su un progetto per un po 'di tempo, per rilevare e tracciare veicoli in video catturati da UAV, attualmente sto usando un SVM addestrato su rappresentazioni bag-of-feature di funzionalità locali estratte da immagini di veicoli e di sfondo. Sto quindi usando un approccio di rilevamento delle finestre scorrevoli per cercare di localizzare i veicoli nelle immagini, che vorrei quindi tracciare. Il problema è che questo approccio è molto lento e il mio rivelatore non è affidabile come vorrei quindi sto ottenendo parecchi falsi positivi.
Quindi ho pensato di provare a segmentare le auto dallo sfondo per trovare la posizione approssimativa in modo da ridurre lo spazio di ricerca prima di applicare il mio classificatore, ma non sono sicuro di come procedere e speravo che qualcuno potesse aiutare?
Inoltre, ho letto della segmentazione del movimento con i livelli, usando il flusso ottico per segmentare il fotogramma per modello di flusso, qualcuno ha qualche esperienza con questo metodo, se così potessi offrire qualche input per pensare che questo metodo sarebbe applicabile per il mio problema.
AGGIORNAMENTO : ho pubblicato anche questa domanda su overflow dello stack e ho avuto un'ottima risposta , ho già implementato questa idea e funziona sorprendentemente bene e ora sto studiando utilizzando il flusso ottico oltre a questa tecnica.
Di seguito sono riportati due fotogrammi da un video di esempio