Misura della dimensione dell'oggetto usando la rete neurale profonda


10

Ho un ampio set di dati di veicoli con la verità a terra delle loro lunghezze (oltre 100.000 campioni). È possibile formare una rete profonda per misurare / stimare la lunghezza del veicolo? Non ho visto alcun documento relativo alla stima delle dimensioni degli oggetti usando una rete neurale profonda.


1
Ottima domanda Benvenuto in AI!
DukeZhou

(Nota per il moderatore): questa è una risposta segnaposto per porre una domanda a OP poiché non posso commentare I tuoi dati sono immagini o testo? hisairnessag3 è sulla buona strada con il porting dell'approccio pixel / metrico da OpenCV a un DNN di rilevamento oggetti
Adnan S

Risposte:


4

Sì! Questo sicuramente può essere fatto. Dal momento che hai un set di dati etichettato, questo rende tutto ancora più semplice!

Darei un'occhiata a questo progetto e questo dovrebbe portarti dove devi andare.

I dettagli di implementazione dovrebbero essere piuttosto semplici. Fammi sapere se posso aiutare ulteriormente.


1
Non è necessario spiegare perché qualcuno vota male. Molti programmatori non hanno abbastanza tempo per guardare i commenti, guardano i voti per vedere se la risposta vale o no. Se rileggi nuovamente la domanda, scoprirai che la domanda riguarda specificamente l'utilizzo di DNN e non altro. il progetto che hai condiviso riguarda l'utilizzo di Opencv ... se leggi i commenti sotto il post che hai condiviso, scoprirai che le persone chiedono di DNN, ma il post stesso non usa DNN. A proposito, io non sono la persona che ha votato in giù la tua risposta
BH85,

2
Non è necessario ma è utile. Se cerchi in profondità, non troverai progetti o documenti su questo particolare caso d'uso per i DNN. Detto questo, ho fatto riferimento al progetto più vicino possibile nella speranza di avviare l'OP. Inoltre, ho risposto alla domanda. La domanda era: questo può essere fatto.
hisairnessag3

Grazie per la tua risposta! Penso che sarebbe migliorato da una piccola spiegazione di come / perché sia ​​possibile. Almeno uno schema dell'architettura sarebbe molto utile.
Ben N

1

Sì, è possibile, ma prima devi riconoscere un oggetto nell'immagine, 1) il veicolo stesso, quindi segnalare la dimensione nota di quel veicolo o 2) un oggetto noto che è alla stessa distanza dalla telecamera dell'auto ( un marciapiede, un segnale di stop, la testa del conducente, un pony shetland ... qualunque cosa), e quindi utilizzare quell'oggetto per calibrare le dimensioni dell'auto che è molto vicino ad esso.

Qualsiasi auto in un'immagine avrà una distanza sconosciuta dalla fotocamera, facendo apparire l'oggetto auto più grande o più piccolo da una foto all'altra. Se non riconosci l'auto o almeno un oggetto referente che ha una dimensione nota, la dimensione fisica dell'auto non sarà calibrata - non avrai basi per la tua stima delle dimensioni.

Se l'auto è sconosciuta, quindi anche se si dispone di indizi visivi (è presente un oggetto referente o è nota la distanza dalla fotocamera all'auto), l'entità sconosciuta del grandangolo dell'obiettivo della fotocamera potrebbe distorcere la forma di un'auto sconosciuta (altezza vs larghezza), complicando ulteriormente la tua capacità di stimare le sue dimensioni apparenti.


La targa del veicolo può essere quell'oggetto noto utilizzato per calibrare le dimensioni dell'auto? Le targhe hanno in genere le stesse dimensioni.
Naji,

1
Dovresti stare attento alle ipotesi che fai che le targhe abbiano le stesse dimensioni. Ad esempio, un piatto australiano e un piatto americano sono di dimensioni diverse. Se questo non è un problema per la tua applicazione (funzionerà sempre e solo in un paese), potresti assumere una dimensione di riferimento per la piastra. Dovresti comunque stare attento, perché la piastra potrebbe non essere orientata normalmente verso di te. Se l'auto è a 45 gradi, la larghezza della piastra occuperà meno pixel rispetto a 0, anche alla stessa distanza.
pshlady,

1

Penso che questo documento ti possa aiutare: stima del riquadro di delimitazione 3D utilizzando l'apprendimento profondo e la geometria

Ha usato 1 VGG-19 (preinstallato su ImageNet) per apprendere le dimensioni delle auto


Come te, ho pensato che si trattasse di inferire un rettangolo di selezione 3D in cui i dati sono rappresentati in un'immagine 2D. Il progetto citato da hisairnessag3 sembra riguardare solo il riquadro di delimitazione 2D senza alcun comportamento inferenziale appreso sulla natura 3D che l'immagine potrebbe contenere.
Jim

Questo documento stima le dimensioni e l'orientamento dell'auto utilizzando un'immagine ritagliata 2D (contiene solo l'oggetto desiderato).
cryax dsa
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.