Sono stato inviato qui da questa domanda in StackOverflow , mi scusi se la domanda è troppo specifica e non è nelle buone maniere qui :)
Il compito è quello di trovare un bicchiere con liquido specifico al suo interno. Lascia che ti mostri le immagini e poi descriva ciò che sto cercando di ottenere e come stavo cercando di ottenere finora nella descrizione sotto le immagini.
Le foto : (sembra che io abbia bisogno di almeno 10 reputazione per pubblicare foto e collegamenti, quindi i collegamenti dovranno fare :( altrimenti puoi guardare la domanda di overflow dello stack)
Una descrizione dettagliata : stavo cercando di implementare un algoritmo in grado di rilevare un vetro di una forma specifica in opencv (il vetro potrebbe essere trasformato da un diverso angolo / distanza di ripresa della telecamera). Ci saranno anche altri bicchieri di altre forme. Il vetro che sto cercando sarà anche riempito con un po 'di liquido colorato che lo distinguerà dai vetri che contengono altri colori.
Finora, ho provato a utilizzare l'estrattore di funzioni SIFT per cercare di trovare alcune funzionalità nel bicchiere e quindi abbinarle ad altre foto con il vetro al suo interno.
Questo approccio ha funzionato solo in condizioni molto specifiche in cui avrei avuto il vetro in una posizione molto specifica e lo sfondo sarebbe simile alle immagini di apprendimento. Il problema è anche che il vetro è un oggetto 3d e non so come estrarne le caratteristiche (forse più foto da diverse angolazioni collegate in qualche modo?).
Ora non so quale altro approccio potrei usare. Ho trovato alcuni indizi su questo (qui /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ) ma i collegamenti sembrano essere rotti.
Un altro problema sarebbe quello di rilevare diversi "livelli di vuoto" in tale vetro, ma non sono nemmeno riuscito a trovare il vetro stesso correttamente.
Quali sarebbero i tuoi consigli sull'approccio in questo compito? Sarebbe meglio usare un modo diverso per trovare la funzione locale di oggetti 3d? O sarebbe meglio usare un altro approccio del tutto? Ho sentito parlare di algoritmi che "apprendono" l'oggetto da una serie di più foto, ma in pratica non l'ho mai visto.
Qualsiasi consiglio sarebbe molto apprezzato