Ho letto molti articoli su, Rilevazione di oggetti, Riconoscimento di oggetti, Segmentazione di oggetti, Segmentazione di immagini e Segmentazione di immagini semantiche ed ecco le mie conclusioni che potrebbero non essere vere:
Riconoscimento oggetti: in una data immagine devi rilevare tutti gli oggetti (una classe ristretta di oggetti dipende dal tuo set di dati), localizzarli con un rettangolo di selezione ed etichettare quel rettangolo di selezione con un'etichetta. Nell'immagine seguente vedrai un semplice output di un riconoscimento di oggetti all'avanguardia.
Rilevamento di oggetti: è come il riconoscimento di oggetti ma in questa attività hai solo due classi di classificazione degli oggetti che significa scatole di delimitazione di oggetti e scatole di delimitazione di non oggetti. Ad esempio Rilevamento auto: devi rilevare tutte le auto in una determinata immagine con i loro riquadri di selezione.
Segmentazione degli oggetti: come il riconoscimento degli oggetti, riconoscerai tutti gli oggetti in un'immagine ma il tuo output dovrebbe mostrare questo oggetto che classifica i pixel dell'immagine.
Segmentazione dell'immagine: nella segmentazione dell'immagine segmenterai le regioni dell'immagine. l'output non etichetterà i segmenti e l'area di un'immagine che devono essere coerenti tra loro nello stesso segmento. L'estrazione di super pixel da un'immagine è un esempio di questa attività o segmentazione in primo piano.
Segmentazione semantica: nella segmentazione semantica devi etichettare ogni pixel con una classe di oggetti (Macchina, Persona, Cane, ...) e non oggetti (Acqua, Cielo, Strada, ...). Altre parole in Segmentazione semantica etichetterai ogni regione dell'immagine.