Sto provando a implementare un algoritmo in cui data un'immagine con diversi oggetti su una tabella piana, desiderato è l'output di maschere di segmentazione per ogni oggetto. A differenza della CNN, l'obiettivo qui è quello di rilevare oggetti in un ambiente sconosciuto. Quali sono gli approcci migliori a questo problema? Inoltre, ci sono esempi di implementazione disponibili online?
Modifica: mi dispiace, la domanda potrebbe essere stata un po 'fuorviante. Quello che intendevo per "ambiente non familiare" è che gli oggetti potrebbero essere sconosciuti all'algoritmo. L'algoritmo non dovrebbe aver bisogno di capire quale sia l'oggetto, ma dovrebbe solo rilevare l'oggetto. Come dovrei affrontare questo problema?