Gli algoritmi di apprendimento automatico possono essere utilizzati per distinguere tra piccole differenze nei dettagli tra le immagini?


8

Mi chiedevo se gli algoritmi di machine learning (CNNs?) Possano essere usati / addestrati per distinguere tra piccole differenze nei dettagli tra le immagini (come lievi differenze nelle tonalità del rosso o di altri colori, o la presenza di piccoli oggetti tra immagini altrimenti molto simili? )? E quindi classificare le immagini in base a queste differenze? Se questo è uno sforzo difficile con i nostri attuali algoritmi di machine learning, come può essere risolto? Usare più dati (più immagini) sarebbe di aiuto?

Gradirei anche se le persone potessero per favore fornire riferimenti a ricerche che si sono concentrate su questo, se possibile.

Ho appena iniziato a studiare l'apprendimento automatico, e questo è qualcosa che mi chiedevo dalla mia ricerca.

Risposte:


4

Attentive Recurrent Comparators (2017) di Pranav Shyam et al. è un documento interessante che aiuta a rispondere alla domanda che ti stai chiedendo, insieme a un post sul blog che ti aiuta a descriverlo in termini più semplici.

Il modo in cui è implementato è in realtà piuttosto intuitivo. Se hai mai giocato a un gioco "cosa è diverso" con due immagini, di solito quello che faresti è guardare avanti e indietro tra le immagini per vedere qual è la differenza. La rete creata dai ricercatori fa proprio questo! Guarda un'immagine e poi ricorda le caratteristiche importanti di quelle immagini e guarda l'altra immagine e va avanti e indietro.


2

Esistono reti costruite per imparare a distinguere le classi anche se sembrano quasi uguali. Di solito, in tali reti viene utilizzata una perdita di tripletta per apprendere la differenza tra l'obiettivo, un campione positivo e uno negativo.

Ad esempio, tali reti vengono utilizzate per eseguire il controllo dell'identità con le immagini dei volti, l'algoritmo impara le differenze tra persone diverse invece di riconoscerle.

Ecco alcune parole chiave che potrebbero essere rilevanti: funzione discriminatoria, perdita di tripletta, rete siamese, apprendimento one-shot.

Questi articoli sono interessanti:

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.