Sto cercando di "abbinare" piccole patch quadrate in un'immagine. A prima vista, sembra ragionevole fare semplicemente un confronto euclideo dello stile a distanza di due di questi array per ottenere una misura di "somiglianza". Funziona bene in molti casi (la patch "migliore" (valore più basso) secondo questa metrica assomiglia molto alla patch di query). Tuttavia, ci sono molti casi in cui questo produce una corrispondenza molto negativa. Ad esempio, prendi queste due coppie di patch:
Due patch di un muro di mattoni, punteggio 134 (questa è la somma dei componenti della differenza media assoluta di pixel):
Una patch di un muro di mattoni, una patch di erba, segna 123!
Per un essere umano, "chiaramente" l'erba non corrisponde al mattone, ma questa metrica dice il contrario. Il problema è proprio nella variazione statistica locale.
Se uso qualcosa come un confronto di un istogramma, perdo completamente tutte le informazioni spaziali, ad esempio se una patch è erba nella parte superiore e mattone nella parte inferiore, corrisponderebbe esattamente a una patch con erba nella parte inferiore e mattone nella parte superiore (di nuovo , un'altra partita "ovviamente sbagliata").
Esiste una metrica che in qualche modo combina entrambe queste idee in un valore ragionevole che valuterà "simile" per la coppia 1 sopra, ma non sarà simile per il mio esempio di patch e il suo specchio verticale?
Tutti i suggerimenti sono apprezzati!