Non sono sicuro se si desidera solo abbinare due immagini (ad esempio, trovare i punti comuni) o si desidera tentare qualcosa come CBIR (recupero di immagini basato sul contenuto - ricerca in un database con un'immagine modello per trovare tutto ciò che contiene il oggetto).
Attualmente sto facendo ricerche CBIR, quindi sono abbastanza aggiornato con i metodi attuali. Qui e qui ci sono i collegamenti alle mie risposte a problemi simili ai tuoi da StackOverflow, dovresti dare un'occhiata.
Ora, per parlare un po 'di SIFT. Quando è stato introdotto per la prima volta da Lowe, il termine SIFT si applicava sia al processo di rilevamento delle caratteristiche sia ai descrittori delle caratteristiche calcolati su quei punti di interesse rilevati. Fino ad oggi, i descrittori SIFT hanno dimostrato di essere incredibilmente fantastici. I descrittori hanno alcune proprietà interessanti che @Totero ha già menzionato.
D'altro canto, il metodo di rilevamento SIFT , che oggi è sempre più indicato come DoG (Differenza di gaussiani), non è più all'avanguardia. È ancora ampiamente usato, ma per il processo di rilevamento delle caratteristiche, oggi ci sono più metodi, alcuni dei quali sono migliori o completano bene i tipi di estratti di processi DoG con punti chiave invarianti.
La maggior parte degli articoli attuali (guarda i collegamenti nelle domande collegate sullo stackoverflow) hanno un'altra pratica piacevole: combinano diversi modi di rilevare le caratteristiche e quindi usano i descrittori SIFT (che oscillano ancora come descrittori) per calcolare le rappresentazioni vettoriali invarianti. Attualmente sto lavorando con una combinazione di DoG (si concentrano su parti di immagini simili ad angoli) e regioni MSER (si concentrano su punti distinti simili a blob attraverso più scale). Potresti voler provare e sperimentare e lanciare ancora più tipi di rilevatori di funzionalità lì, se trovi questa combinazione non soddisfacente sul tuo particolare database di immagini.
Inoltre, se sei interessato, ecco un documento che valuta le preformance di diverse combinazioni di rilevamento e descrittore. Non l'ho letto da quando DoG e MSER + SIFT funzionano bene per me, ma l'ho scremato e il foglio è abbastanza buono.
PS: usa google scholar se non hai accesso al database IEEEXplore a cui ho collegato.