Le persone che producono TinEye hanno un prodotto chiamato PixMatch che può cercare singole collezioni. Tuttavia, non è implementato come un'applicazione desktop: è un'API basata su server. E sembra essere valutato per un uso aziendale serio, non per gli individui. Quindi è lì , ma non proprio una risposta.
Ma un'azienda concorrente ha qualcosa per il desktop: Imense Desktop Similar Image Search , che funziona su Apple Mac OS o Microsoft Windows con Adobe Bridge CS4 . È gratuito per raccolte fino a 4000 e sembra avere un prezzo ragionevole al di sopra di quello.
In effetti, ci sono un sacco di cose, una volta che ho capito cosa cercare: recupero di immagini basato sul contenuto . In realtà c'è molto lavoro in quest'area e moltissimi strumenti sia open source che chiusi . La maggior parte di questi sono focalizzati sul lato delle grandi imprese / università e si trovano in vari stati di completamento e perfezionamento.
Di questi, penso che imgSeek sia il più interessante per il caso desktop. Questo è basato su Python / QT e quindi in teoria dovrebbe funzionare praticamente su qualsiasi piattaforma, ma è focalizzato su Linux. Fa un confronto basato su metadati (data, ora, ecc.), Caratteristiche semplici come luminosità media o colore, o mediante sofisticate stime basate sulla wavelet di somiglianza . Questo è probabilmente eccessivo per trovare la stessa identica immagine in una dimensione diversa con una compressione diversa, ma dovrebbe funzionare davvero bene dal momento che è fondamentalmente il caso più semplice possibile. Troverà anche corrispondenze vicine, in questo modo:
Tutto ciò potrebbe essere troppo lavoro per questo specifico problema una tantum. Come vengono archiviate le tue foto non organizzate? Anche se i loro nomi di file non sono di aiuto, i metadati EXIF dovrebbero essere comunque validi. Un approccio semplice è quello di importarli in un programma che può esaminare questi dati e cercare o ordinare in base a essi. In alternativa, è possibile utilizzare un programma come jhead per rinominarli tutti in modo che abbiano nomi basati sulla data sensibili. (Forse entrambi.)