Quali siti Web di condivisione di foto espongono i numeri di serie della fotocamera?


26

Quali siti Web espongono i numeri di serie del corpo della fotocamera dall'immagine originale EXIF?

Flickr è un sito Web per la condivisione di foto che espone molti metadati di foto (dai dati EXIF ) e ne facilita l'accesso anche grazie all'API di Flickr . Picasaweb di Google offre anche alcune informazioni dall'EXIF ma non dal numero di serie.

Ci sono altri siti che possono aiutarmi?

Come sfondo di ciò che sto facendo, sto cercando di raccogliere un database di numeri di serie della fotocamera e gli URL delle immagini in cui sono stati trovati. Sono solo io che faccio qualcosa gratuitamente nella speranza che possiamo catturare alcune delle persone che rubano le nostre preziose macchine fotografiche! Spero che non sia troppo fuori tema perché non sto cercando di vendere nulla, sto solo cercando di fare del bene!

Disclaimer: sono l'autore di stolencamerafinder ;)


Aggiornamento - Come richiesto da fbuchinger, ecco un rapido aggiornamento allo stato del progetto:

Molti siti (sfortunatamente facebook) rimuovono i makernotes dall'EXIF. Finora, ho trovato la fonte più ricca di numeri di serie per essere Flickr. Suppongo sia perché le persone caricano spesso immagini full-size (leggi "non modificate"). Sul mio sito ( stolencamerafinder.com ) offro un'app java webstart che raccoglie i dati di Flickr attraverso la sua API. Poiché esiste un limite alla velocità con cui effettuo le chiamate API, l'ho scritto in modo tale che il lavoro sia condiviso tra il numero di client di avvio Web, riducendo in tal modo la larghezza di banda e la CPU sui client, maggiore è il numero di persone che lo eseguono. Se stai leggendo questo e hai, diciamo, l'accesso di amministratore a un server al lavoro che non fa molto, perché non lasciarlo in esecuzione lì;)

Ho anche scritto un plug-in di Google Chrome che tiene d'occhio le immagini sui siti Web che hanno un numero seriale incorporato. Non mi aspetto un rendimento molto elevato da questa app, l'idea principale era scoprire quali siti Web potrebbero essere buone fonti per cui scrivere strumenti di spider personalizzati e quindi scansionarli.

Ho pubblicizzato la mia API per stolencamerafinder e sto cercando altri programmatori che mi aiutino a scrivere programmi che possano fungere da crawler web.

Nel fare questo progetto ho raccolto molti dati interessanti che presto metterò sul sito Web, ad esempio quali modelli di fotocamere fanno e non scrivono numeri di serie utili. Ad esempio, la Nikon D50 scrive semplicemente "D50" come numero di serie!

Sarei estremamente grato per qualsiasi feedback (buono o cattivo!) Che potresti avere sul mio progetto.

-Opaco


8
Forse più utile e commercializzabile sarebbe offrire un servizio per tracciare dove "le tue" foto sono state (ri) utilizzate, potenzialmente senza licenza.
Rowland Shaw,

ho aggiornato la mia risposta
fbuchinger,

Risposte:


6

Adoro l'idea di un ladro. ;)

Ho notato che DeviantArt.com sembra "catturare" tutti i metadati EXIF ​​incorporati in qualsiasi immagine caricata. Non mostra tutto, tuttavia ci sono alcune parti del sito (molte solo per i membri paganti) che mostrano informazioni più dettagliate su un'immagine caricata e ho visto i dati di tag completi elencati.

Immagino, tecnicamente parlando, se potessi fare qualcosa di simile a TinEye.com (ricerca inversa di immagini) che indicizza le immagini e le ricerche in base alla somiglianza dei contenuti. TinEye è utile in quanto abbina le immagini per contenuto, ma ha i suoi limiti. Le fotomanipolazioni create con foto protette da copyright di qualcuno sono difficili da identificare. La ricerca per numero di serie fornirebbe un approccio alternativo e gratuito.

È possibile ottenere tecnicamente qualsiasi dato exif incorporato nelle immagini caricate su Internet. Se il numero di serie della videocamera è incorporato, si otterrebbe ciò che si sta cercando. Dovresti raschiare una copia di ogni immagine dai siti che indicizzi, estrarre qualsiasi EXIF ​​(o altri dati di tag) dalle immagini indicizzate e tracciare le informazioni con un link indietro alla fonte. Probabilmente potresti anche utilizzare i principali motori di ricerca come Bing e Google per trovare le immagini da indicizzare (potrebbero essere sufficienti ricerche di immagini di parole chiave di base, come nomi dei fotografi, posizioni, ecc.) Probabilmente non dovrai tenere l'immagine in giro (e farlo potrebbe comportare comunque problemi legali), ma almeno avresti un indice dei dati dei tag EXIF ​​/ IPTC, possibilmente un numero seriale e un link di origine.


1
Un problema è che se la foto viene manipolata in qualche modo l'EXIF è molto probabilmente rimosso o ridotto. La disponibilità dei dati EXIF ​​su un sito di condivisione di foto e la ricerca di immagini generali dipende interamente dal meta-contenuto dell'immagine caricata. Tuttavia, cercare la possibilità di meta che può essere utilizzato per la ricerca di una fotocamera rubata è una buona idea in sé.
nik,

@nik: Vero, saresti in balia di qualsiasi cosa venga caricata ... È un peccato che i flussi di lavoro nella maggior parte degli strumenti, come Photoshop, Lightroom, ecc. non conservino i dati dei tag attraverso salvataggi e modifiche.
jrista

Grazie per aver sottolineato Tineye. Sono fino a 1,6 miliardi di immagini che fanno sembrare i miei 0,3 milioni piuttosto spazzatura! Ma se possono farlo, anche io! Mi metterò al lavoro per scrivere un web crawler più generico per eseguire lo spidering di tutti i siti Web ...
Matt brucia il

@matt: vero, hanno 1,6 miliardi, ma non cercano per numero seriale. Se potessi cercare sia per contenuto che per numero di serie, avresti un vantaggio su di essi. ; P
jrista

Si noti che su molti siti non è possibile raggiungere il file originale se non si dispone di uno stato di appartenenza o di connessione all'utente che lo ha caricato. Quindi potresti essere in grado di scaricare solo una versione ridotta che molto spesso ha strisce EXIF. A volte lo fanno anche gli strumenti di caricamento, inviando il file con solo informazioni sul copyright. Sottotitolo: Facebook toglie tutto, anche il copyright di EXIF ​​e ha ottenuto molto calore dai fotografi per questo.
Itai,

6

AGGIORNARE:

Grazie per l'aggiornamento dello stato del progetto! Prima di tutto l'approccio con l'app java webstart è interessante: usi diverse chiavi API di Flickr per ogni istanza di webstart o flickr ricopre le richieste API basate su una combinazione chiave API / indirizzo IP?

Ho eseguito la tua app webstart e ha prodotto 0 numeri di serie dopo aver scansionato 50 foto. Non ho esaminato il tuo codice sorgente, ma dovresti essere consapevole che solo una piccola minoranza di cam (principalmente dslr) scrive numeri di serie nei metadati exif.

Consiglio di scaricare le immagini di esempio dal Meta Information Repository di Phil Harvey ed eseguire exiftool su di esso per vedere quali modelli producono effettivamente numeri di serie. È quindi possibile restringere la ricerca dell'app Webstart a questi modelli e quindi migliorare notevolmente il rapporto di successo.


Mi sono imbattuto nella tua domanda quando ho appena iniziato a esplorare photo.stackexchange.com.

2 anni fa, ho avuto un'idea molto simile a stolencamerafinder e in realtà ho iniziato a implementarlo in Python. Tuttavia l'ho interrotto per vari motivi:

  • La maggior parte dei numeri di serie della telecamera memorizzati nei dati EXIF ​​è modificabile e quindi falsificabile (almeno con exiftool) -> rischio di falsi avvisi o "spam del numero di serie" (almeno quando il servizio inizia a diventare popolare)

  • La maggior parte delle persone usa i caricatori di immagini che ridimensionano le loro immagini e quindi spesso scartano tutte o molte parti dei dati EXIF ​​(Ricorda che il numero seriale è sempre memorizzato in un exk makernote proprietario che viene spesso rilasciato durante le conversioni di immagini) -> basso rapporto di immagini ispezionate : numeri di serie estratti.

tuttavia sono curioso di sapere come si è sviluppato il tuo progetto ... potresti fornire un breve riassunto dello stato?


Ciao. Ho appena aggiunto un aggiornamento nella domanda principale sopra. Se hai domande / suggerimenti, mi piacerebbe ascoltarli. -Matt
matt brucia il

Uso solo una chiave API, ma ogni istanza webstart comunica attraverso il sito Web per bilanciare il carico del lavoro in modo da non superare la quota.
Matt brucia il

Sono preoccupato perché l'app webstart non ha funzionato per te. Dovrebbe trovare i periodici in circa 1/4 di tutte le foto scansionate. Ci sono dei messaggi nei registri della console Java? Ho scaricato quelle immagini di esempio un po 'indietro e ho scritto uno script Python per generare alcune statistiche. Li pubblicherò online presto perché altri potrebbero trovarlo interessante.
Matt brucia il

6

Poiché la mia prima risposta è più focalizzata sui dettagli tecnici, ho deciso di aprire una seconda risposta per darvi una panoramica della mia idea originale di "camerafinder" soprannominata "CATT" (Strumento antifurto per fotocamera). Sentiti libero di usare le mie idee, ma per favore, mi accrediti abilmente ...

Contrariamente a stolencamerafinder, CATT funziona su base opt-in. Come proprietario di una videocamera, ti iscrivi al sito CATT, crei un profilo utente e quindi registri le videocamere.

Per fare ciò, è necessario scattare una foto di alcuni QRCode generati casualmente visualizzati sullo schermo. Quindi carica la foto non modificata sul sito CATT. Al termine del caricamento, il server legge i metadati della foto e verifica la presenza di un numero seriale incorporato. Prova anche a decodificare il QRCode dall'immagine e lo confronta con un hash memorizzato. Questo per evitare che qualcuno possa registrare la tua fotocamera semplicemente caricando una foto arbitraria scattata con quella fotocamera.

Quando la tua fotocamera viene rubata, accedi al sito CATT e contrassegna quel dispositivo come rubato. Per rintracciare le telecamere rubate, abbiamo pianificato un parser di numeri di serie exif sul lato client in javascript come script mozilla greasemonkey (simile all'estensione di Chrome). Dovrebbe essere eseguito solo su pagine flickr contenenti immagini originali (grazie al supporto del pattern url di greasemonkey) per non rallentare troppo il browser. Lo script contattava regolarmente il server CATT per recuperare un elenco di serial cam rubati. Se il seriale dell'immagine attualmente visualizzata mostra una corrispondenza, visualizzerà un avviso.

Ho visto che la tua estensione Chrome segue un approccio simile (anche se sembra solo raccogliere i periodici). Nel tuo caso, sfrutterei l'estensione con l'API W3C File (attualmente Firefox e Chrome), in modo che l'utente possa anche ispezionare le foto archiviate localmente e non solo quelle incorporate nelle pagine Web. Ciò aumenterà sicuramente il "numero di serie raccolto", perché nessun "man-in-the-middle" (flickr facebook ecc.) Eliminerà i dati exif.

Ecco un'interessante demo di Mozilla su Exif Extraction con l'API del file W3C .


Grazie mille per questo, alcune informazioni e idee fantastiche. Il QRCode è v. Intelligente. Non sono sicuro di capire come l'API File mi sia di grande aiuto nel modo in cui menzioni (chi consentirebbe l'accesso ai file locali e avrebbe immagini da una fotocamera rubata) ma è esattamente quello che sto cercando di scrivere un semplice strumento di estrazione seriale per la homepage del mio sito web. Invece di "Inserisci il tuo numero di serie", posso solo consentire alle persone di cercare con un'immagine che già possiedono (previene anche errori). Un altro vantaggio è che a volte devo usare il numero seriale interno come ID, non quello sulla scatola della fotocamera.
Matt brucia il

Per inciso, quella pagina demo ha funzionato solo per me in Firefox, non in Chrome. Sto anche iniziando a pensare che questa pagina non sia l'ideale per discutere di tutto questo, ma lo farà per ora! ps. Al momento sto viaggiando attraverso l'Asia, quindi non offenderti se dovessi impiegare qualche giorno (/ settimane) per rispondere, i tuoi commenti mi sono stati molto utili, grazie.
Matt brucia il

la demo del lettore exif funziona in Chrome> 5, l'errore è causato da una funzione di registrazione non essenziale (controllare nella console di Chrome e ridefinirla come funzione vuota). Buon viaggio!
fbuchinger,

Informazioni sul caso d'uso dei file locali: penso che intendiamo la stessa cosa: un'estrazione seriale di js cam per file locali che fa parte del tuo sito Web stolencamerafinder, non necessariamente dell'estensione. Potrebbe essere utilizzato per determinare lo stato della videocamera in base a qualche foto di esempio (ad esempio scattata durante l'acquisto di una videocamera usata per assicurarsi che non sia stata rubata da qualcun altro). A proposito: hai esteso il parser Exif di Jacob Seidelin da solo o l'estrazione del numero seriale è stata il suo lavoro?
fbuchinger,

Ho esteso il suo parser da solo, ma sono riuscito a farlo solo leggendo le sezioni makernote Canon e Panasonic finora. (la mia conoscenza del formato IFD è al massimo scarsa). Devo dargli il giusto credito per il suo lavoro sul mio sito poiché è principalmente il suo lavoro. Quando sono soddisfatto delle mie modifiche, glielo rispedirò come possibile miglioramento / versione alternativa.
Matt brucia il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.