Le migliori impostazioni della fotocamera per fotografare il testo?


11

Sto usando il mio S95 per fotografare documenti di testo (sia cartacei che microfilm) per OCR. Ho già chiesto dei problemi su come fotografare al meglio lo schermo di un computer per il microfilm, ma ho pensato al modo migliore per fotografare il testo in modo che il testo risulti chiaro e nitido. Ecco i miei pensieri attuali, ma vorrei sapere cosa hanno da dire chiunque abbia più esperienza fotografica di me:

  1. Sto usando un numero minore di megapixel (circa 6-7 MP anziché il massimo dell'S95, che è 10MP), in modo che i file PDF risultanti non uccidano il mio computer quando vado effettivamente a scorrere attraverso di essi

  2. Apertura: inferiore (ad es. F / 6.3), in modo che se la fotocamera non è esattamente parallela alla pagina, il testo rimarrà a fuoco

  3. Velocità dell'otturatore - C'è un compromesso qui, perché le librerie sono generalmente meno illuminate, quindi vorrei abbassare la velocità dell'otturatore per aumentare l'esposizione, ma senza un treppiede, c'è la possibilità che la fotocamera oscilli

  4. ISO - Non sono del tutto sicuro di come ciò possa influenzarlo.

  5. Bilanciamento del bianco - Ancora una volta, non sono del tutto sicuro.

Ho sperimentato diverse impostazioni sulla mia fotocamera, ma sto solo imparando a conoscere la fotografia e vorrei sapere se qualcuno ha qualche suggerimento su come fotografare al meglio il testo, dai libri o dai documenti, che è facile da leggere.


3
Perché non usare semplicemente lo strumento giusto per il lavoro e usare uno scanner?
Ahockley,

7
"Perché non usare semplicemente lo strumento giusto per il lavoro e utilizzare uno scanner?" - Perché molti dei documenti con cui lavoro non sono analizzabili. Sono molto fragili o la libreria non ti consente di scansionare o la libreria addebita costi esorbitanti per scansionare verso l'alto di $ 0,50 / pagina.
Jason,

2
Vorrei che fosse stato detto: spero che i tuoi usi rispettino adeguatamente i diritti d'autore, se e quanto pertinenti. :) Presumendo così, spero che tu possa trovare le tue risposte!
termina il

3
"Spero che i tuoi usi rispettino adeguatamente i diritti d'autore" - Sì, il mio lavoro è con documenti al di fuori delle restrizioni sul copyright (io sono uno storico, principalmente studiando l'Europa del tardo XIX secolo)
Jason,

2
@ahockley: un'altra ragione per non scansionare è che ci vuole molto tempo. Con una DSLR posso fare circa 20 pagine al minuto su un tavolo, ma uno scanner che utilizza velocemente un alimentatore di documenti e costa molto.

Risposte:


7

Se la tua fotocamera ha una modalità in bianco e nero, proverei a ridurre il tempo di post-elaborazione. Inoltre, molti programmi OCR con cui ho lavorato fanno molto meglio in bianco e nero.

Ti consigliamo di ottenere il più parallelo possibile alla pagina, perché per ridurre le vibrazioni della fotocamera quando si tiene la mano, probabilmente avrai bisogno dell'apertura più ampia per massimizzare la velocità dell'otturatore. Il piccolo sensore sulla tua s95 dovrebbe aumentare il tuo DOF a sufficienza da aprire l'apertura il più possibile.

Considerando che lo farai passare attraverso l'OCR, porta il tuo ISO fino a tutto ciò che ti dà un'esposizione corretta con un tremolio minimo. L'OCR ha molte meno probabilità di lamentarsi del rumore extra rispetto alle lettere sfocate.

Il bilanciamento del bianco, se stai solo parlando di testo, dovrebbe essere per qualunque sia l'impostazione "indoor" della tua fotocamera - ma francamente, non preoccuparti troppo.

I tuoi megapixel possono avere importanza solo se il testo del tuo documento è incredibilmente piccolo e dovrai risolvere chiaramente quel livello di dettaglio, ma immagino che 6-7 andrà bene per la maggior parte delle cose.


1
Probabilmente intendi "perpendicolare alla pagina". Se sei parallelo, sarà difficile leggere il testo. ;-)
Craig Walker,

@Craig Walker - ha usato i termini "parallelo" alla pagina e ho capito cosa voleva dire, quindi non stavo cercando di confonderlo. Per non parlare del sensore stesso sarebbe parallelo, così come il mirino. Dipende solo da quale parte della videocamera si fa riferimento. Il termine era intenzionale.
rfusca,

Usa il maggior numero di megapixel possibile, i documenti OCR sono ciò che conta e saranno relativamente piccoli e fintanto che la fonte è tutto testo, non influenzata dalla risoluzione della fotocamera. Uso Abbyy FineReader e funziona meglio su immagini a risoluzione più elevata (ad esempio 21 MP anziché 10 MP). Quindi spara a 10MP.

giusto.
Craig Walker,

+1 per la modalità B / N. RGB per l'elaborazione del testo sta sprecando pixel.
Greg,

2

Sembra che tu abbia già una buona conoscenza delle impostazioni. Il tremolio della fotocamera rovinerà la leggibilità del testo più di ogni altra cosa, quindi lo ottimizzerei prima. Se non è possibile utilizzare un treppiede, assicurarsi che la velocità dell'otturatore sia almeno 1 sulla lunghezza focale (equivalente a 35 mm). Lo zoom indietro renderà tutto più semplice. Usa la stabilizzazione dell'immagine se ce l'hai.

Il diaframma può essere impostato abbastanza largo, assicurati solo di essere parallelo alla pagina. Un'ampia apertura aiuterà con la velocità dell'otturatore, di nuovo la sfocatura dovuta all'ampia apertura è nulla rispetto alla sfocatura dovuta al movimento della fotocamera!

ISO, qualunque cosa ti serva per ottenere una buona esposizione. Il rumore non dovrebbe influire sulla leggibilità fino a quando non diventa davvero male.

Sarebbe preferibile scattare un bilanciamento del bianco personalizzato basato sulla carta stessa, ma il software OCR dovrebbe essere in grado di far fronte a uno sfondo bianco sporco.


1
  1. Presumo che tu stia convertendo i JPEG in PDF. Consiglio di catturare il massimo e di utilizzare un programma per ridimensionare a 6-7 MP con la nitidezza applicata dopo il ridimensionamento e prima della conversione in PDF.

  2. Per chiarire, si desidera un'apertura più stretta per una profondità di campo maggiore, che è un numero f-stop più alto. (ad es. si desidera f / 8 anziché f / 2). Con il testo per la leggibilità, prova ad avere la fotocamera puntata il più perpendicolare possibile, quindi non devi preoccuparti della profondità di campo. È una buona idea fermarsi un po 'dall'ampia apertura per ridurre le aberrazioni come CA che vedrai con il testo nero su bianco. Più ti avvicini alla carta, più bassa sarà la profondità di campo.

  3. Questo probabilmente avrà il maggiore effetto sulla leggibilità se stai maneggiando. Se si tiene la mano, si desidera selezionare una velocità dell'otturatore tale che sia più veloce di 1 / (lunghezza focale equivalente di 35 mm) o anche più veloce. Questo dipende dall'impostazione dello zoom che stai utilizzando sul tuo P&S. Se si utilizza l'estremità larga, è possibile cavarsela con tempi di posa più lunghi, ma si può ottenere una distorsione a barilotto. Se stai fotografando documenti di testo e non uno schermo di un computer, ti consiglio di provare un flash.

    Se è possibile, sostenere il documento (registrato o qualcosa del genere in modo che sia piatto) in modo da poter appoggiare la fotocamera su qualcosa e ottenere il tempo di posa desiderato. È inoltre possibile utilizzare un beanbag o piccoli oggetti per inclinare la fotocamera mentre si appoggia. Inoltre, è possibile ottenere adattatori per treppiede a bottiglia d'acqua per un P&S.

  4. Apertura, velocità dell'otturatore e ISO formano un triangolo di esposizione. Leggi qui . Maggiore è l'ISO, l'apertura più stretta e la velocità dell'otturatore ridotta è possibile utilizzare, ma l'immagine sarà più rumorosa. Consiglio un ISO basso (400 o meno) per un P&S con testo.

  5. Seleziona il bilanciamento del bianco per la tua situazione di illuminazione. Se hai fluorescente, usalo. Se si utilizza il flash, utilizzare il bilanciamento del bianco del flash.


Non credo che f / 8 sia realistico per le riprese in interni (a meno che non si usi il flash, è necessario prima chiedere l'autorizzazione alla libreria) più f / 8 causerà distrazione con un piccolo sensore, il guadagno di nitidezza è minimo rispetto all'aumento richiesto di tempo di posa / ISO.
Matt Grum,

@Matt f / 8 è un esempio per dimostrare che desidera un numero più elevato per aumentare la profondità di campo (e ridurre altre aberrazioni come la CA, che possono essere visibili). Non gli ho dato le linee guida perché non sono sicuro di quanta luce abbia. Distrazione? Vuoi dire diffrazione?
Eruditass,

Sì, intendevo diffrazione - sto scrivendo questo sul mio telefono che ha la fastidiosa abitudine di correggere automaticamente le mie parole anche quando le scrivo correttamente. La CA non sarà un grosso problema (rispetto al movimento della fotocamera), penso che sarebbe meglio fermarsi da tutto, se la luce è un grosso problema ...
Matt Grum,

Non ami la tecnologia? Sì, direi che una fermata da tutta apertura è una buona linea guida e concordo sul fatto che il tremolio della fotocamera sarebbe il nocciolo.
Eruditass,

È un ottimo suggerimento per scattare con un numero massimo di MP, quindi eseguire il downsampling sul computer. Posso immaginare che la nitidezza + il contrasto extra porteranno a un testo molto più nitido, più facile da leggere.
Jason,

1

Sono d'accordo con i suggerimenti per scattare con la massima risoluzione disponibile e ridimensionare nel computer. Inoltre, scegli il jpeg di alta qualità che puoi ottenere dalla tua fotocamera o scatta anche crudo se la tua fotocamera lo consente e converti in un file tiff o png. La compressione con perdita di dati in jpeg può creare artefatti attorno al confine inchiostro / carta che potrebbero confondere il software ocr.

In generale, ciò che si desidera fare è utilizzare le impostazioni per ottenere l'immagine più nitida possibile. Cose come contrasto, bilanciamento del bianco, ecc. Possono essere tutte modificate nel computer. In effetti, aumentare il contrasto usando lo strumento Livelli o lo strumento Contrasto / Luminosità in Photoshop o GIMP potrebbe aiutarti molto.

Inoltre, la conversione in formato di scala di grigi ridurrà sostanzialmente la dimensione dei tuoi file. E se lo fai e aumenti il ​​contrasto, non devi preoccuparti del bilanciamento del bianco. Puoi sperimentare il bilanciamento del bianco, tuttavia, alcune impostazioni potrebbero produrre un contrasto migliore di altre (dipende dalla tua illuminazione).

Se il tuo computer è in grado di gestirlo, esegui tutte le regolazioni (scala di grigi, contrasto, luminosità) prima di ridimensionare e, dopo il ridimensionamento, applica un filtro di nitidezza all'immagine.


1

Alcuni pensieri, che non ho notato altrove, da aggiungere al mix:

  • Se scatti "ingrandito" (più teleobiettivo ), ti farà scattare ulteriormente dalla pagina, che ti darà quindi un'immagine più coerente rispetto alla dimensione del testo (le parole in un angolo saranno più vicine al stessa dimensione delle parole nel mezzo; con il grandangolo, potresti ottenere distorsione rispetto a questo). Non sono sicuro di quale sia l'impostazione "ideale", qui, ed è un compromesso con i tempi di posa richiesti, potenzialmente, solo qualcosa a cui pensare.

  • Ti consigliamo di " esporre eccessivamente " rispetto a ciò che la tua fotocamera probabilmente pensa sia giusta per impostazione predefinita (a meno che non sia abbastanza intelligente da indovinare che si tratta di carta - lo metto tra virgolette perché non vuoi davvero esagerare , basta sovraesporre in base alla misurazione fuori da una pagina bianca, perché il tono principale (la carta stessa) sarà la cosa principale per cui la fotocamera tenta di esporre e se si espone la carta in grigio medio, si avrà un punto di partenza più fangoso. Se "sovraesporre" di uno stop e mezzo o 2 stop (basta non andare al punto di evidenziazione del ritaglio), il testo dovrebbe essere ancora bello e scuro, ma la carta sarà bella e luminosa, facendo separazioni di contrasto ( e quindi OCR) più facile.

  • cerca di avere un'illuminazione uniforme : se un angolo della pagina è molto più chiaro o più scuro di un altro, questo renderà più difficile separare le cose nel bianco nero e bianco puro che molto probabilmente desideri per scopi OCR.

  • uno "stand di copia" è l'ideale per progetti come questo, anche se presumo oltre ciò che potresti facilmente avere in biblioteca ... Tuttavia, a seconda del modo in cui è configurata la tua biblioteca, è possibile che ci possa essere da qualche parte (forse uno scaffale sopra la scrivania, o un'asta che regge l'illuminazione o simili?) che potresti posizionare un super morsetto con una testa a sfera ( eccone uno , ma qualsiasi super morsetto con un "perno" di dimensioni appropriate (a seconda della testa) e una sorta di treppiede testa lo farebbe), e la tua fotocamera verrà quindi montata sulla superficie della scrivania (o qualsiasi altra cosa), in modo da poter disporre di un posizionamento coerente e stabilità nel caso in cui siano necessarie esposizioni più lunghe. Fondamentalmente, ciò equivarrebbe a un banco di copie di un "povero".

    Potresti anche voler utilizzare un breve autoscatto o un telecomando (immagino che la tua fotocamera abbia una modalità di autoscatto di 2 secondi, e forse una modalità personalizzata che potrebbe essere ancora più breve), per evitare che la vibrazione della fotocamera venga premuta dal pulsante.

Questo è tutto ciò a cui sto pensando per il momento. Speriamo sia utile.


1

Ho lo stesso lavoro della tua foto di landman e lo faccio da anni. Molte persone non sanno di cosa stanno parlando, fidati di me !!!

  1. La fotocamera su M o manuale

  2. Iso 100-200 più alto è il # più luminoso, ma ottiene più grana o rumore nella foto

  3. Velocità dell'otturatore da 1/100 a 1/160 (in genere 1/125 è la migliore, minore è la luminosità ma ottieni più interrazioni o ripetizioni)

  4. Aperture o f2.7 (perché avresti bisogno di un campo visivo profondo è una pagina piatta)

  5. Scatta a colori, da 6 a 10 megapixel, controlla le impostazioni di bilanciamento del bianco, in genere 1 o 2 fluorescenti, spegni la maggior parte delle campane e fischia se non sei sicuro di spegnerlo

  6. esporre le foto su comp usando acdc


0

Alcuni piccoli suggerimenti, ma penso che la tua configurazione sia buona

  1. Usa un treppiede. Ciò rimuoverà qualsiasi problema con le vibrazioni della fotocamera e ti consentirà di utilizzare tutta l'esposizione di cui hai bisogno.

  2. Evitare che la luce cada direttamente sulla carta con un angolo che può riflettersi direttamente sull'obiettivo e causare un punto culminante dove non si desidera. Questo di solito significa assicurarsi che la luce provenga dai lati.

  3. ISO: Come regola generale, dovresti errare verso un valore inferiore, ma sono sicuro che qualsiasi differenza sostanziale diventerà rapidamente evidente.

A parte questo, non riesco a pensare a nessun modo per migliorare la tua configurazione. Ad essere sincero, penso che tu ce l'abbia.


Puoi suggerire un buon treppiede (e relativamente economico) che sarebbe utile e mi permetta di capovolgere la fotocamera in modo che sia rivolta verso le pagine che sto fotografando? Ho guardato i treppiedi Joby e sembrano promettenti, ma ho sentito che spesso si spostano quando si preme l'otturatore.
Jason,

@Jason, punto giusto. Ho un Joby, che mi piace, ma per fermarlo quando si preme l'otturatore, basta usare un pulsante di scatto remoto o usare l'autoscatto. Questo è in realtà un buon consiglio per ogni volta che stai usando una bassa velocità dell'otturatore. La cattiva notizia è che qualsiasi treppiede abbastanza pesante da essere molto stabile non sarà economico. Mi dispiace per quello! (Se lo scopri diversamente, fammelo sapere!);)
AJ Finch,

0

Sembra che tu abbia già la maggior parte delle risposte :-P Aggiungerò solo alcuni commenti sui tuoi punti:

  1. Risoluzione: hai ragione, non avrai bisogno di molta risoluzione qui, specialmente se visualizzerai le immagini sullo schermo. Probabilmente lo limiterei al doppio della massima risoluzione tipica dello schermo da solo.

  2. Apertura: è corretto selezionare un'apertura più piccola per ottenere un po 'di spazio di oscillazione della profondità di campo. Tuttavia, probabilmente non avrai bisogno di molto. Gioca con la calcolatrice della profondità di campo per la lunghezza focale, calcola un DOF ragionevole, quindi procedi con l'apertura più grande possibile. (Tuttavia, assicurati di essere un arresto o due sotto l'apertura massima per la massima nitidezza.) Desideri l'apertura più grande in modo da poter avere più spazio per giocare con l'otturatore e ISO; vedi sotto.

  3. Otturatore: ovviamente lo desideri il più rapidamente possibile per ridurre il tremolio, ottenendo comunque abbastanza luce. Ho sentito varie fonti affermare che "velocità dell'otturatore pari alla lunghezza focale" per evitare vibrazioni; alcuni sostengono il doppio. Quindi, se si utilizza un obiettivo da 50 mm, provare a mantenere la velocità dell'otturatore tra 1/50 e 1/100. Una volta che hai quello, prova per la velocità più lenta per massimizzare la luce.

  4. ISO: dovresti essere in grado di aumentarlo abbastanza in alto. Il rumore potrebbe ridurre l'aspetto dell'immagine ma probabilmente non ne ridurrà troppo la leggibilità. Ciò che è "ISO elevato" e "troppo rumoroso" dipende dalla tua fotocamera. Sperimentare. Questo è probabilmente il modo migliore per ottenere la corretta esposizione in condizioni di scarsa illuminazione, rispetto all'apertura e all'otturatore.

  5. Bilanciamento del bianco: per te non dovrebbe importare troppo. Se la tua carta fotografata appare in bianco sporco, importa? (Storia diversa se stai fotografando libri con immagini a colori ovviamente). Se vuoi correggerlo per posta, avrai un tempo relativamente facile, dato che hai un sacco di carta di colore neutro con cui lavorare. Probabilmente lascerei la fotocamera sul bilanciamento del bianco automatico e me ne dimenticherei.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.