Come posso trasformare le foto di documenti cartacei in un documento acquisito?


44

Il mio scanner si è rotto! Ho una buona macchina fotografica, quindi ho scattato alcune foto dei documenti che voglio scansionare ... Comunque sembrano foto di carta, non documenti scansionati:

  • Le immagini non sono piatte
  • L'illuminazione non è uniforme (ombre mentre la pagina si deforma, ecc.)
  • Ovviamente il testo non viene elaborato in testo PDF incollabile.

Semplicemente non sono adatti per un uso professionale, ma sono vicini.

Sto cercando qualcosa (o metodo) che possa fare una o tutte le precedenti, quindi posso passare da un numero di file JPG a un singolo PDF annotato [opzionalmente] di tutto, che è nel formato giusto (A4 tipicamente).

Qualche suggerimento (a parte uscire e acquistare un nuovo scanner)?


1
Su Android, l'app Drive di Google può eseguire un po 'di elaborazione e procurarti un PDF in formato A4 da un set di immagini (creando una nuova "scansione") - applica B&W e un po' di raddrizzamento (entrambi sull'app, mentre creando) e sembra principalmente una scansione (di bassa qualità). L'OCR è un problema più difficile.
Muru,

Non conosco alcun software Ubuntu ma ho scartato il mio scanner dopo aver scoperto che ci sono app su un telefono cellulare che fanno principalmente la stessa cosa. Potresti voler guardare l'app Genius Scan (per Android) o Scannable (per iPhone). Quindi applicare pdfjoinper cucirli insieme. Nessun OCR però.
Jos

Il motivo per cui voglio farlo tramite le foto anziché tramite un'app mobile è che la mia dSLR è [letteralmente] circa mille volte migliore della fotocamera del mio telefono. E se non c'è nulla che lo faccia in un colpo solo, in realtà penso di poter gestire l'OCR da solo. Ci sono molti progetti open source che fanno un lavoro abbastanza buono.
Oli

Potrei aver appena rianimato il mio scanner con nastro adesivo, toast e inceppamento, quindi l'urgenza è disattivata ma penso che questo sia ancora un problema interessante.
Oli

Oli , I Googled alcuni esempi su come questo StackExchange tex.stackexchange.com/questions/94523/simulate-a-scanned-paper e questo stackoverflow.com/questions/8955425/... semplicemente non so se ho ottenuto il vostro domanda giusta;)
JoKeR,

Risposte:


46

Esistono diversi modi per farlo. Sebbene tutti i miei suggerimenti suggeriscano un problema, non appiattiranno davvero la tua foto. Sarebbe comunque necessaria una foto più o meno buona.

Un modo semplice è provare il software ScanTailor

sudo apt-get install scantailor 

Ti bastano 6 passaggi per ottimizzare le tue foto. Nell'ultimo passaggio è possibile selezionare l'opzione "Equalizza illuminazione" per ottenere un aspetto pulito e gradevole!


Personalmente di solito uso solo GIMP . Ma hai bisogno di alcune abilità di base per raggiungere il tuo obiettivo.

sudo apt-get install gimp 
  1. ritaglia l'immagine nel modo desiderato
  2. utilizzare l' opzione Colors-> Curvesper manipolare l'output del colore nel modo desiderato ...

Regola le curve di colore per ottenere un risultato nitido e pulito.


Un altro piccolo programma carino è gscan2pdf , dove puoi anche caricare foto ed esportarle come PDF. C'è anche un link a GIMP in modo da poter migliorare la foto con i passaggi sopra descritti .

sudo apt-get install gscan2pdf 

1
Non avevo mai visto ScanTailor prima d'ora. Sembra quasi perfetto, tranne per il fatto che non riesco a capire come salvarlo come qualcosa che voglio conservare (es. PDF). Qualche idea?
Oli

PS: benvenuto in Ask Ubuntu e Stack Exchange!
Oli

1
@Oli l'output viene salvato nella cartella selezionata all'inizio. Come vedo adesso lo salva come tiff. Quindi desideri eseguire un convert file.tiff file.pdfnella console.
wittich,

2
Oh sì, mia cattiva. Sto usando più pagine, quindi le converto in png con find -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;e poi le unisco a pdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png. Sto solo pensando ad alta voce quando dimentico come fare tutto questo :) Grazie ancora.
Oli

2
ScanTailor è stata una scoperta !!! Di solito farei tutte queste cose in Gimp o in un'app proprietaria come Gimp, ma Scan Tailor ha solo le caratteristiche di cui ho bisogno per convertire le mie immagini in immagini simili a scansioni, eliminando tutto il rumore :) Molto più facile di tutte le curve a cui ero abituato spostare in Gimp. Grazie mille !!!
Kostyantyn,

20

Per generare una copia stampabile o un PDF da una foto della fotocamera di un documento, dobbiamo convertire manualmente parecchio per ottenere un'immagine simile a quella prodotta da uno scanner. La maggior parte di queste conversioni può essere fatta con Gimp.

  1. Prova a sfruttare al meglio l' immagine sorgente originale :

    • Scegli una luce intensa per ridurre il rumore dei pixel, ma per evitare riflessi, emorragie o dispersione della luce irregolare non utilizzare un flash a meno che non si disponga di un flash da studio.
    • Se possibile, scegliere di illuminare la sorgente da almeno due lati (in alto o in basso a destra)
    • Scatta la foto da una distanza maggiore utilizzando un teleobiettivo anziché un obiettivo grandangolare.
    • Usa un treppiede per evitare di scuotere gli artefatti.
    • Puntare la videocamera ortogonale sulla superficie della sorgente.
    • Includere un po 'di spazio al confine con la fonte originale.
  2. Considera la desaturazione in scala di grigi per un migliore contrasto e la rimozione di artefatti a pixel colorati.

    inserisci qui la descrizione dell'immagine

  3. Regola la luminosità e il contrasto per rendere bianco lo sfondo presumibilmente grigio e le lettere nere sono nere.

    • Questo può essere fatto rapidamente con lo strumento Colori Gimp > Livelli in cui è possibile trascinare il punto nero (a sinistra) e il punto bianco (a destra) o selezionare i punti bianco / nero con il selettore colore.

    inserisci qui la descrizione dell'immagine

    • Le ombre sugli angoli piegati non possono essere rimosse senza rimuovere anche parti del testo (vedere 6.)
  4. Rimuovere la distorsione del cuscino?

    A seconda della qualità della nostra lente fotografica e del livello di zoom che abbiamo usato, potremmo avere alcuni artefatti del cuscino che portano alla piegatura dei bordi esterni del documento. Ci sono plugin per rimuovere anche questi artefatti, ma potremmo trovare più velocemente scegliere un livello di zoom della nostra fotocamera dove sono solo minimi. Dopo il ritaglio (5.) potremmo non notarli più. Quindi la rimozione di artefatti da cuscino può essere necessaria solo nel caso in cui la nostra immagine sorgente abbia molte linee rette nelle parti esterne.

  5. Ruota e ritaglia o prospettiva trasforma l'immagine, se necessario.

    A differenza di uno scanner, la nostra fotocamera potrebbe non ottenere la sorgente in parallelo ai bordi dell'immagine. Lo strumento Gimp Ruota o Prospettiva ci fornirà un feedback visivo per poter ruotare o regolare la prospettiva di un'immagine fino a quando le linee di testo sono parallele alla pagina.

    inserisci qui la descrizione dell'immagine
    Strumento prospettiva sul lato destro

Ora possiamo selezionare l'origine del documento con lo strumento di selezione rettangolo per ritagliare l'immagine all'interno del documento.

  1. Rimuovi le ombre indesiderate da piegamenti, pieghe o artefatti di vignettatura dall'obiettivo della fotocamera.

    • Queste ombre sono difficili da rimuovere e non ci sono plug-in o filtri automatici per aiutarci.
    • In teoria potremmo sovrapporre un riempimento sfumato a queste regioni, ma potrebbe non portare ai risultati previsti, quindi potrebbe non valere il tempo di cui avremmo bisogno.
    • Il metodo più veloce quindi è semplicemente usare lo strumento gomma per rimuovere tutte quelle brutte ombre al di fuori del testo (che dovremmo risparmiare).

      inserisci qui la descrizione dell'immagine cancellato -> inserisci qui la descrizione dell'immagine

  2. Scala l'immagine?

    A seconda della risoluzione della fotocamera, il ridimensionamento dell'immagine in base alla dimensione dell'immagine dello scanner aumenterà solo la dimensione del file ma non avrà alcun vantaggio sulla qualità dell'immagine. Il ridimensionamento rimuoverà i dettagli. Pertanto non dovremmo ridimensionare l'immagine ma regolare le dimensioni di stampa dalla finestra di dialogo della stampante (o in basso in 8.).

  3. Genera PDF

    Possiamo importare la nostra immagine ora ripristinata manualmente in LibreOffice ( Inserisci> Media ) su

    • Definisci le sue dimensioni
    • Esporta come PDF
    • Stampa (per me la stampa da LibreOffice porta ad un risultato desiderato molto più spesso di ogni altra cosa).

Grazie mille per i passaggi dettagliati. Mi hanno aiutato a risolvere un problema di vecchia data della conversione di foto in documenti scansionati. Sono totalmente impressionato dal potere della trasformazione prospettica.
Chethan S.

Risposta fantastica! Lo strumento prospettico all'inizio mi è sembrato piuttosto confuso, quindi ecco un'ottima guida. Ho aggiunto 4 linee guida e quindi drogato gli angoli dell'immagine usando lo strumento prospettiva fino a quando l'immagine non era quadrata con tutte e 4 le linee guida.
Gabriel Staples,

(24 ore dopo). Oops! Ho dimenticato il link. Ecco la guida di cui stavo parlando: lifewire.com/… .
Gabriel Staples il

1

Se hai già l'immagine del documento, scarica l'app CamScanner sul tuo telefono / tablet. Ti consentirà di importare l'immagine, quindi eseguirà un ritaglio suggerito e ti permetterà di appiattire e regolare i colori / il contrasto, ecc. Richiede solo un minuto.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.