Scansiona molte pagine direttamente in un PDF

36

Esiste un programma facile da usare in Ubuntu in grado di scansionare molte pagine direttamente in un file PDF?

pdf scanning

— pupeno
fonte

Mi chiedo, ci sono qualifiche speciali necessarie per scanner / stampanti che vorrei usare in Ubuntu?

— JFW,

@JFW, ecco un elenco di dispositivi supportati per XSane, il back-end utilizzato dalla maggior parte degli scanner Ubuntu. Le stampanti / scanner / fotocopiatrici HP sembrano una buona scelta affidabile, se stai cercando.

— poolie,

38

L'idea di avere una semplice utility di scansione era alla base dello sviluppo di Simple Scan , lo strumento di scansione installato per impostazione predefinita dalla 10.04 in poi (Applicazioni ‣ Grafica ‣ Scansione semplice). testo alternativo

Basta scansionare tutte le pagine che vuoi e scegliere PDF come formato di file durante il salvataggio.

Un altro programma leggermente meno semplice che offre funzionalità aggiuntive come il riconoscimento del testo è gscan2pdf , anche nei repository. testo alternativo

— Marcel Stimberg
fonte

3

+1 per Simple Scan - è così facile e semplice, ma anche molto potente - è particolarmente adatto al lavoro che hai citato.

— 8128

6

"Facile da usare" è negli occhi dell'utente, ma xsaneoffre questa funzionalità. Scegli multipagina dove dice visualizzatore (o premi CTRL-M) e non dovrebbe essere troppo difficile da capire da lì.

— Karl Bielefeldt
fonte

1

Personalmente vedo xsane tutt'altro che facile da usare ...

— 8128

Ho usato xsane per tutto questo tempo. Non mi è mai venuto in mente che potrebbe esserci uno strumento migliore.

— Amanda,

3

Stavo usando xsanefino a quando ho visto questa domanda e ho considerato la sua interfaccia idiosincratica a dir poco, ma efficace.

Dopo aver visto questa domanda sono andato a cercare e ho trovato gscan2pdf che viveva nei repository Ubuntu Lucid / Maverick. Utilizza lo stesso motore di scansione (libsane) ma l'interfaccia utente è molto più Gnome-ish. Per divertirti, prova:

sudo apt-get install gscan2pdf

— rifiuti solidi urbani
fonte

3

Cambia il nome del file da myfile.jpg a myfile.pdf nella finestra di dialogo di salvataggio di Simple Scan.

Testato su Ubuntu 14.04, Simple Scan 3.12.1.

Funziona anche se il menu a discesa del tipo di file non mostra "PDF", ma solo "Immagini". Considero questo un bug dell'interfaccia utente.

Questa funzione è documentata su Help > Contents:

Dalla finestra di dialogo "Salva con nome", scegli uno dei tipi di file supportati o modifica semplicemente l'estensione nel campo "Nome".

Dice che sono supportati i seguenti formati:

PDF
JPEG
PNG
TIFF

Fatto interessante: se si modifica il tipo di scansione (menu a discesa oltre a "Scansione") in "Testo", il tipo di file predefinito diventa PDF.

— Ciro Santilli 新疆改造中心法轮功六四事件
fonte

1

Scansione di pagine dallo scanner USB. Usa tesseract per l'OCR in un PDF. Unisci più pagine in un unico PDF. Utilizzo: scan2PDF nomefile outputnumero_di_pagine

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

— morten
fonte

si tratta di un metodo molto Linuxoidal

— RTH

1

Per quelli di voi che desiderano usare XSANE. È molto potente e intuitivo dopo aver letto la guida all'installazione collegata da Aiuto> XSane Doc nel programma - per sapere quanto puoi farci. Vale anche la pena verificare che il back-end SANE funzioni correttamente (non troppo specifico per Arch): https://wiki.archlinux.org/index.php/SANE

Se vuoi scansionare automaticamente i documenti da un alimentatore e chiederti se XSane saprà quando fermarsi (e non fermarsi troppo presto), inserisci semplicemente un numero in alto a sinistra (icona del numero di scansioni) maggiore del numero di pagine che si adattano nel tuo alimentatore. Vale a dire se l'alimentatore può richiedere 10 pagine, quindi immettere 15 (per tenere conto della variazione di spessore). Se si dispone di uno scanner duplex, raddoppiare questo numero.

Quando l'alimentatore si esaurisce, verrà visualizzata una finestra di dialogo con un triangolo verde che dice "" Pagine scansionate: 0 ". Ciò significa che l'alimentatore è vuoto e puoi chiudere la finestra di dialogo. Se hai selezionato" visualizzatore "o" salva "in alto a destra di XSane, i file saranno tutti lì. Ricordati di salvarli dal visualizzatore. Ora puoi premere di nuovo scan per continuare da dove avevi interrotto, con i numeri che aumentano dallo stesso punto o puoi iniziare un nuovo progetto. Non verranno aggiunte pagine vuote. Se si seleziona "Multipagina", la finestra di dialogo del progetto dovrebbe mostrare tutte le scansioni completate e si può fare clic per salvare come PDF multiplo o TIFF o PostScript.

HTH,

DC

— user901387
fonte