Esiste un programma facile da usare in Ubuntu in grado di scansionare molte pagine direttamente in un file PDF?
Esiste un programma facile da usare in Ubuntu in grado di scansionare molte pagine direttamente in un file PDF?
Risposte:
L'idea di avere una semplice utility di scansione era alla base dello sviluppo di Simple Scan , lo strumento di scansione installato per impostazione predefinita dalla 10.04 in poi (Applicazioni ‣ Grafica ‣ Scansione semplice).
Basta scansionare tutte le pagine che vuoi e scegliere PDF come formato di file durante il salvataggio.
Un altro programma leggermente meno semplice che offre funzionalità aggiuntive come il riconoscimento del testo è gscan2pdf , anche nei repository.
"Facile da usare" è negli occhi dell'utente, ma xsane
offre questa funzionalità. Scegli multipagina dove dice visualizzatore (o premi CTRL-M) e non dovrebbe essere troppo difficile da capire da lì.
Stavo usando xsane
fino a quando ho visto questa domanda e ho considerato la sua interfaccia idiosincratica a dir poco, ma efficace.
Dopo aver visto questa domanda sono andato a cercare e ho trovato gscan2pdf che viveva nei repository Ubuntu Lucid / Maverick. Utilizza lo stesso motore di scansione (libsane) ma l'interfaccia utente è molto più Gnome-ish. Per divertirti, prova:
sudo apt-get install gscan2pdf
Cambia il nome del file da myfile.jpg a myfile.pdf nella finestra di dialogo di salvataggio di Simple Scan.
Testato su Ubuntu 14.04, Simple Scan 3.12.1.
Funziona anche se il menu a discesa del tipo di file non mostra "PDF", ma solo "Immagini". Considero questo un bug dell'interfaccia utente.
Questa funzione è documentata su Help > Contents
:
Dalla finestra di dialogo "Salva con nome", scegli uno dei tipi di file supportati o modifica semplicemente l'estensione nel campo "Nome".
Dice che sono supportati i seguenti formati:
Fatto interessante: se si modifica il tipo di scansione (menu a discesa oltre a "Scansione") in "Testo", il tipo di file predefinito diventa PDF.
Scansione di pagine dallo scanner USB. Usa tesseract per l'OCR in un PDF. Unisci più pagine in un unico PDF. Utilizzo: scan2PDF nomefile outputnumero_di_pagine
#!/bin/bash
#scan2PDF
#Requires: tesseract 3.03 for OCR to PDF
# scanimage for scanning, I use 1.0.24
# pdfunite to merge multiple PDF into one, I use 0.26.5
#
# Use scanimage -L to get a list of devices.
# e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
# then copy/paste genesys:libusb:006:003 into SCANNER below.
# play with CONTRAST to get good images
DPI=300
TESS_LANG=nor #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003 #My USB scanner
CONTRAST=35 #Contrast to remove paper look
FILENAME=$1 #Agrument 1,filename
PAGES=$2 #Argument 2, number of pages
re='^[0-9]+$' #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi
SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp
if [ -d ${TMP_DIR} ] #Check if it exists a directory already
then
echo Error: The directory ${TMP_DIR} exists.
exit 2
fi
mkdir ${TMP_DIR} #Make and go to temp dir
cd ${TMP_DIR}
echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt
echo Starts Tesseract OCR
for file in *.tif #Goes through every tif file in temp dir
do
tesseract $file ${file%.tif} -l ${TESS_LANG} pdf
done
if [ "$PAGES" = "1" ] #How many pages
then
cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back
else
for file in *.pdf #More pages, merge the pages into one PDF and copy back
do
pdfuniteargs+=${file}
pdfuniteargs+=" "
done
pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
echo ${FILENAME}.pdf done
rm * #Done, clean up
cd ..
rmdir ${TMP_DIR}
Per quelli di voi che desiderano usare XSANE. È molto potente e intuitivo dopo aver letto la guida all'installazione collegata da Aiuto> XSane Doc nel programma - per sapere quanto puoi farci. Vale anche la pena verificare che il back-end SANE funzioni correttamente (non troppo specifico per Arch): https://wiki.archlinux.org/index.php/SANE
Se vuoi scansionare automaticamente i documenti da un alimentatore e chiederti se XSane saprà quando fermarsi (e non fermarsi troppo presto), inserisci semplicemente un numero in alto a sinistra (icona del numero di scansioni) maggiore del numero di pagine che si adattano nel tuo alimentatore. Vale a dire se l'alimentatore può richiedere 10 pagine, quindi immettere 15 (per tenere conto della variazione di spessore). Se si dispone di uno scanner duplex, raddoppiare questo numero.
Quando l'alimentatore si esaurisce, verrà visualizzata una finestra di dialogo con un triangolo verde che dice "" Pagine scansionate: 0 ". Ciò significa che l'alimentatore è vuoto e puoi chiudere la finestra di dialogo. Se hai selezionato" visualizzatore "o" salva "in alto a destra di XSane, i file saranno tutti lì. Ricordati di salvarli dal visualizzatore. Ora puoi premere di nuovo scan per continuare da dove avevi interrotto, con i numeri che aumentano dallo stesso punto o puoi iniziare un nuovo progetto. Non verranno aggiunte pagine vuote. Se si seleziona "Multipagina", la finestra di dialogo del progetto dovrebbe mostrare tutte le scansioni completate e si può fare clic per salvare come PDF multiplo o TIFF o PostScript.
HTH,
DC