Sono stato al posto di mio nonno lo scorso fine settimana. Mia nonna tirò fuori questo libro gigante (circa 1400 pagine) della sua storia familiare risalente al 1630 circa. Nerd gigante che sono, ho pensato che sarebbe stato saggio avere tutte le informazioni archiviate in un database e disponibili sul web. Sono in grado di gestire tutta la programmazione Web e le espressioni regolari e cosa no, ma ciò che non conosco è il modo migliore per ottenere il testo dal libro al computer.
So che sarà necessario un qualche tipo di OCR, dalla piccola ricerca che ho fatto, sembra che le mie opzioni siano:
- scattare una foto di ogni pagina con una fotocamera, quindi elaborare le immagini con il software OCR
- utilizzare uno scanner per scansionare ogni pagina, quindi elaborare con il software OCR
- usa una specie di dispositivo portatile, come questo .
Qualcuno ha qualche idea sul modo migliore per affrontare questo problema? Non voglio distruggere il libro, perché per quanto ne so, non può essere sostituito. Questa è probabilmente l'unica volta in cui eseguirò la scansione di un libro di grandi dimensioni, quindi non credo di voler spendere più di $ 250 su qualsiasi tipo di dispositivo. Non mi dispiace un po 'di sforzo manuale qui (mi rendo conto che molto probabilmente richiederà mesi), ma mi piacerebbe trovare il metodo più efficiente possibile.
Nota sul libro: ha solo circa 20 anni, quindi è in buone condizioni. È monocromatico e le pagine non hanno iniziato a ingiallire. Dal momento che è così grande, mi preoccupo delle possibili ombre quando il testo si avvicina alla rilegatura.