Ho diverse migliaia di pagine di libri scansionati. Ogni pagina viene salvata singolarmente come JPG. La scrittura è chiara, ma i caratteri variano e le pagine includono immagini e illustrazioni.
Devo creare un elenco di tutte le parole che compaiono in ogni file JPG. Esiste uno strumento da riga di comando per scansionare un'immagine che elenca le parole che appaiono? Non ha bisogno di una scansione perfetta, solo una stima.