Acrobat 11 può essere progettato per eseguire l'OCR utilizzando più core della CPU?


8

L'elaborazione OCR richiede tempo. L'uso di più core della CPU velocizzerebbe l'elaborazione. Acrobat 10 non era un'applicazione multithread . Che ne dici di Acrobat 11? 11 per impostazione predefinita, l'OCR utilizza più core della CPU (se disponibili)? In caso contrario, esistono soluzioni alternative, ad esempio gli script, per consentire ad Acrobat 11 di eseguire l'OCR utilizzando più core della CPU? Tramite il linguaggio di scripting integrato di Acrobat o utilizzando script esterni che avviano e indirizzano più istanze di thread singolo di Acrobat in parallelo a parti del processo di elaborazione.

Nota: questa domanda non è troppo localizzata (non limitata a un momento specifico nel tempo) perché (1) Adobe non rilascia molto spesso nuove versioni principali di Acrobat (Acrobat 10 è stato rilasciato due anni fa) e (2) Adobe Acrobat è ampiamente applicazione usata.

Risposte:


6

Ho installato la versione di prova di Acrobat 11 (XI) in VirtualBox. Acrobat 11 è a thread singolo.

Ho anche creato uno script esterno che avvia più istanze di Acrobat (una per core della CPU), elabora parallelamente il lavoro OCR e unisce il risultato. Un passaggio cruciale è attivare la registrazione degli errori nelle preferenze di Acrobat, analizzare tutto il log e rielaborare tutti i file di errori. Lo script (quando si utilizzano 4 core) esegue ancora l'OCR due volte più velocemente rispetto all'impostazione predefinita di Acrobat 11.


4
Puoi solo dare la fonte se vuoi. Se osano rimuoverlo, può essere ripristinato facilmente.
Joey,

Inoltre, se ti capita di essere la stessa persona che ha pubblicato la domanda, considera la fusione di entrambi i tuoi account non registrati correnti con uno nuovo e registrato. Puoi iniziare qui e leggere anche questo per ulteriori informazioni. Dopodiché sarai in grado di modificare la tua domanda come ritieni opportuno.
Indrek,

Non sto cercando di ostruire nulla. Poiché continui a cambiare i nomi utente, è emerso che le tue modifiche sono state apportate da una terza parte che non sembra aver capito la domanda originale. Inoltre, se vuoi rispondere alla tua domanda, dovresti scrivere la domanda e rispondere in una volta.
Isaac Rabinovitch

Per ora ho unito i tuoi account (non registrati). Ti chiediamo comunque di non utilizzare un indirizzo e-mail usa e getta, ma di registrarti sul nostro sito in modo da poter rimanere connesso, commentare le tue domande, ecc. Inoltre, nulla verrà rimosso, nulla di cui preoccuparsi. Tieni presente che le modifiche anonime vengono sempre riviste più rigorosamente.
slhck,

1
@tarcman Qualche possibilità di pubblicare la tua sceneggiatura? Sono sicuro che ci sono molte persone che sarebbero interessate ad usarlo
Jason,

1

Il multithreading deve essere integrato in un'applicazione. Lo sviluppatore deve scrivere il codice che crea i thread e che suddivide l'attività in attività secondarie che possono essere allocate a ciascun thread. Se gli sviluppatori di Acrobat non riescono a farlo per il loro codice di riconoscimento OCR, l'utente non può creare la logica aggiuntiva necessaria.


2
Se può essere applicato a intervalli di pagine, è probabile che tu possa provare a dividere il lavoro in più processi, ognuno dei quali esegue l'OCR solo poche pagine e in seguito unendo nuovamente i risultati.
Joey,

0

Per usare tutti i core per l'OCR potresti voler guardare PDF-Exchange Editor. Il suo motore OCR sembra usare tutti i core del mio sistema. Una volta raggiunto questo livello di prestazioni, ha senso utilizzare un SSD.

Deve esserci un tweak di Windows che gli consenta di dedicare più tempo della CPU a una singola applicazione thread che non è associata a I / O. Sul mio sistema Acrobat non viene rallentato dalle prestazioni del disco, ma la maggior parte del tempo di CPU che ottengo costruendo un indice è di circa il 30%.

Ammettiamolo, Acrobat è un'applicazione ampiamente usata ma mal scritta. Acrobat Pro ha alcune funzionalità che non puoi ancora trovare altrove (ancora).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.