Esistono buoni programmi OCR per la calligrafia open source (beh, gratuiti)?


16

Il titolo chiede tutto. Ho davanti a me un'attività di immissione dei dati di cui non sono troppo entusiasta: 50-100 pagine di log di logout / log in scritti a mano.

Il formato dei registri può essere d'aiuto. Le pagine sono suddivise in righe e colonne chiaramente delineate (13r x 6c con una riga di intestazione tipizzata extra). Inoltre mi aiuta a capire che tre colonne sono relative a data / ora (data, timeout, ora di inizio). Inoltre, i dati in due delle colonne (risorsa e nome) sono più o meno enumerati, in modo che, ad esempio, il nome "Smith" possa apparire più volte nella colonna del nome, ogni volta con la stessa calligrafia. L'ultima colonna, "Note", è in formato libero, ma se potessi automatizzare le 6 colonne precedenti, non mi dispiacerebbe inserire Note a mano.

Eventuali suggerimenti? (Oltre a "inizia a digitare".)

PS Se c'è un sito SE migliore per chiedere questo, fammi sapere, te lo chiederò.


1
Puoi pubblicare una scansione di esempio del registro?
Martin Thompson,

1
Non preoccuparti di Captricity, ti chiedono la tua e-mail e ti inviano una "e-mail di collegamento" senza un link.

E questo è ciò che accade quando ti confondi con i termini «open source» e «gratuito» ... che hai una società che cerca di trarre vantaggio sul mercato dando l'idea che «open source» è uguale a «cattivo ».
Joan,

Risposte:



4

Se hai meno di 10 pagine, Captricity può farlo gratuitamente.

All'improvviso, non ci sono buone soluzioni open source per quello che stai cercando. Le soluzioni a pagamento costano molto per ottenere la licenza. Questo è basato sulla nostra esperienza nella creazione di un servizio OCR per la calligrafia in Captricity . Usiamo tesseract nella produzione, ma solo come voto combinato con l'intelligenza umana (crowdsourcing) per offrire un alto livello di qualità.

Spero possa aiutare!

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.