Di recente mi sono imbattuto in Tesseract e OpenCV . Sembra che Tesseract sia un vero e proprio motore OCR e OpenCV può essere utilizzato come framework per creare un'applicazione / servizio OCR.
Ho provato a usare Tesseract su alcune delle mie immagini e la sua accuratezza sembra decente. Successivamente, mi sono imbattuto in un tutorial molto semplice sull'uso di OpenCV per eseguire l'OCR utilizzando Python e sono rimasto colpito. In pochi minuti ho finito di allenare il sistema e la sua precisione era buona. Ma ovviamente, adottare questo approccio significa che ho bisogno di addestrare ampiamente il mio sistema utilizzando un ampio set di addestramento.
Le mie domande specifiche sono le seguenti:
- Come si sceglie tra Tesseract e l'utilizzo di OpenCV per creare un'app OCR personalizzata?
- Sono disponibili set di dati di formazione per Tesseract per diverse lingue. OpenCV ha qualcosa di simile in modo che non debba iniziare da zero per ottenere l'OCR?
- Qual è il migliore per un'applicazione commerciale aspirante?
Eventuali suggerimenti?