Ho bisogno di convertire i file PDF in EPS .. Poi ho bisogno di rimuovere tutto il testo e le immagini .. Finora funziona
pdftocairo -f 1 -l 1 -eps test.pdf - | sed '/BT/,/ET/ d' | sed '/^8 dict dup begin$/,/^Q$/ c Q' > no_text_and_images.eps
Ma come verificare se il file EPS contiene anche il vettore? Ho bisogno di fare qualche OCR sull'output - ma solo se il vettore è presente nel file .. Se contiene solo testo e immagini non voglio usare le risorse per eseguirlo attraverso un processo OCR
File di esempio: http://docdro.id/yJZTGBt