C'è un modo per estrarre i caratteri dai file PDF?
So che solitamente i caratteri incorporati nei file PDF sono solo sottoinsiemi dei caratteri. Ad ogni modo, c'è un modo per farlo?
C'è un modo per estrarre i caratteri dai file PDF?
So che solitamente i caratteri incorporati nei file PDF sono solo sottoinsiemi dei caratteri. Ad ogni modo, c'è un modo per farlo?
Risposte:
Vorrei utilizzare Font Forge perché è una soluzione gratuita, open source e multipiattaforma in grado di estrarre i dati dei font dai file PDF.
https://fontforge.github.io/en-US/
Utilizzare la voce di menu File> Apri.
DALLA DOCUMENTAZIONE:
FontForge può anche leggere (molti) caratteri da un file pdf. FontForge di solito non elenca i file pdf (perché non sono realmente progettati come meccanismi per il trasporto dei caratteri e la maggior parte di questi caratteri sarà incompleta a causa del sottoimpostazione e di altre ottimizzazioni), ma puoi sempre digitare direttamente il nome di uno (o utilizzare il Pulsante [Filtro] per definire un filtro per i file pdf).
Qui sto promuovendo il mio commento precedente a una risposta, come suggerito da HackSlash.
C'è una domanda identica su StackOverflow che ha già una risposta accettata eccellente e altamente votata .
Ha illustrato diversi metodi, che elencherò solo brevemente:
Inoltre, vorrei sottolineare che ci sono diversi gratuiti on-line i servizi che offrono di fare proprio questo.
Commento: non ho intenzione di "scegliere l'opzione migliore" poiché il meglio è spesso soggettivo e dipende dalla situazione specifica. La cosa più semplice sarebbe utilizzare un servizio online, ma non sarebbe un'opzione praticabile se il materiale rimanesse privato. FontForge sembra davvero buono soprattutto per coloro che potrebbero già utilizzarlo per la creazione o la modifica dei caratteri. Se non è disponibile alcun ambiente desktop, allora pdftops (e le altre opzioni della riga di comando), sarebbe una buona scelta anche per l'automazione.
Si noti che, a seconda del programma sorgente e dell'autore, potrebbero aver scelto di "convertire i caratteri in contorni", nel qual caso i dati dei caratteri attivi reali non vengono incorporati. Questo era spesso necessario ai tempi dell'output di Postscript e la pratica è ancora trattenuta oggi anche se non è davvero necessaria.
cf. /graphicdesign/55780/is-it-necessary-to-outline-fonts-convert-text-to-curves-before-sending-them-to