Come posso estrarre i caratteri da un file PDF?


15

C'è un modo per estrarre i caratteri dai file PDF?

So che solitamente i caratteri incorporati nei file PDF sono solo sottoinsiemi dei caratteri. Ad ogni modo, c'è un modo per farlo?


Tuttavia, tieni presente che alcuni documenti con caratteri personalizzati sono realizzati come PDF solo allo scopo di rendere tali caratteri non accessibili a tutti. Ciò significa che sono protetti da copyright per i rispettivi proprietari. Il che a sua volta significa che se prevedi di utilizzare quel tipo di carattere protetto da copyright potresti avere molti problemi. Sì, non tutti i font sono gratuiti. Ci sono caratteri che costano anche centinaia di dollari.
Orso scontroso il

1
Uhm ... c'è una domanda identica su StackOverflow che fornisce una serie di soluzioni. Inoltre, sembra che vi siano liberi on-line i servizi che fanno questo.
simlev,

@simlev sembra che tu abbia la risposta. Perché non promuovi il tuo commento a una risposta scegliendo l'opzione migliore?
HackSlash,

Risposte:


1

Vorrei utilizzare Font Forge perché è una soluzione gratuita, open source e multipiattaforma in grado di estrarre i dati dei font dai file PDF.

https://fontforge.github.io/en-US/

Utilizzare la voce di menu File> Apri.

DALLA DOCUMENTAZIONE:

FontForge può anche leggere (molti) caratteri da un file pdf. FontForge di solito non elenca i file pdf (perché non sono realmente progettati come meccanismi per il trasporto dei caratteri e la maggior parte di questi caratteri sarà incompleta a causa del sottoimpostazione e di altre ottimizzazioni), ma puoi sempre digitare direttamente il nome di uno (o utilizzare il Pulsante [Filtro] per definire un filtro per i file pdf).

https://fontforge.github.io/filemenu.html


1

Qui sto promuovendo il mio commento precedente a una risposta, come suggerito da HackSlash.

C'è una domanda identica su StackOverflow che ha già una risposta accettata eccellente e altamente votata .

Ha illustrato diversi metodi, che elencherò solo brevemente:

  1. pdftops
  2. FontForge
  3. MuPDF
  4. uno script ghostscript
  5. pdf-parser.py

Inoltre, vorrei sottolineare che ci sono diversi gratuiti on-line i servizi che offrono di fare proprio questo.

Commento: non ho intenzione di "scegliere l'opzione migliore" poiché il meglio è spesso soggettivo e dipende dalla situazione specifica. La cosa più semplice sarebbe utilizzare un servizio online, ma non sarebbe un'opzione praticabile se il materiale rimanesse privato. FontForge sembra davvero buono soprattutto per coloro che potrebbero già utilizzarlo per la creazione o la modifica dei caratteri. Se non è disponibile alcun ambiente desktop, allora pdftops (e le altre opzioni della riga di comando), sarebbe una buona scelta anche per l'automazione.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.