Ho a che fare con un file che ha molti caratteri di controllo invisibili, come "da destra a sinistra" o "non-joiner a larghezza zero", spazi diversi dallo spazio normale e così via, e ho problemi a gestirlo.
Ora, vorrei in qualche modo visualizzare tutte le lettere in un dato file, lettera per lettera (vorrei dire "da sinistra a destra", ma purtroppo mi occupo della lingua da destra a sinistra) , come punti di codice unicode, usando solo strumenti di bash di base (come vi
, less
, cat
...). È possibile in qualche modo?
So che posso visualizzare il file in formato esadecimale hexdump
, ma dovrei ricalcolare i punti di codice. Voglio davvero vedere i punti di codice Unicode attuali, quindi posso cercarli su Google e scoprire cosa sta succedendo.
modifica: aggiungerò che non voglio transcodificarlo in una codifica diversa (perché è quello che sto scoprendo online). Ho il file in UTF8 e va bene. Voglio solo conoscere i punti di codice esatti di tutte le lettere.