Come posso modificare il testo Unicode in Notepad ++?


26

A volte modifico testo inglese che include caratteri Unicode. Per qualche motivo, sul mio PC, Notepad ++ converte i caratteri Unicode in ??? corrompendo così il testo e perdendo tutti quei dati. Sto cercando un modo per modificare tale testo, preservando i caratteri Unicode. Sto usando Consolas come il mio carattere. Se il carattere non ha tutti quei caratteri, perché dovrei perdere i dati quando copio il testo da Notepad ++ (tramite gli appunti di Windows)?


È possibile che tu stia utilizzando un plug-in che non supporta Unicode?
Ivo Flipse,

Se quelli sono punti interrogativi in ​​riquadri, in realtà è il glifo del carattere per glifi mancanti e i dati non vengono persi.
Joey,

No, non è nelle scatole, invece è la semplice "?" personaggio. Confermato.
Robinicks

1
potrebbe essere necessario modificare il carattere. vedi superuser.com/questions/16831/…
RamyenHead

Risposte:


15

Se il file è effettivamente codificato in Unicode, Notepad ++ dovrebbe rilevarlo automaticamente. Il carattere Consolas funziona bene per me. Puoi provare una di queste due opzioni di menu:

  • Codifica -> Codifica in UTF-8
  • Codifica -> Converti in UTF-8

Sono abbastanza sicuro che il primo farà quello che vuoi.


Non ho il menu Formato.
Val

1
Per i posteri, è necessario il menu Codifica, non Formato
Ken Bellows,

15

Il problema descritto nella domanda si verifica quando un documento vuoto / nuovo è impostato su "ANSI" e in esso vengono incollati caratteri Unicode .

Non viene rilevato alcun rilevamento automatico se utilizzato con un documento vuoto / nuovo, almeno non nella versione di Notepad ++ su cui l'ho provato (v5.4.5). "ANSI" è l'impostazione predefinita in Notepad ++ per un nuovo documento, a meno che non sia impostato nel menu ImpostazioniPreferenze → scheda Nuovo documento / Apri directory di salvataggio .

Soluzione

La soluzione è impostare la codifica su UTF-8 prima di incollare, menu FormatoCodifica in UTF-8 :

Il comando di menu "menu Formato / Codifica in UTF-8" sta per essere eseguito

Esempio

Ho copiato del testo in un nuovo documento di Notepad ++, il russo (русский язык, russkiy yazyk) , da Firefox che mostra la pagina Wikipedia in lingua russa .

Se la codifica non viene modificata da "ANSI" questo è il risultato:

Risultato dell'incollare la stringa Unicode "Russian (русский язык, russkiy yazyk" in un nuovo documento di Notepad ++ senza modificare la codifica dal "ANSI" predefinito.

Se la codifica viene modificata, questo è il risultato:

Risultato dell'incollare la stringa Unicode "Russian (русский язык, russkiy yazyk" in un nuovo documento Notepad ++ dopo aver modificato la codifica da "ANSI" predefinita a "UTF-8".

Come si può vedere nella figura seguente (la parte cirillica è evidenziata), Notepad ++ in realtà converte i caratteri Unicode in ASCII 63 (esadecimale 3F), punti interrogativi. Ecco perché i caratteri Unicode sono persi (in "ANSI" mode) quando si copia il testo attraverso la clipboard (è non è un problema di carattere - la perdita di informazioni).

Schermata di una vista esadecimale di detto documento

Testato su: Notepad ++ v5.4.5 (UNICODE).


5

Ci sono buone e cattive notizie.

Buone notizie: Notepad ++ supporta Unicode (almeno da quello che posso raccogliere).

Cattive notizie: a quanto pare il supporto Unicode è solo su Windows XP.

In realtà non ho una macchina Windows di fronte a me. Da quello che ricordo, c'è un menu Codifica sotto il menu Formato da qualche parte. La codifica per Unicode è in realtà più comunemente UTF-8.

Ecco un'immagine "carina" del supporto Unicode in Notepad ++,

inserisci qui la descrizione dell'immagine


3

Unicode funziona perfettamente su Windows 7. L'unico problema che si presenta è che devi digitare nuovamente i caratteri che sono stati modificati. Mi è successo. Sto scrivendo con lettere scandinave quindi ä -> E4, ö -> F6. Sostituirle tutte è una seccatura, ma ne vale la pena.

Se si codifica una pagina da ANSI -> UTF-8, si verificheranno alcuni problemi di carattere.

Suggerirei di creare prima una nuova pagina in UTF-8 e quindi di copiare / incollare le informazioni. Allora non ci saranno / non dovrebbero esserci problemi.


1

Questo ha funzionato per me:

Ho cambiato il font in Courier New in style configurator sul mio PC (Windows 7 con set di caratteri inglese / USA e rumeno per set non Unicode). Funziona con i caratteri Courier New & Tahoma + codifica UTF-8.


0

Nel menu in alto selezionare Encodingquindi scegliere Encode in UTF-8o Encode in UTF-8 Without BOMquindi è possibile modificare il testo con la codifica Unicode.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.