In Notepad ++ la codifica di un file è impostata su UTF-8 ma la codifica è in realtà ASCII


0

Ho bisogno che alcuni file di testo siano codificati come file di testo UTF-8 quando li uso con Notepad ++. Tuttavia, a volte ho UTF-8 selezionato come codifica in Notepad ++, ma il file è in realtà in ASCII. Lo so con due metodi diversi.

Il primo metodo è che utilizzo un semplice motore wiki chiamato Mobiki su XAMPP che visualizzerà correttamente solo i caratteri speciali codificati UTF-8. Il mio file di testo non viene visualizzato correttamente con Mobiki. Il secondo metodo che ho usato per verificare implementa la pagina web http://www.checkfiletype.com . Quando carico i file problematici su quella pagina, il sito web mi dice che il file è codificato nel formato ASCII. Le altre pagine che funzionano con Mobiki sono codificate nel formato UTF-8 come restituito dal sito Web.

Perché Notepad ++ non impone che il file sia un file UTF-8 e / o come posso fare che Notepad ++ faccia questo? Ho provato a selezionare "Converti in UTF-8" anche se Notepad ++ mostra che il file è già codificato in UTF-8, ma forzare questa conversione non ha aiutato.

Ho trovato altri post sul forum che descrivono un problema simile, ma la loro soluzione era solo quella di creare un nuovo file di testo. Spero di trovare una soluzione senza creare un nuovo file di testo.


Grazie per l'informazione. Sì per quel file, Notepad ++ visualizza UTF-8 nell'angolo in basso a destra, ma questo sembra essere sbagliato. Il file ha problemi con la mia wiki e il sito web checkfiletype.com mostra che è ASCII. Pertanto, forse questo è un bug, come hai indicato, potrebbe essere possibile.
Azim58,


È possibile che il file codificato come UTF-8 abbia una "BOM" (segno di ordine dei byte) codificata nei primi tre byte? Questa distinta base non ha senso per UTF-8 perché solo UCS-2 / UTF-16 / UCS-4 si preoccupano dell'ordine dei byte. Ma alcuni editor lo abusano come marchio di codifica UTF.
Zan Lynx,

Risposte:


1

I file che contengono solo caratteri ASCII sono rappresentati in modo identico nelle codifiche ASCII e UTF-8. Non c'è alcuna differenza tra i due a meno che il file non contenga almeno un carattere non ASCII.

Qualunque sia la causa del tuo problema non è la codifica.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.