Per il layout abbiamo il nostro famoso testo "Lorem ipsum" per verificarne l'aspetto.
Quello che sto cercando è un insieme di file contenenti testo codificato con diverse codifiche diverse che posso utilizzare nei miei test JUnit per testare alcuni metodi che hanno a che fare con la codifica dei caratteri durante la lettura di file di testo.
Esempio:Avere un ISO 8859-1
file di Windows-1252
prova codificato e un file di prova codificato. Windows-1252 deve attivare le differenze nella regione 80 16 - 9F 16 . In altre parole, deve contenere almeno un carattere di questa regione per distinguerlo da ISO 8859-1.
Forse il miglior set di file di test è quello in cui il file di test per ogni codifica contiene tutti i suoi caratteri una volta. Ma forse non sono a conoscenza di qc - a tutti noi piace questa roba di codifica, giusto? :-)
Esiste una tale serie di file di prova per problemi di codifica dei caratteri?