Ho dei file ZIP, che contengono file, i cui nomi di file sono in qualche codifica. Diciamo che conosco la codifica di quei nomi di file, ma non so ancora come decomprimerli correttamente.
Ecco un file di esempio , contiene un file "【SSK 字幕 组】 The Vampire Diaries 吸血鬼 日记 S06E12.ass"
So che la codifica utilizzata è GB18030 (cinese)
La domanda è: come decomprimere quel file in FreeBSD usando unzip o altra utility CLI per ottenere il nome file codificato corretto? Ho provato tutto quello che potevo, ma il risultato non è mai stato buono. Per favore aiuto.
Ho provato su OSX:
MBP1:test 2ge$ bsdtar xf gb18030.zip
MBP1:test 2ge$ ls
%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12/ gb18030.zip
MBP1:test 2ge$ cd %A1%BESSK%D7%D6Ļ%D7顿The\ Vampire\ Diaries\ %CE%FCѪ%B9%ED%C8ռ%C7S06E12/
MBP1:%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12 2ge$ ls
%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12.ass*
MBP1:%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12 2ge$ find . | iconv -f gb18030 -t utf-8
.
./%A1%BESSK%D7%D6L抬%D7椤縏he Vampire Diaries %CE%FC血%B9%ED%C8占%C7S06E12.ass
MBP1:%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12 2ge$ convmv -r -f gb18030 -t utf-8 --notest .
Skipping, already UTF-8: ./%A1%BESSK%D7%D6Ļ%D7顿The Vampire Diaries %CE%FCѪ%B9%ED%C8ռ%C7S06E12.ass
Ready!
Ho provato simili con decomprimere, ma ho un problema simile.
Grazie, ora provo su BSD GRATUITO, dove mi collego usando SSH da OSX (Terminale):
# locale
LANG=
LC_CTYPE="C"
LC_COLLATE="C"
LC_TIME="C"
LC_NUMERIC="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_ALL=C
La prima cosa che vorrei è mostrare correttamente i nomi cinesi. Ho cambiato
setenv LC_ALL zh_CN.GB18030
setenv LANG zh_CN.GB18030
Quindi ho scaricato il file e ho provato a "ls" per vedere i caratteri corretti, ma non la fortuna. Quindi penso di dover risolvere il primo locale cinese per verificare quando ottengo il risultato corretto, in realtà posso confrontarlo. Potete aiutarmi anche per favore con questo?