Ho un file html con molto testo UTF-8 con codifica% negli URL.
Ad esempio "% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B" sta per "ресурсы" ("risorse" in russo).
Il compito è sostituire tutte queste sottostringhe con testo UTF-8 leggibile.
Per semplificare l'attività possiamo considerare che non vi è alcun altro %
utilizzo dei segni nel file. Le cifre delle lettere possono essere sia maiuscole che minuscole.
Ho il sospetto che questo può essere fatto con eleganza sed
, perl
, awk
o qualcosa, ma non so come.
Questa applicazione web sembra fare il trucco con il testo incollato lì.