Su Linux, ho una directory con molti file. Alcuni di essi hanno caratteri non ASCII, ma sono tutti UTF-8 validi . Un programma ha un bug che gli impedisce di lavorare con nomi di file non ASCII e devo scoprire quanti ne sono interessati. Stavo per fare questo con find
e poi fare un grep per stampare i caratteri non ASCII, quindi fare un wc -l
per trovare il numero. Non deve essere grep; Posso usare qualsiasi espressione regolare standard Unix , come Perl , sed , AWK , ecc.
Tuttavia, esiste un'espressione regolare per "qualsiasi carattere che non sia un carattere ASCII"?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]