Il comando può essere condensato in questo modo se si utilizza GNU sed
:
$ sed 's/^[ \t]*//;s/[ \t]*$//' < file
Esempio
Ecco il comando sopra in azione.
$ echo -e " \t blahblah \t " | sed 's/^[ \t]*//;s/[ \t]*$//'
blahblah
È possibile utilizzare hexdump
per confermare che il sed
comando sta rimuovendo correttamente i caratteri desiderati.
$ echo -e " \t blahblah \t " | sed 's/^[ \t]*//;s/[ \t]*$//' | hexdump -C
00000000 62 6c 61 68 62 6c 61 68 0a |blahblah.|
00000009
Classi di personaggi
Puoi anche usare i nomi delle classi di caratteri invece di elencare letteralmente i set in questo modo [ \t]
:
$ sed 's/^[[:blank:]]*//;s/[[:blank:]]*$//' < file
Esempio
$ echo -e " \t blahblah \t " | sed 's/^[[:blank:]]*//;s/[[:blank:]]*$//'
La maggior parte degli strumenti GNU che utilizzano espressioni regolari (regex) supportano queste classi.
[[:alnum:]] - [A-Za-z0-9] Alphanumeric characters
[[:alpha:]] - [A-Za-z] Alphabetic characters
[[:blank:]] - [ \x09] Space or tab characters only
[[:cntrl:]] - [\x00-\x19\x7F] Control characters
[[:digit:]] - [0-9] Numeric characters
[[:graph:]] - [!-~] Printable and visible characters
[[:lower:]] - [a-z] Lower-case alphabetic characters
[[:print:]] - [ -~] Printable (non-Control) characters
[[:punct:]] - [!-/:-@[-`{-~] Punctuation characters
[[:space:]] - [ \t\v\f] All whitespace chars
[[:upper:]] - [A-Z] Upper-case alphabetic characters
[[:xdigit:]] - [0-9a-fA-F] Hexadecimal digit characters
L'utilizzo di questi set anziché di set letterali sembra sempre uno spreco di spazio, ma se sei preoccupato che il tuo codice sia portatile o che tu abbia a che fare con set di caratteri alternativi (pensa a livello internazionale), probabilmente vorrai usare i nomi delle classi anziché.
Riferimenti