Come trovare gli ultimi 2 caratteri dei nomi cinesi con gli strumenti delle righe di comando?


1

Ho una lista di nomi cinesi, alcuni di loro hanno 2 caratteri, altri possono avere più o meno, come segue:

enter image description here

Voglio utilizzare alcuni strumenti da riga di comando, per trovare gli ultimi 2 caratteri di ciascuno. Se non contiene 2 caratteri, ignoralo.

Il risultato sarà:

enter image description here

Come farlo con grep / awk / sedo altri strumenti?


aggiornato:

I personaggi sono in sintesi ora:

https://gist.github.com/freewind/6e67b76e8280ccea185c


2
@stackoverflow, puoi smettere di pensare che sto inviando spam solo perché ho inserito alcuni caratteri cinesi ?!
Freewind

Puoi incollare l'input attuale? Non possiamo testare le nostre soluzioni contro le immagini.
choroba

@ choroba, aggiunto alla domanda, grazie
Freewind

Risposte:


2

Perl al salvataggio:

perl -CSD -lne 'print $1 if /(..)$/' input-file
  • -CSD attiva UTF-8 per l'input e l'output su STDIN, STDOUT e flussi di input e output.
  • -l aggiunge newline a print
  • -n legge l'input riga per riga

1
-CIO attiva utf8 per stdin e stdout. -Cio giri :utf8 acceso per l'input e l'output di PerlIO. Probabilmente lo vuoi -CIOio
Matt
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.