Come ottenere righe la cui ennesima colonna contiene l'ennesima colonna


9

Ho un file CSV che contiene domini e e-mail, come questo:

site1.com,mail.site1.com
site2.com,testmail.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site5.com,foomail.com
site6.com,barmail.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site9.com,foobarmail.com
site10.com,mx-smtp222.site10.com

Voglio ottenere righe in cui la colonna dei webmail contiene la colonna dei domini della stessa riga. Per l'esempio sopra, l'output dovrebbe essere:

site1.com,mail.site1.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site10.com,mx-smtp222.site10.com

Risposte:


11

Con awk:

awk -F, '$2 ~ $1"$"' file.csv
  • -F, imposta il separatore di campo come ,

  • $2 ~ $1"$"verifica se il secondo campo termina con il primo campo; in tal caso, stampare il record (azione predefinita)


Con grep, grepper impostazione predefinita, stampa solo le linee corrispondenti:

grep -E '^([^,]+),.*\1$' file.csv

Con sed, le linee di stampa corrispondenti alla condizione:

sed -nE '/^([^,]+),.*\1$/ p' file.csv

Esempio :

% cat file.txt
site1.com,mail.site1.com
site2.com,testmail.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site5.com,foomail.com
site6.com,barmail.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site9.com,foobarmail.com
site10.com,mx-smtp222.site10.com

% awk -F, '$2 ~ $1"$"' file.txt
site1.com,mail.site1.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site10.com,mx-smtp222.site10.com

% grep -E '^([^,]+),.*\1$' file.txt
site1.com,mail.site1.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site10.com,mx-smtp222.site10.com


% sed -nE '/^([^,]+),.*\1$/ p' file.txt 
site1.com,mail.site1.com
site3.com,mx.site3.com
site4.com,smtp.site4.com
site7.com,webmail.site7.com
site8.com,01mx.site8.com
site10.com,mx-smtp222.site10.com
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.