Ho un file che assomiglia a questo:
ID101 G T freq=.5 nonetype ANC=.1 addinfor
ID102 A T freq=.3 ANC=.01 addinfor
ID102 A T freq=.01 type=1 ALT=0.022 ANC=.02 addinfor
Come puoi vedere, ogni riga ha un numero leggermente diverso di colonne. Voglio specificamente la colonna 1, la colonna 2, la colonna 3, la colonna 4 e la colonna che inizia conANC=
Uscita desiderata:
ID101 G T freq=.5 ANC=.1
ID102 A T freq=.3 ANC=.01
ID102 A T freq=.01 ANC=.02
In genere utilizzo il comando an awk per analizzare i file:
awk 'BEGIN {OFS = "\t"} {print $1, $2, $3, $4}'
C'è un modo semplice per modificare questo comando per lavorare in situazioni come questa?
Penso che qualcosa del genere potrebbe funzionare:
awk '{for(j=1;j<=NF;j++){if($j~/^ANC=/){print $j}}}'
Tuttavia, come posso modificarlo per stampare anche le prime colonne?
i=5
?