Come posso usare awk
nella seguente situazione?
Voglio concatenare le linee che iniziano con la stessa colonna. Solo la prima colonna viene mantenuta dopo il join (in questo caso aaa
, www
, hhh
).
Il file può essere separato da spazio o da tabulazione.
Esempio di input:
aaa bbb ccc ddd NULL NULL NULL
aaa NULL NULL NULL NULL NULL NULL
aaa bbb ccc NULL NULL NULL NULL
www yyy hhh NULL NULL NULL NULL
hhh 111 333 yyy ooo hyy uuuioooy
hhh 111 333 yyy ooo hyy NULL
Uscita desiderata:
aaa bbb ccc ddd NULL NULL NULL NULL NULL NULL NULL NULL NULL bbb ccc NULL NULL NULL NULL
www yyy hhh NULL NULL NULL NULL
hhh 111 333 yyy ooo hyy uuuioooy 111 333 yyy ooo hyy NULL
Lo sfondo è che voglio creare un database basato su file molto semplice, in cui la prima colonna è sempre l'identificatore per l'entità. Tutte le righe basate sulla stessa colonna identificatore sono concatenate.
uuu
viene la linea (nell'output)?