Ho file di 3 colonne di grandi dimensioni (~ 10.000 righe) e vorrei rimuovere le righe quando il contenuto della terza colonna di quella riga appare nella terza colonna di un'altra riga. Le dimensioni dei file rendono l'ordinamento un po 'ingombrante e non posso usare qualcosa come il codice qui sotto perché le intere righe non sono identiche; solo il contenuto della colonna 3.
awk '!seen[$0]++' filename
-u
avrebbe rimosso solo le righe duplicate , non le chiavi duplicate ... ma mi sbaglio.