Ho i miei riferimenti come file di testo con un lungo elenco di voci e ognuno ha due (o più) campi.
La prima colonna è l'URL del riferimento; la seconda colonna è il titolo che può variare leggermente a seconda di come è stata effettuata la voce. Lo stesso vale per il terzo campo che può essere presente o meno.
Voglio identificare ma non rimuovere le voci che hanno il primo campo (url di riferimento) identico. Lo so, sort -k1,1 -u
ma questo rimuoverà automaticamente (in modo non interattivo) tutto tranne il primo colpo. C'è un modo per farmelo sapere in modo che io possa scegliere quale conservare?
Nell'estratto di seguito di tre righe che hanno lo stesso primo campo ( http://unix.stackexchange.com/questions/49569/
), vorrei mantenere la riga 2 perché ha tag aggiuntivi (ordinamento, CLI) ed elimina le righe n. 1 e n. 3:
http://unix.stackexchange.com/questions/49569/ unique-lines-based-on-the-first-field
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field sort, CLI
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field
Esiste un programma per aiutare a identificare tali "duplicati"? Quindi, posso ripulire manualmente eliminando personalmente le righe n. 1 e n. 3?