Questa domanda / risposta ha alcune buone soluzioni per eliminare le linee identiche in un file, ma non funzionerà nel mio caso poiché le righe altrimenti duplicate hanno un timestamp.
È possibile dire a awk di ignorare i primi 26 caratteri di una riga nel determinare i duplicati?
Esempio:
[Fri Oct 31 20:27:05 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:10 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:13 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:16 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:21 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:22 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:23 2014] The Brown Cow Jumped Over The Moon
[Fri Oct 31 20:27:24 2014] The Brown Cow Jumped Over The Moon
Potrebbe diventare
[Fri Oct 31 20:27:24 2014] The Brown Cow Jumped Over The Moon
(mantenendo il timestamp più recente)