Ho un file che contiene circa un milione di righe. Nelle righe ho un campo chiamato transactionid
, che ha valori ripetitivi. Quello che devo fare è contarli distintamente.
Indipendentemente da quante volte un valore viene ripetuto, dovrebbe essere conteggiato una sola volta.
... No matter of how many times a value is repeated, it should be counted as 1. ...
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
la clausola if era per un altro controllo della data come sembra ovvio :)