Sto provando a fare un conteggio dei record su un file gzip da 7,6 GB. Ho trovato alcuni approcci usando il zcat
comando.
$ zcat T.csv.gz | wc -l
423668947
Funziona ma richiede troppo tempo (più di 10 minuti per ottenere il conteggio). Ho provato alcuni altri approcci come
$ sed -n '$=' T.csv.gz
28173811
$ perl -lne 'END { print $. }' < T.csv.gz
28173811
$ awk 'END {print NR}' T.csv.gz
28173811
Tutti e tre questi comandi si stanno eseguendo abbastanza velocemente ma dando un conteggio errato di 28173811.
Come posso eseguire un conteggio dei record in un tempo minimo?