In perl 5, puoi emulare wc -l
usando oneliner:
perl -lnE 'END {say $.}' test.txt
Come implementare questa funzionalità su Raku
Se si tenta di implementare questo:
raku -e 'say "test.txt".IO.open.lines.elems'
risulta essere lento e utilizza molta memoria
Informazioni per la riproduzione:
$ wget http://eforexcel.com/wp/wp-content/uploads/2017/07/1500000%20Sales%20Records.zip
$ unzip "1500000 Sales Records.zip"
$ mv "1500000 Sales Records.csv" part.txt
$ for i in `seq 1 10`; do cat part.txt >> test.txt ; done
$ du -sh test.txt
1.8G test.txt
$ time wc -l test.txt
15000000 test.txt
real 0m0,350s
user 0m0,143s
sys 0m0,205s
$ time perl -lnE 'END { say $. }' test.txt
15000001
real 0m1,981s
user 0m1,719s
sys 0m0,256s
$ time raku -e 'say "test.txt".IO.open.lines.elems'
15000001
real 2m51,852s
user 0m25,129s
sys 0m6,378s
# Using swap (maximum uses 2.2G swap):
# Before `raku -e ''`
$ free -m
total used free shared buff/cache available
Mem: 15009 1695 12604 107 708 12917
Swap: 7583 0 7583
# After `raku -e ''`
$ free -m
total used free shared buff/cache available
Mem: 15009 752 13923 72 332 13899
Swap: 7583 779 6804
# Swap not used
$ time raku -ne '++$ andthen END .say' test.txt
15000001
real 1m44,906s
user 2m14,165s
sys 0m0,653s
$ raku -v
This is Rakudo version 2019.11 built on MoarVM version 2019.11
implementing Perl 6.d.
raku
), sarebbe comunque utile avere un raku -v
output. Inoltre, ti preghiamo di considerare di aggiungere l'output dei tempi del mio suggerimento attuale. Inoltre, potrei cercare di passare al 'ascii'
decodificatore più tardi questo fine settimana per produrre un momento migliore.
-l
a margine : il flag per perl rallenta significativamente il perl e non è utile in questo caso. Sulla mia macchina per un file con lunghezza della linea casuale e circa 200k linee, la rimozione -l
comporta un miglioramento del 40%.
wc
(che dovrebbe includere le dimensioni del file). Grazie.