Ho un PC con CPU Intel (R) Pentium (R) G640 a 2,80 GHz e 8 GB di RAM. Sto usando Scientific Linux 6.5 su di esso con il filesystem EXT3.
Con questa configurazione, qual è il modo più veloce che posso fare sort -u
su un file da 200 gigabyte?
Devo dividere il file in file più piccoli (inferiori a 8 GB) sort -u
, metterli insieme, quindi dividerli di nuovo in una dimensione diversa, di sort -u
nuovo, ecc.? O ci sono script di ordinamento, programmi che potrebbero gestire file così grandi con la mia quantità limitata di RAM?
parallel
piuttosto che dei moreutils parallel
installati di default su alcuni sistemi.
sort(1)
potrebbe rimanere senza spazio /tmp
; in tal caso, puoi designare un'altra area per i file temporanei con la variabile di ambiente TMPDIR
o flag-T=<tmpdir>
/tmp
.