Sono uno studente laureato e il gruppo in cui lavoro mantiene un cluster Linux. Ogni nodo del cluster ha il proprio disco locale, ma questi dischi locali sono relativamente piccoli e non sono dotati di backup automatico. Quindi il gruppo possiede un file server con molti TB di spazio di archiviazione. Sono un novizio Linux relativo, quindi non sono sicuro di quali siano le specifiche del file server in termini di velocità, capacità di rete, ecc. So per esperienza che i dischi locali sono significativamente più veloci del file server in termini di I / O . Circa una dozzina di persone usano il file server.
L'uso cp
per copiare un file di ~ 20 GB dal fileserver su uno dei dischi locali richiede in media circa 11,5 minuti in tempo reale (secondo time
). So che questa cp
operazione non è molto efficiente perché (1) time
mi dice che il tempo di sistema per tale copia è di soli ~ 45 secondi; e perché (2) quando esamino top
durante la copia, % CPU è piuttosto bassa (mediante ispezione, circa lo 0-10% in media).
L'uso cp
per copiare lo stesso file di ~ 20 GB da una cartella sul disco locale in un'altra cartella sullo stesso disco locale richiede meno tempo - circa 9 minuti in tempo reale (~ 51 secondi nell'ora di sistema, secondo time
). Quindi apparentemente il fileserver è un po 'più lento del disco locale, come previsto, ma forse non significativamente più lento. Sono sorpreso che la copia da locale a locale locale non sia più veloce di 9 minuti.
Devo copiare ~ 200 file di grandi dimensioni - ciascuno ~ 20 GB - dal file server a uno dei dischi locali. Quindi, la mia domanda è: esiste un'alternativa più veloce alla cp
copia di file di grandi dimensioni in Linux? (O ci sono delle bandiere all'interno cp
che potrei usare che accelererebbero la copia?) Anche se in qualche modo potessi radere un minuto di tempo durante questa copia, ciò aiuterebbe immensamente.
Sono sicuro che l'acquisto di nuovi dischi hardware più veloci, ma non ho accesso a tali risorse. Inoltre non sono un amministratore di sistema - sono solo un utente (principiante) - quindi non ho accesso a informazioni più dettagliate sul carico che si trova sui dischi. So che mentre una dozzina di persone usano quotidianamente il fileserver, sono l'unica persona che usa questo particolare nodo / disco locale.
dd
e rsync
confrontare i quali si lavora più velocemente nel proprio ambiente
dd
, ma ho appena provato rsync
. Il tempo reale era di circa 11,5 minuti e il tempo di sistema era di circa 1,5 minuti, secondo time
.
/dev/sda1
a /dev/sdb1
sarà più veloce della copia da una posizione /dev/sda1
a un'altra /dev/sda1
o su un'altra partizione accesa /dev/sda
perché il disco rigido non dovrà effettuare ulteriori ricerche tra letture e scritture (supponendo che i dischi rigidi tradizionali con dischi rotanti e teste mobili; SSD è ovviamente diverso).