Fondamentalmente sto cercando di vedere se esiste uno strumento o uno script in grado di rilevare file spostati o rinominati in modo da poter ottenere un elenco di file rinominati / spostati e applicare la stessa operazione sull'altra estremità della rete per risparmiare sulla larghezza di banda.
Fondamentalmente l'archiviazione su disco è economica ma la larghezza di banda non lo è, e il problema è che i file vengono spesso riorganizzati o spostati in una struttura di directory migliore, quindi quando si utilizza rsync per eseguire il backup, rsync non noterà che è un nome rinominato o ha spostato il file e lo ha ritrasmesso nuovamente sulla rete, nonostante abbia lo stesso file all'altra estremità.
Quindi mi chiedo se esiste uno script o uno strumento in grado di registrare dove sono tutti i file e i loro nomi, quindi appena prima di un backup, eseguirà una nuova scansione e rileverà i file spostati o rinominati, quindi posso prendere quell'elenco e riapplicare l'operazione sposta / rinomina dall'altro lato.
Ecco un elenco delle funzionalità "generali" dei file:
- Grandi file invariati
- Possono essere rinominati o spostati
[Modifica:] Queste sono tutte buone risposte, e quello che alla fine faccio alla fine è stato guardare tutte le risposte e scriverò un codice per affrontare questo. Fondamentalmente quello che sto pensando / lavorando ora è:
- Usare qualcosa come AIDE per la scansione "iniziale" e consentirmi di mantenere i checksum sui file perché non dovrebbero mai cambiare, quindi aiuterebbe a rilevare la corruzione.
- Creazione di un demone inotify che monitorasse questi file / directory e registrasse qualsiasi modifica relativa alla ridenominazione e spostando i file in un file di registro.
- Ci sono alcuni casi limite in cui inotify potrebbe non riuscire a registrare che qualcosa è successo al file system, quindi c'è un passaggio finale nell'uso di find per cercare file nel file system che hanno un tempo di cambio più recente dell'ultimo backup .
Ciò ha diversi vantaggi:
- Checksums / etc da AIDE per poter verificare / assicurarsi che alcuni media non siano stati corrotti
- Inotify mantiene basso l'utilizzo delle risorse e non è necessario ripetere la scansione del file system
- Non è necessario patchare rsync; Se devo correggere le cose che posso, ma preferirei evitare di correggere le cose per mantenere il carico più basso, (IE non ha bisogno di ricollegare ogni volta che c'è un aggiornamento).
- Ho usato Unison in precedenza ed è davvero bello, tuttavia avrei potuto giurare che Unison conserva copie sul filesystem e che i suoi file di "archivio" possono diventare piuttosto grandi?