Opzioni per l'accesso rapido e il backup di milioni di file
Prendi in prestito da persone con problemi simili
Questo suona molto come un tipo di problema più semplice che deve affrontare i server di notizie USENET e i proxy Web di memorizzazione nella cache: centinaia di milioni di piccoli file a cui si accede in modo casuale. Potresti voler prendere un suggerimento da loro (tranne che in genere non devono mai fare backup).
http://devel.squid-cache.org/coss/coss-notes.txt
http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=4074B50D266E72C69D6D35FEDCBBA83D?doi=10.1.1.31.4000&rep=rep1&type=pdf
Ovviamente la natura ciclica del filesystem di notizie cicliche è irrilevante per te, ma il concetto di livello inferiore di avere più file / dispositivi su disco con immagini compresse e un indice veloce dalle informazioni che l'utente fornisce per cercare le informazioni sulla posizione è molto appropriato.
File system dedicati
Naturalmente, questi sono concetti simili a quelli di cui parlavano le persone creando un file system in un file e montandolo su loopback, tranne per il fatto che si riesce a scrivere il proprio codice del file system. Naturalmente, dal momento che hai detto che il tuo sistema era in gran parte letto, potresti effettivamente dedicare una partizione del disco (o partizione lvm per la flessibilità nel dimensionamento) a questo scopo. Quando si desidera eseguire il backup, montare il filesystem in sola lettura e quindi creare una copia dei bit di partizione.
LVM
Ho menzionato LVM sopra come utile per consentire il dimensionamento dinamico di una partizione in modo che non sia necessario eseguire il backup di molto spazio vuoto. Ma, naturalmente, LVM ha altre caratteristiche che potrebbero essere molto applicabili. In particolare la funzionalità "snapshot" che consente di bloccare un filesystem in un momento. Qualsiasi accidentale rm -rf
o altro non disturberebbe l'istantanea. A seconda di ciò che si sta tentando di fare, ciò potrebbe essere sufficiente per le esigenze di backup.
RAID-1
Sono sicuro che hai già familiarità con RAID e probabilmente lo usi già per affidabilità, ma RAID-1 può essere utilizzato anche per i backup, almeno se stai utilizzando RAID software (puoi usarlo con RAID hardware, ma in realtà offre una minore affidabilità perché potrebbe essere necessario leggere lo stesso modello / controller di revisione). Il concetto è che crei un gruppo RAID-1 con un disco in più di quello di cui hai effettivamente bisogno per le tue normali esigenze di affidabilità (es. Un terzo disco se usi il software RAID-1 con due dischi, o forse un disco grande e un hardware- RAID5 con dischi più piccoli con un software RAID-1 sopra l'hardware RAID-5). Quando arriva il momento di eseguire un backup, installare un disco, chiedere a mdadm di aggiungere quel disco al gruppo raid, attendere fino a quando non indica completezza, facoltativamente chiedere uno scrub di verifica, quindi rimuovere il disco. Ovviamente,