Soluzioni di archiviazione automatica a più livelli fatte in casa con Linux? (Memoria -> SSD -> HDD -> memoria remota)


13

In relazione a questa domanda sull'utilizzo di un SSD per il sistema e HDD per i dati , tranne per il fatto che il mio sistema lo faccia automaticamente ...

È possibile avere diversi livelli di archiviazione e spingere gli elementi automaticamente tra di loro, utilizzando preferibilmente software open source gratuito?

Conosco soluzioni di classe enterprise estremamente costose come l' archiviazione automatica EMC SAN-> EMC Centera , ma mi chiedevo se questo tipo di archiviazione temporanea è possibile eseguire automaticamente.

Sarebbe bello poter avere diversi livelli in questo: Memoria-> SSD-> HDD-> HDD o nastro più lento o qualche altra soluzione di archiviazione.

Ci sono dei filesystem che possono farlo automaticamente? (ZFS, Btrfs, HAMMER?)

Qualunque variante di Unix va bene, poiché sono interessato a come funziona e se è probabile che sia portabile su Linux o altre versioni (BSD ecc.).

Risposte:


14

Bene, ZFS utilizza un livello di archiviazione chiamato Hybrid Storage Pool (HSP) :

  1. Strato: memoria
  2. Livello: cache di lettura basate su SSD (L2ARC) e cache di scrittura (registro di intenti separato aka slog).
  3. Strato: hard disk (economici)

Con HSP è facile trarre automaticamente vantaggio dai vantaggi degli SSD rispetto a una soluzione solo su disco rigido. Un sistema che utilizza HSP può essere sia più veloce sia più economico di quest'ultimo. Vedi questo link per alcuni esempi e ulteriori dettagli.

Penso che ci siano piani riguardanti la gestione gerarchica dell'archiviazione (HSM) per ZFS (vedi ad esempio il progetto OpenSolaris di Automatic Data Migration (ADM) ) ma non conosco il suo stato attuale.


Questo è proprio quello a cui stavo pensando, grazie! (Ora per aiutare sulla porta Linux ...;)
David Gardner,

Non definirei questa suddivisione in livelli ma la memorizzazione nella cache. Nel senso che la memorizzazione nella cache significa mantenere una copia dei blocchi utilizzati di frequente, spostando i dati in livelli più lentamente / più velocemente. Non definirei il registro degli intenti in ZFS una vera cache di scrittura se lo capissi correttamente.
mrossi,


5

TIER sembra rispondere alle tue esigenze È un modulo del kernel linux che può creare una memoria a più livelli. Sembra apprendere da solo il modello e ottimizzare il posizionamento nella memoria

http://www.lessfs.com/wordpress/?p=776


Ho appena visto che la domanda è vecchia ... Mi dispiace ^^ '
Dolanor

2
Rivitalizzare vecchie domande è meglio che poi marcire con informazioni vecchie e obsolete su di esse!
David Gardner,

Sono preoccupato che questo ragazzo voglia ridurre la ridondanza per motivi di capacità extra (specialmente quando gli SSD sono relativamente piccoli e inaffidabili).
Tobu,

Preoccupato anche di suggerire il raid come soluzione, quando il software sperimentale ha più bisogno di backup.
Tobu,

Ecco un po 'di feedback più positivo però: permalink.gmane.org/gmane.comp.file-systems.ceph.devel/8316
Tobu

1

Rispondere alla mia domanda con qualcosa che ho appena trovato:

Stavo solo aggiornando il kernel e guardando le nuove cose che sono state aggiunte, e ora c'è un'opzione 'CACHEFILES' che consente di memorizzare nella cache (di solito remoti) filesystem su un filesystem locale. Immagino di poterlo utilizzare per memorizzare nella cache un meccanismo di archiviazione più lento (HDD) in uno più veloce (SSD), almeno per un livello di gerarchia.


Hai provato questa soluzione? Come si esibisce?
skolima,

1
Nevermind - Ho scoperto che CacheFS per ora supporta solo NFS e AFS.
skolima,

Usando i filesystem di rete per questo non è una cattiva idea, tendono a maturare molto più velocemente dei set di patch del kernel. Mi chiedo se Ceph o DRBD abbiano modalità utili per l'archiviazione a più livelli.
Tobu,

1

Alcuni link pertinenti. YMMV.

http://code.google.com/p/fscops/ - "Online Hierarchical Storage Manager (OHSM) è il primo tentativo verso un gestore dell'archiviazione di dati open source a livello aziendale che sposta automaticamente i dati tra archiviazione a basso costo e basso costo media.".

http://www.tack.ch/unix/dmapi/ - XFS + DMAPI sotto Linux

http://jfs.sourceforge.net/ - JFS + DMAPI sotto Linux


Il progetto OHSM sembra interessante da seguire. Solo ext2 e il kernel 2.6.30 sono supportati per ora, ma mi aspetto che se funzionerà bene, questo otterrà più filesystem.
David Gardner,

Quel progetto sembra abbandonato, l'attività più recente è stata nel 2009.
sendmoreinfo,


0

Mi vengono in mente le istantanee LVM2 ... ma non puoi davvero fare più di una singola istantanea.


0

SAM-QFS è il prodotto esistente di Sun ed è stato aperto l'anno scorso. È CDDL, quindi puoi solo portarlo direttamente su * BSD.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.