MDADM Raid Recovery and Questions


0

Ho lavorato in questo nella mia testa per l'intera giornata, e volevo espandermi e ottenere feedback / opinioni su questa configurazione e su come posso gestirla se dovesse accadere che fallisse.

Ho un sistema Ubuntu Server in cui il filesystem vive su un disco relativamente piccolo da solo, e i dati principali che memorizza si trovano su 5 dischi configurati in RAID5 utilizzando MDADM.

I dati memorizzati nell'array RAID hanno una priorità media. Non esistono dati personali sensibili degli utenti, quindi una perdita non significherebbe la fine del mondo. Tuttavia, mi piacerebbe un po 'di ridondanza mentre aumentavo le unità, quindi RAID 5 è la scelta più ovvia.

Quindi, se un'unità nell'array fallisce, posso potenzialmente sostituirla prima che accada qualcosa di catastrofico. Se un'altra unità si guasta mentre il primo viene sostituito, sono stato colpito da un lampo di luce sfortunata.

Quello che mi sto chiedendo è cosa posso fare con l'unità che contiene il sistema operativo. In questo momento, quello che sto facendo è utilizzare rsync per eseguire il backup dei dati in una posizione remota una volta la notte. E una volta alla settimana, quella postazione remota filtra il filesystem e lo memorizza (manterrà sempre 4 dei più recenti tarball). La mia logica è che questo si traduce nel traffico più basso tra le scatole, il che è positivo poiché il server risiede a casa mia, eppure avrò una sorta di backup settimanali "completi" sul lato remoto e un backup notturno. La riga rsync nel mio script di backup è la seguente:

rsync --info=progress2 --numeric-ids -aAXPve ssh /* <remote>:~/server_backup --exclude=~/Download/* --exclude=/dev/* --exclude=/proc/* --exclude=/sys/* --exclude=/tmp/* --exclude=/run/* --exclude=/mnt/* --exclude=/media/* --exclude=/lost+found --delete

Ad ogni modo, ho riscontrato malfunzionamenti delle unità sull'array RAID. È facile e ti sembra soddisfacente sapere che tutto ciò che devi fare è sostituirlo, dire a MDADM che hai sostituito l'unità e attendere un giorno o due affinché la nuova unità venga completamente aggiunta all'array. Devo ancora riscontrare il fallimento del drive del filesystem, comunque. Ecco perché sto cercando di ottenere opinioni / feedback su cosa dovrei fare.

Ho preso in considerazione l'aggiunta di un'altra piccola unità per il sistema operativo, e il mirroring dei due utilizzando RAID 1. Il lato positivo, suppongo, è che se un disco completamente si dissecca, l'altro salverà il mio filsystem. Il rovescio della medaglia è che se c'è una sorta di corruzione, o davvero rovino qualcosa, i dati vengono immediatamente copiati da entrambi i dispositivi. Fondamentalmente mi piace l'idea di avere backup incrementali e completi più di una installazione speculare per il filesystem.

Ok, ma allora cosa succede quel giorno fedele quando il drive del filesystem alla fine fallisce? Vado al negozio, compro una nuova unità, la collego, poi cosa succede?

Devo installare Ubuntu sull'unità e invertire il comando rsync? Cosa succede alla mia partizione RAID? Questo è un modo per chiedere, dove si trova il RAID metadati essere immagazzinato? Era sul disco del sistema operativo? È arrivato al mio repository remoto che contiene i backup incrementali tramite rsync? Risiede esclusivamente nel superblocco delle unità RAID stesse?

Se vado a prendere una nuova unità per il filesystem, installo Ubuntu e lo aggiungo al mio server, cosa vedrà? Vedrà l'array?

Se poi rsync tutte le mie modifiche dal server di backup remoto al mio server locale, lo farà poi vedi l'array?

O sbaglio nell'assumere entrambi i casi?

Voglio essere preparato per quando questa pulsione alla fine muore. Sono stato diligente nel fare backup rsync off-site, ma voglio sapere con certezza se tutto quello che ho fatto è un'enorme perdita di tempo, e cosa posso fare per assicurare che posso continuare ad usare il mio sistema dopo un errore catastrofico dell'unità che contiene il filesystem.


1) se il raid fallisce spesso penso che dovresti avere un raid10. raid 10 è uno specchio di 2 raid5. Per quanto riguarda il fare pieno i backup ogni notte potrebbero essere un po 'schiaccianti. dovresti fare dei backup solo quando qualcosa cambia. 2) L'unico modo per far funzionare il sistema operativo da un raid 1 è avere un controller raid hardware, non funzionerà con mdadm come il suo a Software controller raid. queste sono molte domande Se il tuo sistema operativo dovesse morire o essere danneggiato, le informazioni per il raid sono memorizzate sul sistema operativo. Quindi installare un altro OS non funzionerà se la configurazione originale del raid sul vecchio sistema operativo fosse andata male
xR34P3Rx

di nuovo, capisci che hai a che fare con a SOFTWARE Controller RAID. Quindi, per evitare di perdere la configurazione RAID se il sistema operativo dovesse morire, devo avere un RAID hardware. ORA, puoi diventare un po 'più complesso e fare il backup del sistema operativo stesso nel caso quello va male, quindi potresti avere una migliore possibilità di non perdere la configurazione RAID.
xR34P3Rx

Ora non fraintendermi. Un RAID software è praticabile ma c'è molta manutenzione come spiegato che avvengono per assicurarsi che sia affidabile.
xR34P3Rx

Ho ottenuto un disco a castello quando ho costruito la macchina, e ho usato mdadm per sostituire l'unità. Non voglio più ridondanza di RAID 5. Inoltre, rsync copia solo le differenze nel sistema operativo sul computer remoto, non i backup completi. Il tuo primo commento si rivolge a quello che stavo chiedendo: "Se il tuo sistema operativo dovesse morire o essere danneggiato, le informazioni sul raid sono memorizzate sul sistema operativo, quindi installare un altro sistema operativo non funzionerà se la configurazione originale del raid fosse sul vecchio sistema operativo. è andato male ". Sto facendo il backup del mio disco OS ogni notte, quindi questo significa che se dovessi rsync di nuovo, dovrei avere indietro la mia configurazione RAID, giusto?
Justyn Bell

Forse non ero chiaro, ma ho 6 dischi: uno mantiene il sistema operativo da solo, non in alcuna configurazione RAID, e gli altri 5 sono in RAID 5. Se perdo l'array a causa di unità guaste, vabbè. Ma non voglio perdere l'array perché l'unità del sistema operativo smette di funzionare se si dispone di backup.
Justyn Bell

Risposte:


0

I metadati dell'array sono memorizzati su ogni singola partizione o unità che è un membro del raid, in un'area nota come superblocco. Probabilmente vorrai guardare il wiki del raid per maggiori dettagli a riguardo. ad esempio potresti guardarlo con

mdadm --detail /dev/sdc1

arbitro https://raid.wiki.kernel.org/index.php/RAID_setup#RAID-1

arbitro https://raid.wiki.kernel.org/index.php/RAID_setup#The_Persistent_Superblock_.282011.29

A condizione che si stia utilizzando il tradizionale layout raid (cioè senza cache, ecc.), Dovresti essere in grado di riassemblare il raid5 in un'installazione di sistema operativo pulita senza problemi.

Un promemoria, gli array RAID sono tutti di uptime, non di backup.

arbitro http://marc.info/?l=linux-raid&m=135811522817345&w=1

Se la quantità di dati sull'unità del sistema operativo è ridotta e puoi rispondere rapidamente, eseguire un ripristino potrebbe essere abbastanza veloce per il tuo caso d'uso. E puoi tenere il prezioso drive bay per altre cose (es. Rendere il raid5 più grande).

Potresti anche solo pre-creare una unità di avvio di backup in modo da poter spegnere, sostituire l'unità e riaccenderla. Assicurati di aggiornarlo e testarlo una volta ogni trimestre o ogni mese in modo che non diventi troppo vecchio.

Se vuoi passare a un raid1, ci sono diversi modi per arrivarci, hanno solo bisogno di un po 'di pazienza e una finestra di downtime. Ho collegato un esempio qui sotto. Ci sono numerosi risultati simili disponibili con un rapido google.

arbitro https://www.howtoforge.com/how-to-set-up-software-raid1-on-a-running-system-incl-grub2-configuration-ubuntu-10.04


Informazioni e intuizioni eccellenti. Questo è praticamente esattamente quello che sto cercando.
Justyn Bell

Per inciso, questo è un server multimediale domestico. Il motivo per cui ho scelto RAID invece di JBOD è perché se 1 unità non è riuscita in quest'ultimo caso, tutti i dati su tale unità sono andati, punto e basta. Con l'installazione RAID, se un'unità guasta, statisticamente parlando, sembra che avrei maggiori possibilità di sostituirlo senza perdere nulla. Se perdo tutto, come ho detto in un altro commento, vabbè. Sono solo i media. Mantengo tutti i miei repository e dati ad alta priorità sottoposti a backup con altri mezzi.
Justyn Bell

Non ho abbastanza rep per super user per modificare i miei commenti, ma fondamentalmente, in un sistema in cui non mi interessa il tempo di attività oi backup a prova di proiettile, preferirei comunque un array RAID su qualcosa come JBOD.
Justyn Bell
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.