Ho un array RAID triste su una scheda 3ware 9650SE-16ML. Quello che non posso dire è se ho appena avuto un errore del doppio disco (che peccato!) O se sto leggendo questo male. L'output relavent di /c0 show all
è:
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 DEGRADED u0 931.51 GB 1953525168 5QJ07MAH
p1 ECC-ERROR u0 931.51 GB 1953525168 5QJ0DCW9
p2 OK u0 931.51 GB 1953525168 5QJ0DW9C
p3 OK u0 931.51 GB 1953525168 5QJ0CKXJ
E il fallimento è (da show alarms
):
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 [Sun Nov 20 07:47:23 2011] INFO Rebuild started: unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Drive ECC error reported: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Source drive error occurred: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Rebuild failed: unit=0
c0 [Sun Nov 20 08:20:12 2011] INFO Rebuild paused: unit=0
Io penso che quello che è accaduto è p0 fallito, e quindi p1 avevano presentato un errore ECC (aka, miei dati è andato). Ma ... forse no? Rimane al 97% ricostruito, ma non riesce a superare questo errore.
Per quanto ne so, un precedente amministratore ha disattivato la verifica periodica, che è ciò che ci ha portato in questo stato. Questo non è qualcosa di cui la maggior parte delle persone dovrebbe preoccuparsi con i loro RAID 3Ware!
Aggiornare
Dopo averlo provato per un paio di giorni, ho eseguito il bit IgnoreECC e lo ho ricostruito, ma i miei dati sono stati cancellati. Bummer.