HP SmartArray P400: come riparare un'unità logica guasta?


8

Ho un server HP con controller SmartArray P400 (incl. 256 MB di cache / backup della batteria) con un unità logica con unità fisica guasta sostituita che non viene ricostruita.

Ecco come appariva quando ho rilevato l'errore:

~ # / usr / sbin / hpacucli ctrl slot = 0 mostra config
Smart Array P400 nello slot 0 (incorporato) (sn: XXXX)

  array A (SATA, Spazio non utilizzato: 0 MB)
    logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (porta 1I: casella 1: alloggiamento 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (porta 1I: casella 1: alloggiamento 2, SATA, 750 GB, OK)

  array B (SATA, Spazio inutilizzato: 0 MB)
    logicaldrive 2 (2.7 TB, RAID 5, non riuscito)
      physicaldrive 1I: 1: 3 (porta 1I: box 1: bay 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (porta 1I: box 1: bay 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (porta 2I: casella 1: alloggiamento 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (porta 2I: casella 1: alloggiamento 6, SATA, 750 GB, errore)
      physicaldrive 2I: 1: 7 (porta 2I: casella 1: alloggiamento 7, SATA, 750 GB, OK)

  non assegnato
      physicaldrive 2I: 1: 8 (porta 2I: casella 1: alloggiamento 8, SATA, 750 GB, OK)
~ # 

Pensavo di avere l'unità 2I: 1: 8 configurata come riserva per Array A e Array B, ma sembra che non sia così :-(. Ho notato il problema a causa di errori I / O sull'host, anche se solo 1 unità fisica del RAID5 non è riuscita.

Qualcuno sa perché questo potrebbe accadere? L'unità logica dovrebbe andare in modalità "Degradata" ma essere comunque completamente accessibile dal sistema operativo host !?

Per prima cosa ho provato ad aggiungere l'unità non assegnata 2I: 1: 8 come riserva a logicdrive 2, ma questo non era possibile:

~ # / usr / sbin / hpacucli ctrl slot = 0 array B aggiungi ricambi = 2I: 1: 8
    Errore: questa operazione non è supportata con la configurazione corrente.
    Utilizzare il comando "mostra" sui dispositivi per mostrare ulteriori dettagli 
    sulla configurazione.
~ #  

È interessante notare che è possibile aggiungere l'unità non assegnata al primo array senza problemi. Ho pensato che forse il controller mettesse l'array nello stato "fallito" a causa della riserva mancante e proteggesse gli array falliti dalle modifiche. Quindi ho provato a riattivare il logicdrive (per aggiungere successivamente il ricambio):

~ # / usr / sbin / hpacucli ctrl slot = 0 ld 2 modifica riattivabile
    Avviso: eventuali dati precedentemente esistenti sull'unità logica potrebbero non esserlo 
    essere valido o recuperabile. Continua? (y / n) y

    Errore: questa operazione non è supportata con la configurazione corrente.
    Utilizzare il comando "mostra" sui dispositivi per mostrare ulteriori dettagli
    sulla configurazione.
~ # 

Ma come puoi vedere, riattivare la logica non è stato possibile.

Ora ho sostituito l'unità guasta hotswapping con l'unità non assegnata. Lo stato ora è simile al seguente:

~ # / usr / sbin / hpacucli ctrl slot = 0 mostra config
Smart Array P400 nello slot 0 (incorporato) (sn: XXXX)

  array A (SATA, Spazio non utilizzato: 0 MB)
    logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (porta 1I: casella 1: alloggiamento 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (porta 1I: casella 1: alloggiamento 2, SATA, 750 GB, OK)

  array B (SATA, Spazio inutilizzato: 0 MB)
    logicaldrive 2 (2.7 TB, RAID 5, non riuscito)
      physicaldrive 1I: 1: 3 (porta 1I: box 1: bay 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (porta 1I: box 1: bay 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (porta 2I: casella 1: alloggiamento 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (porta 2I: casella 1: alloggiamento 6, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 7 (porta 2I: casella 1: alloggiamento 7, SATA, 750 GB, OK)
~ # 

L'unità logica non è ancora accessibile. Perché non sta ricostruendo?

Cosa posso fare?

Cordiali saluti, questa è la configurazione del mio controller:

~ # / usr / sbin / hpacucli ctrl slot = 0 show
 Smart Array P400 nello slot 0 (incorporato)
  Interfaccia bus: PCI
  Posto connettore: 0
  Numero di serie: XXXX
  Numero di serie della cache: XXXX
  Stato RAID 6 (ADG): abilitato
  Stato controller: OK
  Slot per telaio:
  Revisione hardware: Rev E
  Versione del firmware: 5.22
  Priorità di ricostruzione: Media
  Espandi Priorità: Media
  Ritardo scansione superficie: 15 secondi
  Notifica di incoerenza analisi superficie: disabilitata
  Raid1 Write Buffering: disabilitato
  Timeout prompt post: 0 secondi
  Scheda cache presente: vera
  Stato cache: OK
  Rapporto acceleratore: 25% lettura / 75% scrittura
  Drive Write Cache: disabilitato
  Dimensione cache totale: 256 MB
  Cache di scrittura senza batteria: disabilitata
  Fonte di alimentazione di backup cache: batterie
  Conteggio batteria / condensatore: 1
  Stato batteria / condensatore: OK
  SATA NCQ supportato: True
~ # 

Grazie per l'aiuto in anticipo.

Risposte:


5

La risposta non è piacevole C'è un'alta probabilità che il tuo array sia in uno stato di "attesa di ricostruzione", dove c'è un altro disco guasto nel set di array RAID5 che impedisce il completamento del recupero. Questo è il motivo per cui dovresti evitare RAID5 in questi giorni . Non aiuta che si tratti di unità SATA ... La probabilità di problemi è ancora maggiore. Prova a spegnere il sistema (lasciando girare le unità) e riaccenderlo. Seguire le istruzioni nella schermata dell'array BIOS e scegliere l' F2opzione "riattiva tutte le unità logiche". Ciò può dare il via al processo di ricostruzione.

Altrimenti, è una ricostruzione / ripristino con nuovi dischi.


0

Dovresti avviare ACU e vedere cosa sta succedendo esattamente. se l'intera unità logica non è accessibile, è possibile riattivarla al suo interno.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.