Come monitorare lo stato del disco rigido dietro il controller di raid Dell PERC H710 con CentOS 6?


26

Ho un server Dell in esecuzione CentOS 6con la PERC H710scheda Raid Controller con impostazione Raid 5 e voglio monitorare il guasto del disco rigido / lo stato di funzionamento dietro il Raid Controller.

Quindi dovrei essere in grado di utilizzare uno script bash per monitorare lo stato del disco rigido e inviare e-mail di avviso se qualcosa è andato storto.

Lo LSI MegaRAID SASstrumento di comando (Informazioni sugli strumenti LSI MegaRAID SAS Linux) per CentOS / Red Hat / Linux NON supporta PERC H710 e smartctlNON lo supporta neanche.

Basato sul sito Web Dell, CentOSnon è supportato per questo server ( NX3200 PowerVault) e non è stato possibile scaricare alcun programma Linux per monitorare il disco rigido.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Qualcuno sa come monitorare lo stato del disco rigido dietro il raid hardware su Dell PERC H710 con CentOS 6?

Risposte:


26

SMART non è l'ultima parola nel monitoraggio del disco o della memoria !! È un componente, ma i moderni controller RAID lo usano insieme ad altri metodi per determinare l'integrità dell'unità e dell'array.

Suppongo che questo sia un controller PERC in un server Dell PowerEdge.

Il normale approccio compatibile con Linux al monitoraggio dello stato dell'hardware Dell consiste nell'installare gli agenti Dell OMSA per Linux tramite Yum - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allinstallerà la suite completa di agenti. Una volta installato, è possibile utilizzare il omreportcomando per ottenere informazioni sull'array.

Esempi:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
questo installerà componenti extra come web server / ssl sui miei computer Linux ma sembra che non abbia altra scelta! Odio aggiungere pacchetti non necessari nel mio server.
Xianlin,

2
Fai attenzione alla potenziale perdita di memoria da uno di quei programmi OMSA. Mi è successo lentamente nel corso di 3-4 settimane, poi boom, niente più memoria per Linux.
domenica

1
Sì, la perdita è in dsm_sa_snmpd (quindi ho eseguito 'killall -9 dsm_sa_snmpd', risolto).
markusN,

5
I controller PERC 7xx e 8xx sono solo controller Lara Megaraid e lo strumento LSI MegaCLI funzionerà perfettamente se non vuoi contaminare il tuo sistema con le librerie dell e qualsiasi altro servizio e / o modulo del kernel che stanno cadendo in questi giorni. Esistono molti cheat sheet MegaCLI, script di monitoraggio dei nagios e suggerimenti per il tuning delle prestazioni per il binario LSI. Questa è solo la mia preferenza personale e l'opinione ovviamente. Sono un minimalista.
Aaron,

@Xianlin, questo non è del tutto vero. Sì, installerà molta immondizia ma vedi la mia risposta. Non volevo aggiungere pacchetti non necessari, quindi ho capito solo quelli di cui avevo bisogno per l'archiviazione.
Mike S,

25

Puoi vedere lo stato SMART dei dischi con il comando smartctl e il suo -dargomento. Ad esempio, per vedere il primo disco nell'array:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Questo è su Scientific Linux 6 (un altro sistema operativo basato su RHEL6) con smartmontools-5.43-1.el6.x86_64.


-d megaraid,0era abbastanza nella smartctl 6.6riga di comando. Nella DEVICESCANstringa /etc/smartd.confè necessario-d removable
Stuart Cardall

9

La risposta accettata raccomanda l'audacia che è yum install srvadmin-all. Blecch. Ecco come renderlo leggermente meno blecch-y (ma comunque blecch-y comunque; puoi diventare molto più snello sulla piattaforma HP. Ma sto divagando ...) Con questo voglio dire, installa solo quei componenti necessari per gestire l'archiviazione sulla tua macchina .

A proposito, la risposta diretta alla domanda dell'utente si trova nella voce "Mostra dischi fisici su vdisk 0" nell'elenco seguente.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Aggiungi a .bashrc di root:

export PATH=$PATH:/opt/dell/srvadmin/bin

Godere:

Comandi RAID

  • Mostra tutti i dischi fisici sul controller 0

    $ omreport storage pdisk controller=0
    
  • Mostra tutti i dischi logici sul controller 0

    $ omreport storage vdisk controller=0
    
  • Mostra tutti i dischi fisici su vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Riconfigura un disco virtuale per essere raid1 da raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Crea un disco virtuale su un nuovo disco:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Ulteriori informazioni

A proposito, dal momento che questa non è altro che una scheda LSI MegaCLI a marchio Dell, potresti trovare la risposta di Han Solo ancora migliore! Devo ancora provarlo, comunque.

La dolcezza

Ecco un esempio dell'output di Omreport, inviato tramite grep per un delizioso pacchetto di dati:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@slm Per quanto riguarda la tua modifica, funziona davvero senza root? Non ho omreport / omconfig in questi giorni, ma non sono sicuro che qualsiasi utente possa semplicemente creare un disco virtuale. '$' Sulla riga di comando implica un utente normale, non root.
Mike S,

Sì, l'ho appena fatto l'altro giorno quando avevo a che fare con un Dell 730 tutti i cmd tranne i 2 che "creavano" non richiedevano il root, sistemerò.
Slm

6

Stavo lottando anche per farlo funzionare in CentOS e ho trovato un pacchetto funzionante qui http://mirror.ndchost.com/software/lsi/

chiamato " MegaCli-8.07.10-1.noarch.rpm "

Il riferimento del comando http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

Spero possa essere d'aiuto.


1
Sono assolutamente d'accordo, utilizzare / opt / megacli / MegaCli64 -PDList -aALL | grep -i firmware e ti dirà se i dischi fisici sono ok. (Il comando proviene da erikimh.com/megacli-cheatsheet - vedi se ho usato quello sbagliato). Fondamentalmente la cura del raid fa un ottimo lavoro nel monitorare i dischi, quindi basta tenere traccia della sua opinione degli stati operativi dei dischi.
Alcuni nerd Linux il

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
Per favore considera di leggere Come posso scrivere una buona risposta? nel nostro centro assistenza e quindi rivedi la risposta. Il tuo comando può essere tecnicamente una soluzione, che è stata già menzionata nell'altra, risposte molto più vecchie e alcune spiegazioni sono benvenute. Grazie in anticipo.
HBruijn,

1
L'altra risposta ha usato "sat + megaraid", che non ha funzionato per me. (Giusto, non conoscevo bene il comando smartctl e non sapevo come modificare il comando per farlo funzionare.) Questa risposta mi ha portato sulla strada giusta e funziona per me.
Yongwei Wu,

1

Il percclicomando può anche mostrarti molte informazioni sull'unità se lo chiedi bene:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Questo deve essere ripetuto per ogni slot del contenitore, o almeno non ho trovato il modo di stamparlo tutto in una volta con un singolo percclicomando.

È anche facile da installare rispetto ad altre opzioni più complete:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliNON è una suite di monitoraggio completa come Delll OMSA, ma sembra che molte persone non vogliano qualcosa di completo e invece necessitino di uno strumento decente e semplice.


-1

Ciao, ho una scheda Dell PERC / LSI simile e ho bisogno di controllare lo stato RAID. LSI ha un'utilità chiamata sas2ircu che ho trovato abbastanza utile, esiste anche una versione per Windows e Linux.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.