Comment surveiller l'état du disque dur derrière le contrôleur RAID Dell PERC H710 avec CentOS 6?

26

J'ai un serveur Dell fonctionnant à l' CentOS 6aide d'une PERC H710carte Raid Controller avec configuration Raid 5 et je souhaite surveiller la défaillance / l'état de fonctionnement du disque dur derrière le Raid Controller.

Ensuite, je devrais être en mesure d'utiliser un script bash pour surveiller l'état du disque dur et envoyer des e-mails d'alerte en cas de problème.

L' LSI MegaRAID SASoutil de commande (À propos des outils Linux LSI MegaRAID SAS) pour CentOS / Red Hat / Linux ne prend PAS en charge PERC H710 et smartctlne le prend pas en charge non plus.

Basé sur le site Web de Dell, CentOSn'est pas pris en charge pour ce serveur ( NX3200 PowerVault) et je n'ai pas pu télécharger de programme Linux pour surveiller le disque dur.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Tout le monde sait comment surveiller l'état du disque dur derrière le raid matériel sur Dell PERC H710 avec CentOS 6?

Xianlin
la source

Réponses:

26

SMART n'est pas le dernier mot dans la surveillance du disque ou du stockage !! C'est un composant, mais les contrôleurs RAID modernes l'utilisent avec d'autres méthodes pour déterminer la santé des disques et des baies.

Je suppose que c'est un contrôleur PERC dans un serveur Dell PowerEdge.

L'approche Linux normale pour la surveillance de la santé du matériel Dell consiste à installer les agents Dell OMSA pour Linux via Yum - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allva installer la suite complète d'agents. Une fois installé, vous pouvez utiliser la omreportcommande pour obtenir des informations sur votre baie.

Exemples:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1
ewwhite
la source
7
cela installera des composants supplémentaires tels que le serveur web / ssl sur mes machines Linux mais il semble que je n'ai pas d'autre choix! Je déteste ajouter des packages inutiles sur mon serveur.
Xianlin
2
Méfiez-vous des fuites de mémoire potentielles de l'un de ces programmes OMSA. Cela m'est arrivé lentement au cours des 3-4 semaines, puis boom, plus de mémoire du tout pour Linux.
bksunday
1
Oui, la fuite se trouve dans dsm_sa_snmpd (donc je lance 'killall -9 dsm_sa_snmpd', résolu).
markusN
5
Les contrôleurs PERC 7xx et 8xx ne sont que des contrôleurs LSI Megaraid et l'outil LSI MegaCLI fonctionnera très bien si vous ne voulez pas corrompre votre système avec les bibliothèques Dell et tous les autres services et / ou modules de noyau qu'ils abandonnent ces jours-ci. Il existe de nombreuses astuces MegaCLI, des scripts de surveillance nagios et des conseils d'optimisation des performances pour le binaire LSI. C'est juste ma préférence et mon opinion personnelles bien sûr. Je suis minimaliste.
Aaron
@Xianlin, ce n'est pas entièrement vrai. Oui, cela va installer beaucoup de déchets mais voyez ma réponse. Je ne voulais pas ajouter de packages inutiles, j'ai donc trouvé uniquement ceux dont j'avais besoin pour le stockage.
Mike S
25

Vous pouvez voir l'état SMART des disques avec la commande smartctl et son -dargument. Par exemple, pour voir le premier disque de la baie:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Il s'agit de Scientific Linux 6 (un autre système d'exploitation basé sur RHEL6) avec smartmontools-5.43-1.el6.x86_64.

Jonathan Barber
la source
-d megaraid,0était assez smartctl 6.6sur la ligne de commande. Dans la DEVICESCANchaîne /etc/smartd.confqu'il fallait-d removable
Stuart Cardall
9

La réponse acceptée recommande l'audace qui est yum install srvadmin-all. Blecch. Voici comment le rendre légèrement moins blecch-y (mais toujours blecch-y néanmoins; vous pouvez devenir beaucoup plus maigre sur la plate-forme HP. Mais je m'égare ...) J'entends par là, n'installer que les composants nécessaires pour gérer le stockage sur votre machine .

BTW, la réponse directe à la question de l'utilisateur réside dans l'élément "Afficher les disques physiques sur le vdisk 0" dans la liste ci-dessous.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Ajoutez au .bashrc de root:

export PATH=$PATH:/opt/dell/srvadmin/bin

Prendre plaisir:

Commandes RAID

  • Afficher tous les disques physiques sur le contrôleur 0

    $ omreport storage pdisk controller=0
    
  • Afficher tous les disques logiques sur le contrôleur 0

    $ omreport storage vdisk controller=0
    
  • Afficher tous les disques physiques sur vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Reconfigurez un disque virtuel pour qu'il soit raid1 à partir de raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Créez un vdisk sur un nouveau disque:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Plus d'informations

BTW, puisque ce n'est rien de plus qu'une carte LSI MegaCLI de marque Dell, vous pourriez trouver la réponse de Han Solo encore meilleure! Je dois encore l'essayer, cependant.

La douceur

Voici un exemple de la sortie d'omreport, acheminée via grep pour un délicieux ensemble de données:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D
Mike S
la source
@slm En ce qui concerne votre édition, cela fonctionne-t-il vraiment sans root? Je n'ai pas omreport / omconfig devant moi ces jours-ci, mais je ne suis pas sûr qu'un utilisateur puisse simplement créer un disque virtuel. Le «$» sur la ligne de commande implique un utilisateur régulier, pas root.
Mike S
Ouais, je viens de le faire l'autre jour quand je faisais affaire avec un Dell 730, tous les cmds, à l'exception de ceux qui "créent", ne nécessitaient pas de root, je vais le réparer.
slm
6

J'avais aussi du mal à le faire fonctionner dans CentOS et j'ai trouvé un package de travail ici http://mirror.ndchost.com/software/lsi/

appelé " MegaCli-8.07.10-1.noarch.rpm "

La référence de commande http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

J'espère que ça aide.

Han Solo
la source
1
Je suis tout à fait d'accord, utilisez / opt / megacli / MegaCli64 -PDList -aALL | grep -i firmware et il vous dira si les disques physiques sont ok. (La commande vient de erikimh.com/megacli-cheatsheet - voyez si j'ai utilisé la mauvaise). Fondamentalement, les soins RAID font un excellent travail de surveillance des disques, alors gardez simplement une trace de son opinion sur les états de fonctionnement des disques.
Some Linux Nerd
3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
user311347
la source
8
Veuillez considérer la lecture Comment écrire une bonne réponse? dans notre centre d'aide, puis révisez la réponse. Votre commandement peut être techniquement une solution, qui a également été déjà mentionnée dans l'autre, des réponses beaucoup plus anciennes et certaines explications sont les bienvenues. Merci d'avance.
HBruijn du
1
L'autre réponse a utilisé "sat + megaraid", ce qui n'a pas fonctionné pour moi. (À droite, je ne connaissais pas bien la commande smartctl et je ne savais pas comment modifier la commande pour la faire fonctionner.) Cette réponse m'a conduit sur la bonne voie, et cela fonctionne pour moi.
Yongwei Wu
1

La percclicommande peut également vous montrer beaucoup d'informations sur le lecteur si vous le demandez gentiment:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Cela doit être répété pour chaque emplacement de boîtier, ou du moins je n'ai pas trouvé de moyen de l'imprimer en une seule fois avec une seule percclicommande.

Il est également facile à installer par rapport à d'autres options plus complètes:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

percclin'est PAS une suite de surveillance complète comme Delll OMSA, mais il semble que beaucoup de gens ne veulent pas quelque chose de complet et ont plutôt besoin d'un outil décent et simple.

Steve Bonds
la source
-1

Salut, j'ai une carte Dell PERC / LSI similaire et j'avais besoin de vérifier l'état RAID. LSI a un utilitaire appelé sas2ircu que j'ai trouvé très utile, il existe également une version pour Windows et Linux.

mike_coreit
la source