HP SmartArray P400: comment réparer un disque logique défectueux?

8

J'ai un serveur HP avec un contrôleur SmartArray P400 (y compris 256 Mo de cache / sauvegarde de batterie) avec un lecteur logique avec disque physique défectueux remplacé qui ne se reconstruit pas.

Voici à quoi cela ressemblait lorsque j'ai détecté l'erreur:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 dans l'emplacement 0 (intégré) (sn: XXXX)

  baie A (SATA, espace inutilisé: 0 Mo)
    lecteur logique 1 (698,6 Go, RAID 1, OK)
      lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go, OK)
      lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK)

  baie B (SATA, espace inutilisé: 0 Mo)
    lecteur logique 2 (2,7 To, RAID 5, échec)
      lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK)
      lecteur physique 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK)
      lecteur physique 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK)
      lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, échec)
      lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7, SATA, 750 Go, OK)

  Non attribué
      lecteur physique 2I: 1: 8 (port 2I: boîtier 1: baie 8, SATA, 750 Go, OK)
~ # 

Je pensais que j'avais le lecteur 2I: 1: 8 configuré comme disque de secours pour le tableau A et le tableau B, mais il semble que ce n'était pas le cas :-(. J'ai remarqué le problème en raison d'erreurs d'E / S sur l'hôte, même si seul 1 lecteur physique du RAID5 est en panne.

Est-ce que quelqu'un sait pourquoi cela pourrait arriver? Le lecteur logique doit passer en mode "Dégradé" tout en étant entièrement accessible depuis le système d'exploitation hôte!

J'ai d'abord essayé d'ajouter le lecteur 2I: 1: 8 non affecté en tant que disque de rechange à l'entraînement logique 2, mais cela n'a pas été possible:

~ # / usr / sbin / hpacucli ctrl slot = 0 array B add spares = 2I: 1: 8
    Erreur: cette opération n'est pas prise en charge avec la configuration actuelle.
    Utilisez la commande "show" sur les appareils pour afficher des détails supplémentaires 
    sur la configuration.
~ #  

Il est intéressant de noter qu'il est possible d'ajouter le lecteur non affecté au premier module RAID sans problème. Je pensais que peut-être le contrôleur mettait la baie en état "échoué" en raison de la pièce de rechange manquante et protégeait les baies défectueuses contre toute modification. J'ai donc essayé de réactiver le lecteur logique (pour ajouter le disque de rechange par la suite):

~ # / usr / sbin / hpacucli slot ctrl = 0 ld 2 modifier réactiver
    Avertissement: les données existantes sur le disque logique peuvent ne pas 
    être valide ou récupérable. Continuer? (o / n) y

    Erreur: cette opération n'est pas prise en charge avec la configuration actuelle.
    Utilisez la commande "show" sur les appareils pour afficher des détails supplémentaires
    sur la configuration.
~ # 

Mais comme vous pouvez le voir, réactiver le lecteur logique, cela n'a pas été possible.

Maintenant, j'ai remplacé le disque défectueux en le faisant correspondre avec le disque non attribué. Le statut ressemble maintenant à ceci:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 dans l'emplacement 0 (intégré) (sn: XXXX)

  baie A (SATA, espace inutilisé: 0 Mo)
    lecteur logique 1 (698,6 Go, RAID 1, OK)
      lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go, OK)
      lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK)

  baie B (SATA, espace inutilisé: 0 Mo)
    lecteur logique 2 (2,7 To, RAID 5, échec)
      lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK)
      lecteur physique 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK)
      lecteur physique 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK)
      lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, OK)
      lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7, SATA, 750 Go, OK)
~ # 

Le lecteur logique n'est toujours pas accessible. Pourquoi ne reconstruit-il pas?

Que puis-je faire?

Pour info, voici la configuration de mon contrôleur:

~ # / usr / sbin / hpacucli slot ctrl = 0 afficher
 Smart Array P400 dans l'emplacement 0 (intégré)
  Interface de bus: PCI
  Emplacement: 0
  Numéro de série: XXXX
  Numéro de série du cache: XXXX
  État RAID 6 (ADG): activé
  État du contrôleur: OK
  Emplacement du châssis:
  Révision matérielle: Rev E
  Version du micrologiciel: 5.22
  Priorité de reconstruction: moyenne
  Étendre la priorité: moyen
  Délai de balayage de surface: 15 secondes
  Notification d'incohérence de l'analyse de surface: désactivée
  Raid1 Write Buffering: Disabled
  Délai d'expiration de l'invite: 0 s
  Carte cache présente: Vrai
  État du cache: OK
  Rapport d'accélérateur: 25% en lecture / 75% en écriture
  Cache d'écriture du lecteur: désactivé
  Taille totale du cache: 256 Mo
  Cache d'écriture sans batterie: désactivé
  Source d'alimentation de sauvegarde du cache: batteries
  Nombre de batteries / condensateurs: 1
  État de la batterie / du condensateur: OK
  SATA NCQ pris en charge: Vrai
~ # 

Merci de votre aide à l'avance.

TegtmeierDE
la source

Réponses:

5

La réponse n'est pas agréable. Il y a une forte probabilité que votre baie soit dans un état "en attente de reconstruction", où il y a un autre disque défaillant dans l'ensemble de baies RAID5 qui empêche la récupération de se terminer. C'est pourquoi vous devriez éviter le RAID5 de nos jours . Cela n'aide pas que ce soient des disques SATA ... La probabilité de problèmes est encore plus élevée. Essayez d'éteindre le système (en laissant tourner les disques) et de le rallumer. Suivez les invites à l'écran de la matrice du BIOS et choisissez l' F2option "réactiver tous les lecteurs logiques". Cela peut démarrer le processus de reconstruction.

Sinon, c'est une reconstruction / récupération avec de nouveaux disques.

ewwhite
la source
0

Vous devriez démarrer dans ACU et voir ce qui se passe exactement. si l'intégralité du lecteur logique est inaccessible, vous pouvez le réactiver dedans.

Kly
la source