Pourquoi le lecteur Hitachi HDS5C3020 non partitionné commence-t-il à consommer 50% plus d'énergie 15 minutes après le démarrage?

19

Dans un système Debian 6.0.6, il y a 74 unités de disques Toshiba DT01ABA200 de 2 To. Ces lecteurs sont identifiés comme des lecteurs Hitachi HDS5C3020BLE630 exécutant la révision du micrologiciel MZ4OAAB0. 64 disques connectés via des cartes d'extension HP SAS à un contrôleur SAS LSI 2008, 5 autres disques sont connectés directement à la carte mère, 4 disques sont connectés à un contrôleur PCI basé sur Sil et le dernier disque est uniquement alimenté et n'a pas de câble de données connecté. Le BIOS LSI et la carte Sil du contrôleur sont tous deux désactivés et les modules mpt2sas et sata_sil sont supprimés du Linux debian 2.6.32-5-amd64 # 1 SMP dim 23 septembre 10:07:46 UTC 2012 x86_64 noyau GNU / Linux. Le module mpt2sas est chargé après le démarrage à l'aide d'une commande modprobe dans /etc/rc.local. Ces 74 disques ne sont pas partitionnés, ni formatés et également non montés.

Le système consomme:

  • avec 0 disques : 70,6 - 70,9 watts (également 15 minutes après le démarrage);
  • avec 74 disques : 330 - 360 watts, juste après le démarrage (équivaut à 3,5 - 3,9 W par disque au repos);
  • avec 74 disques : 420 - 466 watts, à chaque fois à la 15e minute de disponibilité (équivaut à 4,7 - 5,3 W par disque au repos).

La spécification du lecteur répertorie 4,7 W en lecture / écriture et 3,3 W en consommation d'énergie au repos.

L'augmentation de la consommation d'énergie est très probablement sur la ligne 5V, car après environ 1 minute, une "protection contre les surintensités" (OCP) de l'alimentation (PSU) coupe l'alimentation. Le bloc d'alimentation utilisé est un modèle à rail unique avec un OCP de> 122A sur la ligne 12V et> 55A sur la ligne 5V.

Régression:

  • Peu importe si le lecteur sa valeur APM est définie sur désactivé ou 1 (économie d'énergie maximale).
  • Le système d'exploitation n'enregistre aucune activité de lecture / écriture dans /proc/diskstats. Les valeurs y sont identiques (28 opérations de lecture, 0 opérations d'écriture) comme immédiatement après l'opération modprobe.
  • Impossible de tester ce qui se passe lors du démarrage dans la carte mère, c'est le BIOS - pour exclure toute intervention du système d'exploitation - car la carte mère Super Micro X8SI6-F exécutant le firmware 27/06/12 a un bogue qui lit de manière incorrecte une température de capteur de CPU de +74,0 C comme " High "en mode BIOS, et coupe l'alimentation après 1 minute.

Quelle pourrait être la cause de l'activité de lecture / écriture du lecteur sur tous les lecteurs dans la 15e minute après le démarrage et comment l'empêcher de se produire?

Pro Backup
la source
Juste curieux ... De quel type de système s'agit-il? Système de sauvegarde? Tous les logiciels RAID?
ewwhite
Actuellement en cours de test, destiné au stockage de sauvegarde sans RAID. La redondance sera fournie par des serveurs secondaires et tertiaires en option.
Pro Backup
@ewwhite me rappelle les dosettes Backblaze. Quelqu'un devait mentionner ce nom.
Dmitri Chubarov
@Dmitri Chubarov C'est comme un module de stockage Backblaze, mais sans multiplicateurs de ports SATA, hauteur 5U, pas de RAID, 74 au lieu de 45 disques, un seul bloc d'alimentation, seulement 2,0 watts de consommation d'énergie pour le refroidissement, et lorsque tous les disques tournent au ralenti avec un différence de température de 6 degrés entre le disque le plus froid et le plus chaud.
Pro Backup

Réponses:

20

Cela ressemble beaucoup aux disques qui effectuent un nettoyage SMART (test automatique hors ligne).

smartctl -a /dev/hdx

devrait confirmer la configuration avec:

Auto Offline Data Collection: Enabled.

Désactiver avec:

smartctl --offlineauto=off /dev/hdx

Ça pourrait être autre chose aussi ...

Chris S
la source
smartctl --offlineauto=offa fait l'affaire. Au moins pendant 32 minutes, il n'y a plus d'énormes augmentations de consommation d'énergie entraînant l'arrêt du bloc d'alimentation OCP. En bonus, hdparm -SX définit désormais les disques de "actif / inactif" à "veille". Cependant, les disques connectés au contrôleur sata_sil ne peuvent pas être contrôleurs. La connexion temporaire de ces disques à un autre contrôleur est la solution de contournement. Le paramètre de collecte de données hors ligne survit aux redémarrages et aux cycles d'alimentation.
Pro Backup