CPU ProCurve à 100% pendant plusieurs minutes après le redémarrage

9

J'ai effectué des mises à niveau du micrologiciel dans les commutateurs HP. Deux modèles différents ont été mis à niveau:

  • ProCurve Switch 5406zl Intelligent Edge (J8697A): mise à niveau de K.15.06.0008 à K.15.12.0012
  • Commutateur HP 2520-24G-PoE (J9299A): mis à niveau de J.14.54 à J.15.09.0021

En vérifiant chaque commutateur juste après le démarrage de la nouvelle image, j'ai observé quelque chose:

  1. Les commutateurs ont chargé la nouvelle image du micrologiciel sans erreur et la connectivité a été récupérée dès le démarrage du commutateur. À ce stade, l'utilisation du processeur était faible (moins de 10%)
  2. Quelques secondes plus tard, l'utilisation du processeur a augmenté jusqu'à 100% et est restée là pendant plusieurs minutes. Je n'ai pu détecter aucun problème à ce stade, à part que CLI via SSH soit un peu lent: connectivité normale, pas de messages de journal ...
  3. Après cinq à dix minutes à 100%, le CPU est revenu à la normale sans aucun changement de mon côté.

Les deux modèles avaient ce comportement. J'ai restauré une unité de chaque modèle à l'image de firmware précédente et ils se sont comportés de la même manière.

Malgré ce pic de processeur juste après le démarrage, cela n'a causé aucun problème, je me demande si le comportement normal du réseau pourrait être la cause de ce pic, mais je ne le pense pas. J'ai considéré les aspects suivants:

  1. Juste après le démarrage, STP démarre, générant des BPDU et faisant passer tous les ports du commutateur aux états Bloking, Listening, Learning et Forwarding. Cependant, même avec 802.1D, ce processus ne prend pas plus d'une minute avec les minuteries par défaut. De plus, je vérifiais les commutateurs via SSH, donc tous les calculs STP étaient déjà effectués au moment où je pouvais me connecter au commutateur.

  2. Juste après le démarrage, la table d'adresses MAC est vide et une diffusion est nécessaire pour les premières trames à transmettre. Mais je doute que cette diffusion prenne 100% de CPU, et encore moins pendant 5 minutes, dans un commutateur à 24 ports.

  3. Tous les commutateurs agissant comme des périphériques L2, aucune fonctionnalité L3 n'est activée, je rejette donc le routage et les autres processus L3.

Suis-je en train de manquer quelque chose de "normal" dans les opérations réseau qui peut expliquer cette utilisation du processeur pendant 5 minutes après le redémarrage tout en conservant la connectivité? C'est peut-être une sorte de processus d'arrière-plan que le commutateur exécute juste après le redémarrage?

Daniel Yuste Aroca
la source

Réponses:

8

Cela a pris moins de 2 secondes sur Google: portail de mise en réseau HP

Gamme de commutateurs HP ProCurve 5400zl - Utilisation élevée du processeur (99-100%) après un problème de démarrage

Juste après le démarrage du commutateur, une utilisation élevée (99-100%) du processeur est observée. Solution

Lorsque le commutateur démarre, l'une des tâches d'initialisation est la création de clés de chiffrement. La création des clés à l'avance signifie que plus tard, lorsqu'une fonctionnalité telle que SSL ou SSH qui utilise les clés est configurée ou utilisée, le délai de disponibilité est minimal. Cette tâche prend quelques secondes avant de démarrer, en fonction du modèle de commutateur, de la configuration en cours de chargement et de la révision du logiciel. Même si la tâche consomme jusqu'à 100% du processeur, elle s'exécute avec une priorité très faible. Par conséquent, si une autre tâche nécessitant des cycles de processeur est démarrée, cette tâche de faible priorité sera désactivée. Si cette tâche d'initialisation / génération de clé s'exécute sans interruption par des tâches de priorité plus élevée, elle prend environ 10 minutes. Si le CPU est occupé par d'autres tâches, le temps de fin sera prolongé.

Pour vérifier que le CPU élevé vu est bien ce qui a été décrit ici et non quelque chose d'autre qui nécessite un dépannage, veuillez utiliser les commandes documentées ci-dessous.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

La sortie ressemblera à ce qui suit.

Switch # task-monitor cpu Switch # show uptime 0000: 00: 01: 42.36 Switch # show cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services
Ron Trunk
la source
Je suis d'accord que cela semble décrire le problème que j'ai rencontré. Mais alors une nouvelle question me vient à l'esprit. Comme je l'ai dit, je contrôlais les commutateurs via une connexion SSH. Si des clés SSH sont générées quelques secondes après ma connexion: comment puis-je démarrer la session SSH avant que les clés ne soient prêtes?
Daniel Yuste Aroca
2
À partir du Guide de sécurité de Procurve Access: lorsque vous générez une paire de clés hôte sur le commutateur, le commutateur place la paire de clés dans la mémoire flash (et non dans le fichier running-config). En outre, le commutateur conserve la paire de clés lors des redémarrages, y compris les cycles d'alimentation. La suppression (remise à zéro) de la paire de clés publique / privée du commutateur rend le commutateur incapable de s'engager dans le fonctionnement SSH et désactive automatiquement IP SSH sur le commutateur.
Daniel Yuste Aroca