J'ai une configuration de surveillance sur plusieurs appareils dans notre bureau. Le temps de réponse ping aux petits commutateurs d'accès est généralement de 1 à 4 ms ... À 3 heures du matin ce matin, cela a monté en flèche à 300 ms en moyenne.
Par où commencer dans une situation comme celle-ci? Que puis-je observer dans le commutateur pour trouver la source de latence?
REMARQUE: Ce n'est pas lié à la charge .. toute l'utilisation de la bande passante des liens est normale et non affectée, la plupart des liens sont très sous-utilisés. De plus, la surveillance est locale aux périphériques signalant la latence, il n'y a donc pas de facteur WAN ici.
show proc cpu history
pour le commutateur avec les temps de ping élevés. Si ce processeur est constamment élevé oushow proc cpu sort
Réponses:
Premièrement, la latence n'est pas directement liée à la bande passante. Il existe de nombreuses raisons pour lesquelles un périphérique retarderait un paquet autre qu'une liaison encombrée.
Avez-vous tenté un traceroute? Cela vous montrera la latence entre les sauts, si vous recherchez une limite L3 en tant que suspect.
Vous pouvez également vérifier pour voir si l'un des périphériques dans le chemin a une utilisation importante de CPU / RAM.
la source
si cela est uniquement basé sur le réseau local, vous pouvez commencer par essayer de découvrir la cause du problème:
Commande show process cpu history : si l'utilisation du processeur est très élevée, vous devez voir quel processus est à l'origine de cela et peut-être frapper google avec le processus incriminé.
show debug command: une cause courante que j'ai trouvée est que les gens laissent les commandes de débogage s'exécuter sur le commutateur. Un favori commun était la comptabilité IP laissée sur les appareils qui étaient déjà surutilisés. Utilisez "undebug all" pour vous débarrasser des débogages.
Redémarrez-le : probablement pas pendant la journée, mais utilisez la commande "reload in" pour le chronométrer la nuit ou le week-end. Vous seriez surpris du nombre de problèmes qu'un redémarrage rapide peut résoudre.
fermer les ports de jonction - Si c'est un commutateur L3, un autre problème commun que j'ai vu est le trafic trop important utilisant cet appareil pour le routage entre les VLAN. Si possible, fermez temporairement certains des ports de jonction pour voir si cela réduit la latence.
Il est bon de savoir que vos pings sont de faible priorité, en ce qui concerne la latence et également lorsqu'ils sont traités par le CPU. Cela pourrait également être une bonne idée de revérifier vos paramètres de QoS et de vous assurer qu'il n'y a pas d'erreurs stupides à l'origine de cela, autant que cela soit peu probable.
la source
J'utilise des cactus pour surveiller la bande passante et openNMS pour surveiller la latence. Si vous surveillez tous les appareils liés à ce commutateur, vous pouvez voir un corollaire entre l'utilisation et la latence. (Je sais que vous avez dit que ce n'était pas un problème de bande passante, mais vous ne l'avez jamais fait maintenant) J'ai vu des commutateurs bas de gamme s'affaisser sous une utilisation intensive, ce qui provoque beaucoup de latence. Avez-vous des périphériques "stupides" alimentant ce commutateur qui peuvent être la source de l'affaissement même si ce commutateur ne fait pas passer beaucoup de trafic. De plus, avec les cactus, vous pouvez peut-être interroger l'utilisation du processeur et vous pouvez voir un pic au moment de la latence.
Comme mentionné ci-dessus, MTR ou neotrace sont également utiles pour garder un œil sur la situation et vous pouvez voir où commence la latence, ce qui peut ne pas être ce commutateur lui-même.
la source
Si cela ne se produit pas sur le LAN, vous pouvez limiter le débit du "port wan", cela forcera un meilleur TDM. Essayez quelque chose autour de 80% de votre débit maximal et voyez si cela aide. Vous devrez peut-être tweek en fonction de la quantité de terminaux.
la source