Je poursuis depuis quelques jours un problème de perte de paquets et de stabilité du réseau pour une poignée d'utilisateurs finaux sur un réseau interne ... Ces problèmes sont apparus la semaine dernière, mais l'emplacement a été frappé par la foudre il y a six semaines.
Je voyais une perte de paquets de 5 à 10% entre une pile de quatre Cisco 2960 et plusieurs PC et téléphones de l'autre côté d'une course de 77 mètres. Les PC étaient exécutés en ligne avec les téléphones sur une liaison partagée ( switchbin de configuration de switchport ). Nous avons constaté des interruptions d'appels et des interruptions dans les applications client-serveur et la connectivité Microsoft Exchange.
J'ai essayé les étapes de dépannage habituelles à distance, en demandant à un technicien local d'effectuer les opérations suivantes pendant les pauses dans les activités utilisateur et de production:
- changer les câbles entre la prise murale et l'appareil.
- changer les câbles de brassage entre le panneau de brassage et les ports de commutateur.
- essayez différents ports de commutateur dans la pile 2960.
- changer les appareils des utilisateurs finaux avec des équipements connus (nouveaux téléphones, différents PC).
- effacer les compteurs d'interface de port de commutateur et surveiller de près les erreurs d'incrémentation. ( Sortie Pastebin de
sh int
) - Parcouru les journaux de l'appareil et les graphiques Observium RRD . Aucun problème de liaison haut / bas du côté du commutateur.
- changer les barrettes d'alimentation côté utilisateur final.
- le câble de test part du Cisco 2960 en utilisant
test cable-diagnostics tdr int Gi4/0/9
(propre) * - testez les câbles avec un testeur de câbles Tripp-Lite. (nettoyer)
- exécuter des diagnostics sur les membres de la pile de commutateurs. (nettoyer)
Au final, il a fallu trois changements de ports de commutation pour trouver une solution stable. La seule conclusion logique est que quelques ports de commutateur Cisco 2960 sont mauvais ou feuilletés ... Pas morts, mais pas de comportement cohérent non plus. Je n'ai pas l'habitude de voir des ports individuels mourir de cette manière.
Que puis-je tester ou vérifier pour déterminer si ces appareils sont défectueux?
Quelle est l'approche des meilleures pratiques pour vérifier cela?
Est-il courant que des ports uniques rencontrent des problèmes plutôt qu'une banque de ports contigus?
BTW - show cable-diagnostics tdr int Gi4/0/14
est très cool ...
Interface Speed Local pair Pair length Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14 1000M Pair A 79 +/- 0 meters Pair B Normal
Pair B 75 +/- 0 meters Pair A Normal
Pair C 77 +/- 0 meters Pair D Normal
Pair D 79 +/- 0 meters Pair C Normal
la source
Total output drops: 1461
Réponses:
Alors que les banques de ports partagent souvent un ASIC, chacune doit avoir sa propre PHY distincte. Si le PHY a été endommagé, il pourrait très bien avoir un problème alors que ses voisins ne le font pas.
Cela dit, les chutes de sortie sont un symptôme étrange d'un problème physique - pas impossible, mais pas typique. Malgré les liaisons semi-duplex, les baisses de sortie ont généralement plus à voir avec l'épuisement du tampon que les problèmes physiques.
Vous pouvez obtenir plus d'informations en configurant une capture de paquets de l'autre côté du câble. Un mauvais PHY devrait se manifester avec un certain nombre d'erreurs de couche physique (mauvais CRC, runt / géant, etc.) d'un côté ou des deux côtés de la liaison.
Dans l'ensemble, il semble que vous ayez suffisamment éliminé pour qu'il soit au-delà du point de baisse des rendements. Je recommanderais un RMA si vous avez un contrat.
la source
Oui, un seul port peut être mauvais, mais si je me souviens bien, vous devez remplacer le module entier. (Mise en garde: cela fait longtemps que je n'ai pas fait de travail important sur Cisco ...)
Je ne sais pas si cela peut aider, mais consultez FITB , par Laurie Denness, l'un des ingénieurs Ops à Etsy.
la source