Mon port de commutateur Cisco est-il mauvais?

Je poursuis depuis quelques jours un problème de perte de paquets et de stabilité du réseau pour une poignée d'utilisateurs finaux sur un réseau interne ... Ces problèmes sont apparus la semaine dernière, mais l'emplacement a été frappé par la foudre il y a six semaines.

Je voyais une perte de paquets de 5 à 10% entre une pile de quatre Cisco 2960 et plusieurs PC et téléphones de l'autre côté d'une course de 77 mètres. Les PC étaient exécutés en ligne avec les téléphones sur une liaison partagée ( switchbin de configuration de switchport ). Nous avons constaté des interruptions d'appels et des interruptions dans les applications client-serveur et la connectivité Microsoft Exchange.

J'ai essayé les étapes de dépannage habituelles à distance, en demandant à un technicien local d'effectuer les opérations suivantes pendant les pauses dans les activités utilisateur et de production:

changer les câbles entre la prise murale et l'appareil.
changer les câbles de brassage entre le panneau de brassage et les ports de commutateur.
essayez différents ports de commutateur dans la pile 2960.
changer les appareils des utilisateurs finaux avec des équipements connus (nouveaux téléphones, différents PC).
effacer les compteurs d'interface de port de commutateur et surveiller de près les erreurs d'incrémentation. ( Sortie Pastebin desh int )
Parcouru les journaux de l'appareil et les graphiques Observium RRD . Aucun problème de liaison haut / bas du côté du commutateur.
changer les barrettes d'alimentation côté utilisateur final.
le câble de test part du Cisco 2960 en utilisant test cable-diagnostics tdr int Gi4/0/9(propre) *
testez les câbles avec un testeur de câbles Tripp-Lite. (nettoyer)
exécuter des diagnostics sur les membres de la pile de commutateurs. (nettoyer)

Au final, il a fallu trois changements de ports de commutation pour trouver une solution stable. La seule conclusion logique est que quelques ports de commutateur Cisco 2960 sont mauvais ou feuilletés ... Pas morts, mais pas de comportement cohérent non plus. Je n'ai pas l'habitude de voir des ports individuels mourir de cette manière.

Que puis-je tester ou vérifier pour déterminer si ces appareils sont défectueux?

Quelle est l'approche des meilleures pratiques pour vérifier cela?

Est-il courant que des ports uniques rencontrent des problèmes plutôt qu'une banque de ports contigus?

BTW - show cable-diagnostics tdr int Gi4/0/14est très cool ...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal

networking cisco hardware switch cisco-catalyst ewwhite
la source

Pourriez-vous ajouter "show interface gi4 / 0/9" ... aussi votre sortie tdr est de gi4 / 0/14 ... combien de ports ont le problème?

Mike Pennington

@MikePennington 4 interfaces sur 48 montraient des problèmes. Les compteurs ont été effacés. Mais le seul compteur qui incrémentait était:Total output drops: 1461

ewwhite

1461 gouttes sur un total de combien de paquets de sortie? Les quatre ports problématiques affichent-ils des chutes de sortie?

Mike Pennington

@MikePennington Interface coller la sortie pour deux des ports en difficulté.

ewwhite

Pas une réponse technique mais ... avez-vous un contrat TAC actif? Si oui, impliquez-le: P

ItsGC

Réponses:

Alors que les banques de ports partagent souvent un ASIC, chacune doit avoir sa propre PHY distincte. Si le PHY a été endommagé, il pourrait très bien avoir un problème alors que ses voisins ne le font pas.

Cela dit, les chutes de sortie sont un symptôme étrange d'un problème physique - pas impossible, mais pas typique. Malgré les liaisons semi-duplex, les baisses de sortie ont généralement plus à voir avec l'épuisement du tampon que les problèmes physiques.

Vous pouvez obtenir plus d'informations en configurant une capture de paquets de l'autre côté du câble. Un mauvais PHY devrait se manifester avec un certain nombre d'erreurs de couche physique (mauvais CRC, runt / géant, etc.) d'un côté ou des deux côtés de la liaison.

Dans l'ensemble, il semble que vous ayez suffisamment éliminé pour qu'il soit au-delà du point de baisse des rendements. Je recommanderais un RMA si vous avez un contrat.

rnxrx
la source

Étant donné que cela se produit sur plusieurs ports sur plusieurs (2) commutateurs, mais uniquement pour un petit sous-ensemble d'utilisateurs, s'agit-il d'un cas où je devrais remplacer les quatre commutateurs? J'ai juste un temps au lobbying dur pour le remplacement sans savoir la question de base, étant donné que le remplacement exigera des temps d' arrêt considérable, recâblage, etc ..

ewwhite

La foudre est un animal très étrange et ses dégâts peuvent se manifester beaucoup plus tard et de manière imprévisible. Le temps d'arrêt est nul, bien sûr, mais pourrait être quelque peu amélioré en bouclant l'interrupteur de remplacement, en déplaçant les patchs puis en retirant les anciens. Je souhaite qu'il y ait une réponse plus facile, mais si vous avez isolé le problème à quelques ports, il n'y a pas grand-chose d'autre à faire.

rnxrx

Le PHY est presque toujours intégré à l'ASIC de nos jours. C'est beaucoup moins cher. Les magnétiques sont à peu près la seule partie qu'ils ne peuvent vraiment pas intégrer dans l'ASIC, ce qui pourrait être endommagé, mais ce n'est pas le PHY. En outre, il est assez courant d'utiliser des magnétiques quadruples, donc si le problème est sur 4 ports, cela prête à cette théorie.

Chris S

Pas vraiment - si vous passez par l'architecture de la plupart des commutateurs Cisco (y compris celui en question), les mêmes ASIC sont souvent utilisés pour une ou deux GE de fibre ou de cuivre ou un groupe de 100TX. Une plus grande partie de la fonctionnalité est déplacée vers l'ASIC dans les architectures de commutation sur puce, mais dans ces cas, il y a toujours une couche physique gérée par une optique enfichable ou une sorte de support en cuivre. Étant donné que le même complexe ASIC peut souvent gérer un certain nombre d'exigences de vitesse et de puissance différentes, cela n'a pas beaucoup de sens d'intégrer cette fonction dans le même spin?

rnxrx

Enfin remplacé tous les commutateurs après trop de ports dégradés au point d'être inutilisables. Enfin, une bonne utilisation de SmartNet!

ewwhite

Oui, un seul port peut être mauvais, mais si je me souviens bien, vous devez remplacer le module entier. (Mise en garde: cela fait longtemps que je n'ai pas fait de travail important sur Cisco ...)

Je ne sais pas si cela peut aider, mais consultez FITB , par Laurie Denness, l'un des ingénieurs Ops à Etsy.

gWaldo
la source