Bonjour les habitants de Server Fault
J'ai un problème irritant avec un LAN d'environ 100 ordinateurs, 2 serveurs de domaine Windows et 12 téléphones VoIP. Depuis leur installation il y a environ un an, chaque semaine environ, nous remarquons qu'un téléphone VoIP se réinitialise - parfois au milieu d'un appel. Simultanément, il y a souvent des signes de perte temporaire de connexion sur les ordinateurs: blocage dans l'explorateur lors de l'accès aux partages réseau, erreurs dans notre logiciel d'administration en raison de la perte de connexion au serveur de base de données.
J'ai fait une surveillance Wireshark sur la connexion entre le PBX VoIP et le reste du réseau. Wireshark récupère un groupe de paquets TCP retransmis au moment où nous enregistrons les redémarrages du téléphone. Le journal Wireshark montre environ 2 clusters de retransmissions par jour allant de 5 paquets à des centaines. Ceux de chaque cluster se trouvent principalement entre le PBX et certains ensembles de téléphones VoIP, mais pas toujours le même ensemble. Souvent, les retransmissions se font en même temps vers des téléphones connectés au même commutateur, mais parfois les retransmissions se produisent ensemble vers des téléphones aux extrémités opposées du réseau. Il y a généralement des retransmissions coïncidentes lors du passage du trafic TCP, par exemple entre les ordinateurs clients et les serveurs de fichiers.
Les pics des retransmissions et des réinitialisations téléphoniques ne correspondent pas bien avec le moment où le réseau est lourdement chargé. Ils semblent se produire un peu plus pendant la journée, mais surtout le soir, lorsque le trafic devrait diminuer. Ils se produisent assez souvent tard dans la nuit, lorsque la plupart des ordinateurs sont éteints et que le trafic doit être le plus faible.
Avez-vous des idées qui pourraient aider à diagnostiquer la cause de problèmes comme celui-ci? Une chose que je n'ai pas encore essayée, mais que j'aurais dû, est la mise à jour du firmware de tous les commutateurs.
la source
Réponses:
Les retransmissions TCP sont généralement dues à la congestion du réseau. Recherchez un grand nombre de paquets de diffusion au moment où le problème se produit. Si le pourcentage de trafic diffusé dans votre capture est supérieur à environ 3% du trafic total capturé, vous avez certainement une congestion. Recherchez les diffusions de couche physique (ARP) et de couche réseau (résolution de noms) sur le réseau. Si vous trouvez un volume élevé de trafic de diffusion, vous pouvez le suivre jusqu'à la source à partir des données de capture.
la source
arp
- et pour voir celles diffusées uniquement, en utilisant un filtre deeth.addr==ff:ff:ff:ff:ff:ff
La collecte de statistiques de trafic pour vos commutateurs peut indiquer que vous avez des périodes où vous exécutez à pleine capacité ou presque. Cela peut conduire à de nouvelles tentatives lorsque les réponses ne reviennent pas dans le délai initial (souvent 3 secondes). Cela augmente momentanément la congestion jusqu'à ce que les mécanismes d'atténuation de la congestion se déclenchent.
Recherchez des personnes utilisant des médias en streaming car cela peut absorber rapidement la bande passante.
Vous pourrez peut-être atténuer le problème pour les téléphones en modulant le trafic. Cela ne fera que déplacer le problème vers d'autres utilisateurs.
la source
Cela ressemble à une boucle de spanning tree ou à une tempête de diffusion pour moi, surtout si les retransmissions et les problèmes sont localisés sur le même commutateur (qui diffère). Lorsque cela se produit, quels sont les états de port sur votre appareil L2? Probablement un mauvais commutateur ou de mauvaises priorités de pont racine? Problème intéressant.
la source
Vous avez probablement résolu ce problème depuis si longtemps, mais vous devez essentiellement activer le «port rapide» sur les ports dotés de terminaux (téléphones VoIP, postes de travail, serveurs). Un téléphone peut envoyer des PDU, donc si ce type redémarre, une convergence STP se produira, ce qui entraînera le vidage de la table FDB et tous les appareils passeront par le plaisir STP en 4/5 étapes. En mettant les ports avec point d'extrémité en "port rapide", ils sautent l'attente et passent directement au mode de transfert.
la source
Espérons que vos téléphones se trouvent sur un sous-réseau et un VLAN différents des autres ordinateurs?
la source
Il peut également s'agir d'un équipement défectueux comme un interrupteur défectueux. Les retransmissions correspondent-elles aux téléphones / ordinateurs sur un commutateur ou une partie du réseau particulier?
Juste pour étendre un peu ma réponse. Tous les commutateurs ne sont pas créés égaux, même s'ils ont les mêmes spécifications. Certains sont capables de faire face à une charge beaucoup plus élevée que d'autres car ils ont des processeurs plus rapides à l'intérieur. Il se peut que vos commutateurs ne soient pas tout à fait à la hauteur.
Je commencerais par placer certains de vos téléphones VOIP les plus gênants sur leur propre commutateur physique et voir si les réinitialisations de ceux-ci se poursuivent. Si cela disparaît, vous êtes sur le point de le résoudre très bientôt.
la source