Perte de paquets unidirectionnelle

8

Récemment, après avoir mis à niveau plusieurs circuits MetroE (connectivité L2) de 100 Mbits / s à 1 Gbit / s, j'ai remarqué que les transferts de fichiers volumineux échouaient entre certains sites; cependant, le transfert échoue seulement dans le sens. Par exemple, considérons l'exemple suivant.

De -> à

A -> B = Échec

B -> A = Succès

A -> C = Succès

C -> A = Succès

B -> C = Succès

C -> B = Succès

Chaque site est un segment routé derrière un commutateur L3 situé sur le site. Le commutateur L3 se connecte au convertisseur de média CPE du fournisseur, qui à son tour se connecte au réseau du fournisseur via la fibre. Le routage statique est utilisé entre les commutateurs L3.

            *Site A*                      *Site B*
    L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
                               |
                              CPE
                               |
                           L3 Switch
                            *Site C*

Le fournisseur a effectué des tests de bout en bout des circuits des CPE et n'a signalé aucune perte. Cependant, je vois de nombreux ACK en double dans une capture de paquets sur les hôtes avant l'échec du transfert.

Si je supprime les commutateurs L3 de l'équation et connecte deux hôtes directement au périphérique CPE sur chaque site, le transfert de fichiers se termine avec succès.

    Host A <-> CPE <--- Provider ---> CPE <-> Host B

Si je place des hôtes de chaque côté d'un commutateur L3, le routage interVLAN fonctionne sans accroc et le transfert de fichiers se termine avec succès.

    Host A1 <-> L3 Switch <-> Host A2

Le problème ne semble se produire que lorsque les données traversent le fournisseur entre deux segments routés.

    Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B

J'ai vérifié un certain nombre de choses - les statistiques d'interface sont propres (pas d'erreurs), l'utilisation du processeur et de la mémoire est faible, la vitesse et la correspondance duplex (client et CPE), les tables MAC et ARP sont correctes, etc.

Quel pourrait être le problème?

Mise à jour 1

Les captures de paquets des hôtes A et B se trouvent à l'URL suivante:

https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa

Le problème est survenu à l'origine à l'aide de commutateurs Juniper EX3200 exécutant 12.3R6.6. J'ai par la suite rétrogradé les commutateurs à 11.4R6.6, mais cela n'a pas résolu le problème.

J'ai pu reproduire le problème à l'aide des commutateurs Juiper EX2200 exécutant 12.3R6.6 et 11.4R6.6. J'ai également pu répliquer le problème à l'aide des commutateurs Dell 6224 exécutant 3.3.11.2.

Actuellement, seul le CPE (ge-0/0/0) et un seul hôte (ge-0/0/1) sont connectés à un Juniper EX3200 sur chaque site. Lors du dépannage du problème, j'ai supprimé la configuration de tous les paramètres étrangers, donc la configuration est assez basique. La configuration est essentiellement la même à chacun, mais avec des adresses IP différentes. Ci-dessous, un extrait.

    # show interfaces
    ge-0/0/0 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members WAN;
                }
            }
        }
    }
    ge-0/0/1 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members LAN;
                }
            }
        }
    }
    vlan {
        unit 10 {
            description WAN;
            family inet {
                address 192.168.X.X/27;
            }
        }
        unit 100 {
            description LAN;
            family inet {
                targeted-broadcast;
                address 172.X.X.1/22;
            }
        }
    }

    # show vlans
    WAN {
        vlan-id 10;
        l3-interface vlan.10;
    }
    LAN {
        vlan-id 100;
        l3-interface vlan.100;
    }

Update 2

Aujourd'hui, j'ai remarqué que si je scp un fichier du commutateur L3, Juniper EX3200, sur le site A vers le commutateur L3, Juniper EX3200, sur le site B, le transfert scp est également affecté par le problème.

Je trouve cela particulièrement intéressant car le transfert provient de l'interface orientée CPE sur le VLAN WAN, car si je jette un VLAN entre les sites affectés via les commutateurs EX3200, les transferts de fichiers commutés se terminent avec succès entre les hôtes des sites A et B.

Paul Garrett
la source
1
Salut Mike, merci pour la suggestion. Je sais en parlant avec mon fournisseur qu'ils configurent MTU au-delà de 9000. Je suis capable de transmettre 1472 octets dans les deux directions, ce que j'attendrais du 1500 factu MTU. L'utilisation de mturoute l'a confirmé. Tout ping sur 1472 échoue avec le bit de ne pas fragmenter.
Paul Garrett
Veuillez renifler le transfert de fichier qui échoue des deux côtés simultanément et publier les résultats sur cloudshark. Nous avons également besoin de détails sur la partie "commutateur L3" de la question. Des choses comme le fabricant, le modèle, la version du firmware, la configuration, les numéros de port connectés à, etc ...
Mike Pennington
Au moment où le transfert de fichiers a échoué, les captures étaient d'environ 19 Mo, ce qui est trop grand pour clouldshark, j'ai donc téléchargé les captures dans la boîte de dépôt et partagé le lien. J'ai mis à jour le message pour inclure les informations supplémentaires que vous avez demandées.
Paul Garrett
Veuillez envisager d'ajouter plus de détails à la question
Mike Pennington
Un problème est survenu avec le réseau du fournisseur. Aucun détail supplémentaire n'était disponible.
Paul Garrett

Réponses:

1

Sur le pare-feu si vous utilisez un SRX, vérifiez à quoi vos sessions de flux de sécurité sont définies et si elles atteignent la limite.

#show security flow session summary 
Albert Klinaku
la source