Di recente, dopo aver aggiornato diversi circuiti MetroE (connettività L2) da 100 Mbps a 1 Gbps, ho notato che i trasferimenti di file di grandi dimensioni falliscono tra alcuni siti; tuttavia, il trasferimento non riesce solo nella direzione. Ad esempio, considera il seguente esempio.
Da -> A
A -> B = Fallito
B -> A = Successo
A -> C = Successo
C -> A = Successo
B -> C = Successo
C -> B = Successo
Ogni sito è un segmento indirizzato dietro uno switch L3 situato nel sito. Lo switch L3 si collega al convertitore multimediale CPE del provider, che a sua volta si collega alla rete del provider tramite fibra. Il routing statico viene utilizzato tra switch L3.
*Site A* *Site B*
L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
|
CPE
|
L3 Switch
*Site C*
Il fornitore ha eseguito test end-to-end dei circuiti dai CPE e non ha riscontrato perdite. Tuttavia, vedo molti ACK duplicati in un'acquisizione di pacchetti sugli host prima che il trasferimento fallisca.
Se rimuovo gli interruttori L3 dall'equazione e collego due host direttamente al dispositivo CPE in ciascun sito, il trasferimento del file viene completato correttamente.
Host A <-> CPE <--- Provider ---> CPE <-> Host B
Se posiziono host su entrambi i lati di uno switch L3, il routing interVLAN funziona senza intoppi e il trasferimento dei file viene completato correttamente.
Host A1 <-> L3 Switch <-> Host A2
Il problema sembra verificarsi solo quando i dati attraversano il provider tra due segmenti indirizzati.
Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B
Ho verificato una serie di cose: le statistiche dell'interfaccia sono pulite (nessun errore), utilizzo della CPU e della memoria basso, velocità e corrispondenza duplex (client e CPE), tabelle MAC e ARP corrette, ecc.
Quale potrebbe essere il problema?
Aggiornamento 1
Le acquisizioni di pacchetti dagli host A e B sono disponibili al seguente URL:
https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa
Il problema si era originariamente verificato con gli switch Juniper EX3200 in esecuzione 12.3R6.6. Successivamente ho declassato gli switch a 11.4R6.6, ma questo non ha risolto il problema.
Sono stato in grado di replicare il problema utilizzando gli switch Juiper EX2200 con 12.3R6.6 e 11.4R6.6. Sono stato anche in grado di replicare il problema utilizzando gli switch Dell 6224 in esecuzione 3.3.11.2.
Attualmente, solo il CPE (ge-0/0/0) e un singolo host (ge-0/0/1) sono collegati a Juniper EX3200 in ciascun sito. Durante la risoluzione del problema, ho rimosso la configurazione di tutti i parametri estranei, quindi la configurazione è abbastanza semplice. La configurazione è sostanzialmente la stessa per ciascuno, ma con indirizzi IP diversi. Di seguito è riportato un frammento.
# show interfaces
ge-0/0/0 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members WAN;
}
}
}
}
ge-0/0/1 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members LAN;
}
}
}
}
vlan {
unit 10 {
description WAN;
family inet {
address 192.168.X.X/27;
}
}
unit 100 {
description LAN;
family inet {
targeted-broadcast;
address 172.X.X.1/22;
}
}
}
# show vlans
WAN {
vlan-id 10;
l3-interface vlan.10;
}
LAN {
vlan-id 100;
l3-interface vlan.100;
}
Aggiornamento 2
Oggi ho notato che se scp un file dallo switch L3, Juniper EX3200, dal sito A allo switch L3, Juniper EX3200, nel sito B, anche il trasferimento scp è interessato dal problema.
Lo trovo particolarmente interessante poiché il trasferimento proviene dall'interfaccia di fronte CPE sulla VLAN WAN, perché se collego una VLAN tra i siti interessati attraverso gli switch EX3200, i trasferimenti di file commutati vengono completati correttamente tra host sul sito A e B.