La combinazione di ECMP (o altre cause di percorsi asimmetrici) e HSRP è rotta per impostazione predefinita in Cisco IOS; il comportamento predefinito con questo design inonda eccessivamente il traffico unicast.
Qual è la migliore pratica per l'utilizzo di HSRP con ECMP per prevenire inondazioni unicast sconosciute?
Dettagli / Sfondo
Abbiamo una topologia HSRP simile al primo diagramma seguente per molte delle nostre strutture. I nostri router Cisco WAN hanno rotte di uguale costo per tutti gli altri siti; quindi possiamo vedere sempre effetti di routing asimmetrici. Normalmente assegniamo R1 come primario HSRP, ma ECMP consente il traffico di ritorno tramite R1 o R2.
Il problema è che quando PC1 monta un'unità iSCSI remota attraverso la WAN, il traffico lascia il sito tramite R1, ma potrebbe tornare tramite R2. Finché il traffico iSCSI ritorna tramite R1, non ci sono problemi.
Il problema si verifica quando il traffico di PC1 ritorna tramite R2. Supponiamo che la sessione iSCSI inizi alle 8:00:00 e che entrambi i router e entrambi gli switch apprendano contemporaneamente il mac di PC1. Tra le 8:00:00 e le 8:00:05, non ci sono problemi di allagamento perché entrambi gli switch hanno ancora l'indirizzo MAC di PC1 nella loro tabella CAM.
Cinque minuti dopo l'avvio della sessione iSCSI, la voce CAM di S2 per Mac di PC1 scade dalla tabella CAM e S2 inonda il traffico di PC1 su tutte le porte (in questo caso verso Po1, Gi0 / 3 e Gi0 / 4). Se la sessione iSCSI di PC1 consuma molta larghezza di banda, questa inondazione unicast sconosciuta può assorbire capacità non banali dai collegamenti a PC3 e PC4.
Gli switch Cisco IOS hanno un timer CAM predefinito di 300 secondi ...
S2# show mac address-table aging-time
Vlan Aging Time
---- ----------
1 300
17 300
Tuttavia, il timer ARP dell'interfaccia predefinita di Cisco IOS è di 4 ore ...
R2# show interface gi0/0
GigabitEthernet0/0 is up, line protocol is up
Hardware is AmdP2, address is 000a.dead.beef (bia 000a.dead.beef)
Internet address is 172.17.1.252/24
MTU 1500 bytes, BW 10000 Kbit, DLY 1000 usec,
reliability 255/255, txload 1/255, rxload 1/255
Encapsulation ARPA, loopback not set
Keepalive set (10 sec)
ARP type: ARPA, ARP Timeout 04:00:00 <--------------
Pertanto, S2 inizia a inondare il traffico iSCSI di PC1 dopo cinque minuti.