Abbiamo la seguente configurazione:
Due router MX si collegano allo stesso sito L2. La protezione / ridondanza del loop viene eseguita tramite il multihoming VPLS . All'altra estremità ci sono due interruttori (ad esempio EX4200).
Quando il collegamento blu fallisce, i due switch e il resto dell'infrastruttura L2 devono sapere che il traffico deve ora passare attraverso il link giallo (e di conseguenza tramite lo switch EX sulla destra).
Il problema è che la mac-table gialla viene riempita solo quando c'è traffico proveniente dal VPLS attraverso il link giallo. Se non viene ricevuto traffico da un determinato indirizzo MAC, il traffico per quell'indirizzo verrà comunque inviato sul collegamento blu e nessuno sa che quel collegamento è ora interrotto (tranne forse l'interruttore EX sulla sinistra se il collegamento fallisce fisicamente).
Non riesco a trovare una buona soluzione per risolvere questo problema.
Alcuni approcci:
È possibile ridurre in qualche modo l'impatto non eseguendo il portfast del collegamento blu / giallo in modo che spanning-tree possa inviare una modifica della topologia quando l'interfaccia scende / su. Quando l'interfaccia non si abbassa fisicamente, sei sfortunato. D'altra parte, la soluzione spanning-tree ti morderà quando la porta si riapre. VPLS porterà il sito online ma la porta deve passare attraverso le fasi di apprendimento STP prima di inoltrare il traffico.
È possibile impilare i due interruttori. Ciò risolverà il problema per il resto dell'infrastruttura L2 poiché inviano sempre allo stesso switch (stack). Tuttavia, lo stack deve sapere quando passare all'altra interfaccia di uplink con l'istanza VPLS attiva.
Quando si esegue la manutenzione pianificata (e se si dispone di uno stack), è possibile disattivare manualmente il collegamento primario per passare al collegamento secondario. Quindi è possibile ridurre la preferenza del sito per il collegamento disattivato sul router in modo che il sito ora attivo diventi il nuovo primario. Stessa cosa quando si torna indietro. Non è l'ideale e non funziona per interruzioni impreviste.
Ogni input su come risolverlo è apprezzato. (Aspettare EVPN / TRILL non conta.;))