Ho inseguito un problema di perdita di pacchetti e stabilità della rete per una manciata di utenti finali su una rete interna negli ultimi giorni ... Questi problemi sono emersi la scorsa settimana, tuttavia la posizione è stata colpita da un fulmine sei settimane fa.
Stavo vedendo una perdita di pacchetti del 5-10% tra uno stack di quattro Cisco 2960 e diversi PC e telefoni sull'altro lato di una corsa di 77 metri. I PC sono stati eseguiti in linea con i telefoni tramite un collegamento trunked ( pastebin di configurazione dello switchport ). Abbiamo riscontrato chiamate interrotte e interruzioni nelle applicazioni client-server e connettività di Microsoft Exchange.
Ho provato le solite procedure di risoluzione dei problemi in remoto, facendo in modo che un tecnico locale esegua le seguenti operazioni durante le interruzioni dell'attività dell'utente e della produzione:
- cambiare i cavi tra la presa a muro e il dispositivo.
- cambiare i cavi patch tra il pannello patch e le porte degli switch.
- provare diverse porte dello switch nello stack 2960.
- cambiare i dispositivi degli utenti finali con apparecchiature note (nuovi telefoni, diversi PC).
- cancellare i contatori dell'interfaccia della porta dello switch e monitorare attentamente gli errori di incremento. ( Uscita Pastebin di
sh int
) - Annoiato sui registri dei dispositivi e sui grafici RRD di Observium . Nessun problema di collegamento su / giù dal lato interruttore.
- cambiare le prese multiple sul lato dell'utente finale.
- il cavo di prova passa da Cisco 2960 utilizzando
test cable-diagnostics tdr int Gi4/0/9
(pulito) * - il cavo di prova funziona con un tester per cavi Tripp-Lite. (pulito)
- eseguire la diagnostica sui membri dello stack switch. (pulito)
Alla fine, sono state necessarie tre modifiche alle porte dello switch per trovare una soluzione stabile. L'unica conclusione logica è che alcune porte dello switch Cisco 2960 sono difettose o traballanti ... Non sono morte, ma non hanno un comportamento coerente. Non sono abituato a vedere le singole porte morire in questo modo.
Cos'altro posso testare o verificare per determinare se questi dispositivi sono difettosi?
Qual è l'approccio delle migliori pratiche per verificarlo?
È comune che i singoli porti abbiano problemi, piuttosto che un banco contiguo di porti?
A proposito, show cable-diagnostics tdr int Gi4/0/14
è molto bello ...
Interface Speed Local pair Pair length Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14 1000M Pair A 79 +/- 0 meters Pair B Normal
Pair B 75 +/- 0 meters Pair A Normal
Pair C 77 +/- 0 meters Pair D Normal
Pair D 79 +/- 0 meters Pair C Normal
Total output drops: 1461