Recentemente abbiamo avuto un piccolo problema con la rete in cui più server avrebbero perso la connettività di rete in modo intermittente in un modo abbastanza doloroso da risolvere (riavvio forzato richiesto). Questo è andato avanti per circa due settimane, apparentemente a caso, su server diversi. Nessun modello particolare che potessimo discernere.
Dopo alcuni approfondimenti, abbiamo visto che lo switch stava segnalando 100 Mbps per la porta del problema:
Questo suona notevolmente come quello che è successo nell'articolo di Joel Spolsky Five Whys
Michael ha trascorso un po 'di tempo a fare un post mortem e ha scoperto che il problema era un semplice problema di configurazione sullo switch. Esistono diverse velocità possibili che uno switch può utilizzare per comunicare (10, 100 o 1000 megabit / secondo). È possibile impostare manualmente la velocità oppure consentire allo switch di negoziare automaticamente la velocità massima con cui entrambe le parti possono lavorare. L'interruttore non funzionante era stato impostato per la negoziazione automatica. Di solito funziona, ma non sempre, e la mattina del 10 gennaio no.
Ora abbiamo disabilitato la negoziazione automatica sul nostro hardware di rete e lo abbiamo impostato su una velocità fissa di 1000 Mbps (gigabit).
Le mie domande a quelli con maggiori competenze di rete hardware server:
- Quanto sono comuni i problemi di negoziazione automatica con i moderni hardware di rete?
- È considerata una buona pratica di rete standard disabilitare la negoziazione automatica e impostare velocità fisse durante l'impostazione della rete?