Ho uno strano problema di connettività intermittente che si verifica circa una volta ogni due settimane.
Innanzitutto la mia configurazione: sto eseguendo un cluster di failover HyperV con due host fisici (node01 e node02). Gli host eseguono entrambi il server HyperV di Windows Server 2008 R2 (quello gratuito) con SP1. Su quegli host eseguo due macchine virtuali ciascuna con Windows Server 2008 R2 Web Edition con SP1. Il mio server di archiviazione è Windows Storage Server 2008 collegato tramite iSCSI. Entrambi gli host e il server di archiviazione eseguono i driver di rete più recenti scaricati direttamente dal sito Web di Intel.
Ecco il problema: il 99,99% delle volte, tutto funziona perfettamente. Circa una volta ogni due - tre settimane, le VM perderanno contemporaneamente la connettività di rete, sia in entrata che in uscita. Quando questo accade,
- Non riesco a utilizzare RDP in nessuna delle due macchine virtuali.
- Posso RDP in entrambi gli host.
- Posso connettermi a una VM dal Failover Cluster Manager facendo clic con il tasto destro del mouse sul nodo e selezionando "Connetti a macchina virtuale"
- Una volta che mi collego alla VM come descritto al punto 3 sopra, non riesco ad accedere a nessun sito Web o macchina sulla LAN. La disabilitazione e la riattivazione della connessione di rete virtuale all'interno della VM non risolvono il problema.
- Se sposto la VM su un nodo diverso, questo risolve il problema (per le prossime due settimane).
- Se riavvio l'host e sposto la VM su di esso, questo risolve il problema (per le prossime due settimane).
- In questo caso, il cluster di failover NON esegue automaticamente il failover della VM.
- Non ci sono voci insolite nel registro eventi su nessuno degli host o VM.
Questo è successo circa 5 volte con gli stessi sintomi descritti sopra. Sospetto un problema con un driver di rete o hardware di rete, ma poiché sto già eseguendo gli ultimi driver non sono sicuro di cosa fare al riguardo.
Questo è un vero grattacapo ... qualche idea?
Aggiornare
Ho trovato un caso molto simile qui: Virutal Machine perde la connettività di rete su Hyper V Cluster
Aggiornamento del 29/07/2011
Dopo aver installato gli hotfix e aver aggiornato i driver di rete, sto ancora riscontrando lo stesso problema. In risposta al commento che richiede i dettagli hardware, il server è un Intel SR1670HV, che è uno chassis 1U contenente due schede madri S5500HV indipendenti. La comunicazione avviene tramite schede NIC integrate delle schede madri che sono Intel 82574L. Il driver di rete è la versione 16.2.49.0.