Perché la mia macchina virtuale HyperV perde casualmente la connettività?


10

Ho uno strano problema di connettività intermittente che si verifica circa una volta ogni due settimane.

Innanzitutto la mia configurazione: sto eseguendo un cluster di failover HyperV con due host fisici (node01 e node02). Gli host eseguono entrambi il server HyperV di Windows Server 2008 R2 (quello gratuito) con SP1. Su quegli host eseguo due macchine virtuali ciascuna con Windows Server 2008 R2 Web Edition con SP1. Il mio server di archiviazione è Windows Storage Server 2008 collegato tramite iSCSI. Entrambi gli host e il server di archiviazione eseguono i driver di rete più recenti scaricati direttamente dal sito Web di Intel.

Ecco il problema: il 99,99% delle volte, tutto funziona perfettamente. Circa una volta ogni due - tre settimane, le VM perderanno contemporaneamente la connettività di rete, sia in entrata che in uscita. Quando questo accade,

  1. Non riesco a utilizzare RDP in nessuna delle due macchine virtuali.
  2. Posso RDP in entrambi gli host.
  3. Posso connettermi a una VM dal Failover Cluster Manager facendo clic con il tasto destro del mouse sul nodo e selezionando "Connetti a macchina virtuale"
  4. Una volta che mi collego alla VM come descritto al punto 3 sopra, non riesco ad accedere a nessun sito Web o macchina sulla LAN. La disabilitazione e la riattivazione della connessione di rete virtuale all'interno della VM non risolvono il problema.
  5. Se sposto la VM su un nodo diverso, questo risolve il problema (per le prossime due settimane).
  6. Se riavvio l'host e sposto la VM su di esso, questo risolve il problema (per le prossime due settimane).
  7. In questo caso, il cluster di failover NON esegue automaticamente il failover della VM.
  8. Non ci sono voci insolite nel registro eventi su nessuno degli host o VM.

Questo è successo circa 5 volte con gli stessi sintomi descritti sopra. Sospetto un problema con un driver di rete o hardware di rete, ma poiché sto già eseguendo gli ultimi driver non sono sicuro di cosa fare al riguardo.

Questo è un vero grattacapo ... qualche idea?

Aggiornare

Ho trovato un caso molto simile qui: Virutal Machine perde la connettività di rete su Hyper V Cluster

Aggiornamento del 29/07/2011

Dopo aver installato gli hotfix e aver aggiornato i driver di rete, sto ancora riscontrando lo stesso problema. In risposta al commento che richiede i dettagli hardware, il server è un Intel SR1670HV, che è uno chassis 1U contenente due schede madri S5500HV indipendenti. La comunicazione avviene tramite schede NIC integrate delle schede madri che sono Intel 82574L. Il driver di rete è la versione 16.2.49.0.


puoi aggiungere dettagli sull'hardware (numero di schede)
Jim B

Quale marca / modello di schede di rete hai nel server?
Chris S,

Informazioni su hardware e NIC aggiunte sopra.
Mike,

Con quale interruttore marca / modello stai collegando?
ErnieTheGeek,

Ho avuto un problema simile con le immagini CentOS su un server hyperV MS. Hai schede di rete dedicate per ogni macchina o una scheda di rete condivisa? Una volta passati a schede dedicate questo problema è andato via ... ma non è una vera soluzione ...
n8whnp

Risposte:


7

Avevamo un problema come questo in cui mi trovo. Non ricordo i dettagli esatti, ma la soluzione finale riguardava un indirizzo mac in conflitto assegnato dinamicamente a una scheda di rete virtuale. Fissare quelli che non erano dinamici ha aiutato molto. Normalmente non vuoi farlo perché può rendere più difficile spostare una macchina virtuale su un host diverso, ma ci ha aiutato in questo caso.

L'altra parte è che le NIC fisiche sono state fatte da Broadcom e abbiamo anche avuto un errore di configurazione lì, in cui un amministratore precedente aveva tentato erroneamente di utilizzare l'utilità Broadcom per collegare le due NIC insieme sull'host per migliorare larghezza di banda / throughput. Abbiamo rimosso quella configurazione e configurato una delle schede di rete in modo che non avesse alcun IP sul computer host, ma poteva comunque essere utilizzata per il passthrough ai guest virtuali. Quindi impostiamo ogni macchina virtuale in modo che utilizzi solo una nic o l'altra, bilanciando il carico in base al traffico storico. Ovviamente ciò significa che non si verifica alcun failover se un adattatore o una connessione si interrompono e non abbiamo seguito bene per vedere se il traffico è rimasto bilanciato nel tempo, ma da allora è rimasto stabile.


5

Sono consapevole che questa è una vecchia domanda, ma ho riscontrato lo stesso problema e ho perso così tanto tempo per risolverlo che pensavo di condividere la soluzione che funzionava per me. Ho trovato la soluzione al mio problema qui:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

La soluzione nella mia situazione era disabilitare TCP Offloading sulle VM. Citerò la sezione pertinente dal link:

Per disabilitare TCP Offloading ho dovuto creare e impostare un nuovo valore di registro in ogni VM connessa alla scheda NIC Broadcom 8507 Nextreme II.

Ho usato la seguente modifica del registro per disabilitare TCP Offloading:

Chiave: HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

Valore (DWORD): DisableTaskOffload = 1

Dopo aver disabilitato l'offload TCP su ciascuna VM in questo modo, tutti i problemi erano finiti e sono stato in grado di connettere più VM a una porta NIC della scheda NIC Broadcom 5708 Nextreme II.

Il mio server ha Broadcom NetExtremeschede di rete, quindi per me la causa di questo problema era sicuramente legata al driver, ma setting DisableTaskOffload= 1 ha risolto il problema completamente per me. Spero che questa informazione salvi qualcun altro ore di ricerche!


1
+1, grazie per questo suggerimento, sono stato in esecuzione per un paio di giorni senza alcun problema.
m0dest0

1
Nessun problema, m0dest0. Sono contento di sapere che ti ha aiutato. :)
BruceHill

3

Ho incontrato qualcosa di simile in un ambiente Hyper-V molto più semplice e mi sono imbattuto in questo articolo di Microsoft. Sembra adattarsi alla tua situazione se i server web sono molto utilizzati.

http://support.microsoft.com/kb/974909 - La connessione di rete di una macchina virtuale Hyper-V in esecuzione viene persa a causa di un intenso traffico di rete in uscita su un computer basato su Windows Server 2008 R2


L'articolo KB a cui fai riferimento era pre-SP1, ma ne ho fatto uno simile dopo SP1 che sembra promettente: support.microsoft.com/kb/2263829
Mike

1
Ho rimosso questa come risposta perché ho installato l'aggiornamento rapido ma il problema si sta ancora verificando. Pertanto, questa domanda rimane senza risposta ...
Mike,

2

Abbiamo avuto lo stesso problema, sebbene nel nostro caso fosse ogni 24-48 ore. Verificherei che il tuo prodotto antivirus / firewall supporti spceficamente Server 2008 con Hyper-V, in caso contrario, prova un altro (o rimuovendo temporaneamente se possibile) il tuo prodotto antivirus / firewall come test per vedere se il problema scompare .

Dopo una chiamata a Microsoft e diversi caricamenti di file di dump / log in un secondo momento, hanno stabilito che TrendMicro OfficeScan era il colpevole nel nostro caso. Stavamo usando una versione che non era esplicitamente supportata su Hyper-V, una volta aggiornato all'ultima versione, il problema è scomparso.


2

Questo si è rivelato un problema hardware: ho isolato il problema con uno switch gestito GSM7224v2 Netgear, l'ho sostituito con un D-Link DGS-1024D e da allora tutto ha funzionato perfettamente.

Come "lezione appresa", in questo caso probabilmente ho speso il 99% del mio sforzo diagnostico nella risoluzione dei problemi relativi alle impostazioni del software per quello che si è rivelato essere un problema hardware. Ho anche pagato $ 259 al supporto Microsoft (e ho trascorso molto tempo al telefono con loro) per aiutarmi a capirlo cercando le impostazioni del software. Immagino che la morale della storia sia sospettare il tuo hardware tanto quanto il tuo software.


1

Sulle proprietà della scheda di rete per il guest VM, hai disabilitato Pacchetti Jumbo e Offload invio di grandi dimensioni? Sulla base della mia esperienza con queste impostazioni, lo proverei sicuramente.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.