Perché vCenter 5.1u1 esce dagli host dalla modalità di manutenzione?


14

Questo server vCenter è stato appena aggiornato all'aggiornamento 5.1 1. Sto esaminando gli host e aggiornando il firmware, quindi aggiornandoli da varie versioni da 5.0 a 5.1u1.

vCenter 5.1u1 sembra avere un nuovo comportamento interessante: sta rimuovendo gli host dalla modalità di manutenzione quando si riconnettono dopo essere stati disconnessi - ma molto incoerentemente, l'ho visto forse 4 o 5 volte su ~ 25-30 riavvii host. L'ho visto accadere solo su host 5.0 che non sono stati ancora aggiornati a 5.1.

compiti

Nell'immagine, ho messo l'host in modalità manutenzione e lo ho riavviato nella modalità di aggiornamento automatico del DVD HP SPP. Dopo il solito processo di aggiornamento di circa 40 minuti, l'host è tornato online .. e 7 secondi prima ancora di registrare che l'host si era ricollegato, vCenter aveva inviato all'host un'attività per uscire dalla modalità di manutenzione.

eventi

A mio avviso, l'unica volta in cui vCenter dovrebbe abbandonare un host dalla modalità di manutenzione è quando vCenter lo mette in modalità di manutenzione stessa (come un'attività di aggiornamento VUM).

Perché questo vCenter dovrebbe uscire unilateralmente da un host dalla modalità di manutenzione avviata dall'utente?

Modifica, informazioni aggiuntive:

Ho eseguito gli aggiornamenti del firmware su altri 5 host, tutti contemporaneamente. Due di loro sono usciti dalla modalità di manutenzione dopo la riconnessione, tre no. Il fattore comune di chi esce dalla modalità di manutenzione sembra essere il tempo in cui sono rimasti offline ; i due che hanno richiesto alcuni tentativi per avviare il supporto virtuale sono i due che sono stati eliminati dalla modalità di manutenzione.

  • esx31 (immagine sopra): 45 minuti non risponde
  • esx19 (uscita da manutenzione): 87 minuti non rispondono
  • esx24 (rimasto in manutenzione): 32 minuti non rispondono
  • esx29 (rimasto in manutenzione): 39 minuti non risponde
  • esx32 (rimasto in manutenzione): 30 minuti non risponde
  • esx34 (uscita da manutenzione): 70 minuti non rispondono

Modifica: l'idea del tempo di disconnessione sembra essere stata un'aringa rossa, poiché non sta accadendo in modo coerente.

Inoltre , nella vpxd.logmodalità di uscita maint l'avvio dell'attività sembra seguire immediatamente questa vim.EnvironmentBrowser.queryProvisioningPolicychiamata SOAP. Ecco le linee, leggermente ritagliate per chiarezza:

15:27:49.535 [info 'vpxdvpxdVmomi'] [ClientAdapterBase::InvokeOnSoap] Invoke done (esx31, vim.EnvironmentBrowser.queryProvisioningPolicy)
15:27:49.560 [info 'commonvpxLro'] [VpxLRO] -- BEGIN task -- esx31 -- HostSystem.exitMaintenanceMode --

Si noti che sui nodi che non ottengono l'attività di uscita, l' vim.EnvironmentBrowser.queryProvisioningPolicyevento si verifica comunque. Non vedo altre differenze negli eventi prima o dopo questo nel processo di riconnessione, a parte gli eventi extra causati dall'uscita dalla modalità di manutenzione.

Data la menzione del registro delle politiche di provisioning, la ricerca di problemi relativi alla modalità di manutenzione relativa alla distribuzione automatica comporta lamentele su comportamenti simili (sebbene non stia affatto utilizzando la distribuzione automatica).


Potresti voler contattare la linea di assistenza clienti VMware .... o chiedere in uno dei gruppi vmware. Questo potrebbe forse essere un bug nella programmazione.
mdpc,

Inoltre, quale approccio vCenter stai usando? Apparecchio? In esecuzione su Windows?
ewwhite,

@ewwhite In esecuzione su Windows.
Shane Madden

Hmm ... Forse legato a questo ? - Direi che sicuramente non dovrebbe farlo ...
Voretaq7,

Che tipo di hardware stai usando per i tuoi host? Il nostro UCS stava causando un problema simile in quanto quando un host veniva riavviato, ad alcuni piace riavviare due volte, mentre altri (stesso tipo di blade stesso firmware, stessi aggiornamenti esx) si riavvierebbero solo una volta. Quando ne ho parlato con Cisco mi hanno detto "è un problema noto"
MoSiAc,

Risposte:


2

Ho visto che ciò accade con gli host ESXi 4.1 dopo che una patch ha accidentalmente eliminato la cartella / tmp / scratch. Potresti voler verificare se quella directory esiste ancora sugli host che sono usciti automaticamente dalla modalità di manutenzione.

Se mancano, ti consigliamo di creare mkdir per crearlo. Inoltre, ti consigliamo di verificare se lo scratch persistente è impostato correttamente su ciascun host seguendo questo articolo di VMware KB:

VMware KB: creazione di una posizione permanente persistente per ESXi 4.xe 5.x

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.