Per un po 'di tempo ho cercato di capire perché alcuni dei nostri sistemi business-critical stanno ricevendo segnalazioni di "lentezza" che vanno da lievi a estreme. Di recente ho focalizzato la mia attenzione sull'ambiente VMware in cui sono ospitati tutti i server in questione.
Di recente ho scaricato e installato la versione di prova per il management pack di Veeam VMware per SCOM 2012, ma sto facendo fatica a credere (e così anche al mio capo) i numeri che mi sta segnalando. Per provare a convincere il mio capo che i numeri che mi sta dicendo sono veri, ho iniziato a cercare il client VMware stesso per verificare i risultati.
Ho visto questo articolo di VMware KB ; specificamente per la definizione di Co-Stop che è definita come:
Tempo durante il quale una macchina virtuale MP era pronta per essere eseguita, ma ha subito un ritardo a causa della contesa di pianificazione di co-vCPU
A cui sto traducendo
Il sistema operativo guest richiede tempo dall'host, ma deve attendere che le risorse diventino disponibili e pertanto possono essere considerate "non rispondenti"
Questa traduzione sembra corretta?
Se è così, qui è dove faccio fatica a credere a ciò che vedo: l'host che contiene la maggior parte delle VM "lente" sta attualmente mostrando una media di Co-stop della CPU di 127.835,94 millisecondi!
Questo significa che in media le VM su questo host devono attendere 2+ minuti per il tempo della CPU ???
Questo host ha due CPU a 4 core e ha guest CPU 1x8 e guest CPU 14x4.