sfondo
Abbiamo avuto un incidente in cui un cluster di failover di Windows ha subito un'interruzione. Un post mortem ha mostrato che il nodo è stato "rimosso" come descritto in questo articolo .
Solo di recente abbiamo migrato completamente questo cluster nel nostro ambiente VMware e sembra che l'evento sopra descritto possa essere stato la causa dell'interruzione.
L'articolo VMware KB associato su questo parla di aumentare l' Small Rx Buffers
e l' Rx Ring #1
impostazione, ma avverte che l'aumento questi troppo potrebbe aumentare drasticamente sovraccarico di memoria sull'host.
Dopo un controllo dei Network Interface\Packets Received Discarded
contatori delle prestazioni per le nostre ~ 150 macchine virtuali Windows, 22 vNIC su 16 guest avevano alcuni pacchetti scartati.
Una quantità abbastanza piccola che non sono preoccupato di tassare gli host con l'utilizzo di memoria aggiuntiva, ma voglio capire come viene utilizzata la memoria per queste impostazioni e da dove proviene la memoria.
Domande
- Qual è la relazione tra numero di buffer e dimensioni dell'anello?
- Come si calcola la quantità di memoria utilizzata per determinati valori di queste impostazioni?
- Poiché queste impostazioni si trovano sulla stessa NIC all'interno del sistema operativo guest, presumo che siano impostazioni del driver. Questo mi fa pensare che la RAM utilizzata potrebbe essere pool paginato o non paginato.
- È corretto?
- Se è così, dovrei essere preoccupato per quello?
- Ci sono dubbi che non sto prendendo in considerazione qui?
Stiamo cercando di determinare se esiste un inconveniente nell'impostare questi valori al massimo sulle VM interessate, oltre all'utilizzo della memoria dell'host VMware. Se stiamo aumentando il rischio di esaurimento della memoria del pool nel guest, ad esempio, siamo più propensi a iniziare in piccolo.
Alcune (forse tutte) di queste domande potrebbero non essere specifiche per VMware o virtualizzazione.