Ho alcune macchine virtuali su Windows Azure che eseguono il nostro sito Web di e-commerce e ultimamente abbiamo iniziato a utilizzare Telegraf, InfluxDb e Grafana per tenere d'occhio queste macchine. Dopo un paio di settimane di raccolta dei dati, ho notato uno strano modello correlato alla metrica Memoria disponibile :
Ogni giorno quasi sempre nello stesso periodo della giornata, ho notato che viene liberata una quantità improvvisa di memoria che, a causa delle mie abilità DevOp molto molto limitate, non riesco a capire cosa sta causando questo.
Ecco un grafico che mostra questo modello:
La mia domanda è: cosa potrebbe portare a qualcosa del genere? Ho la tentazione di sospettare che sia colpa di una perdita di memoria, ma ... La memoria libera non scende mai al di sotto del 70% e si verifica solo in due macchine virtuali con più traffico!
Dovrei preoccuparmi quando vedo qualcosa del genere?
PS: ho iniziato a raccogliere metriche per i byte Private e Virtual per ciascuno dei servizi Windows in esecuzione e per il processo w3wp ... anche se ho letto che queste metriche non sono molto affidabili per scoprire se hai una perdita di memoria, ma almeno proverò a ottenere una sorta di tendenza e vedere se è correlata al modello mostrato sopra.