È possibile ottenere un elenco di processi in esecuzione con un allarme Cloudwatch?


9

Abbiamo un'istanza EC2 (Ubuntu) che ha alcune applicazioni basate su Java e ultimamente siamo colpiti da picchi di utilizzo elevato della CPU che attivano uno dei nostri allarmi di Cloudwatch. Quando entriamo nel server per esaminare l'utilizzo della CPU, le cose si sono calmate.

Quello che ci piacerebbe vedere in una delle e-mail di allarme è un elenco di processi in esecuzione e il loro utilizzo della CPU (%) al momento dell'allarme. È possibile?

Risposte:


0

Per rispondere alla tua domanda n. Non è possibile configurare CloudWatch per elencare i processi sul server ogni volta che viene raggiunta una soglia. Dovresti usare qualche altro software per farlo. CloudWatch registra solo le metriche, ad esempio se si desidera sapere quanti processi erano in esecuzione, è possibile configurare CloudWatch per monitorarlo.


1

Ti suggerisco di provare a utilizzare la contabilità di processo ed eseguire in cima per raccogliere le istantanee dei dati di sistema ogni 10 minuti (impostazione predefinita) o ridurre 5 minuti se dovessi aver bisogno di una risoluzione migliore.

apt-get install atop acct

Quindi puoi facilmente controllare cosa stava succedendo ad un certo punto usando la sintassi come

atop -r atop.log.file -b 00:00 -e 00:05

l'esempio sopra ti mostrerà cosa stava succedendo nello snapshot di utilizzo del sistema tra 00:00 e 00:05


1

Non ho esperienza facendo qualcosa di simile, ma in teoria è possibile farlo con blocchi esistenti:

CloudWatch -> SNS -> HTTP/HTTPS -> homebrew webapp -> collect data and email it
  • Imposta il tuo allarme CloudWatch in modo che pubblichi un messaggio SNS su un argomento quando si spegne.
  • Avere una webapp in esecuzione sull'istanza EC2 che, quando viene colpito un determinato indirizzo, raccoglie l'elenco dei processi in esecuzione e lo invia per e-mail.
  • Aggiungi una sottoscrizione all'argomento SNS con l'endpoint della webapp. Puoi scegliere HTTP o HTTPS come protocollo.

Puoi combinare questo con il suggerimento di utilizzare atope configurare la tua webapp per inviare gli output N-minute recenti.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.