Usiamo Nagios per monitorare parecchi (~ 130) server. Monitoriamo CPU, disco, RAM e poche altre cose su ciascun server. Ho sempre usato SSH per eseguire i comandi remoti, semplicemente perché richiede poca o nessuna configurazione aggiuntiva sul server remoto, basta installare nagios-plugins, creare l'utente nagios e aggiungere la chiave SSH, il tutto in cui ho automatizzato uno script di shell. Non ho mai considerato le implicazioni delle prestazioni dell'utilizzo di SSH su NRPE.
Non sono troppo infastidito dal hit di caricamento sul server Nagios (probabilmente è sovra-specificato per quello che fa, non è mai stato oltre il 10% della CPU), ma eseguiamo ogni controllo remoto ogni 30 secondi e ogni server ha 5 controlli diversi eseguita. Presumo che SSH richieda più risorse per ogni controllo, ma c'è una differenza enorme? (IE abbastanza di una differenza per giustificare il passaggio a NRPE).
Se è di aiuto, monitoriamo un mix di server fisici (normalmente con 8, 12 o 16 core fisici) e istanze medio / grandi di Amazon EC2.