Ho 15 identici Linux RH 4.7 a 64 bit. Eseguono il database del cluster (il cluster è a livello di applicazione). A volte (ogni mese circa) si blocca una scatola a caso (mai uguale).
Posso eseguire il ping della casella e il ping funziona. Se provo a ssh nella casella ottengo:
ssh_exchange_identification: Connection closed by remote host
SSH è impostato correttamente.
Quando vado nella sala server e provo ad accedere direttamente alla console, posso cambiare console con Alt+ Fn, posso inserire un nome utente e i caratteri vengono visualizzati, ma dopo aver premuto Enter, non succede nulla. Ho aspettato 8 ore una volta e non è cambiato.
Ho impostato syslog per registrare tutto su un host remoto e non c'è nulla in quei registri. Quando riavvio la macchina, funziona senza problemi. Ho eseguito test HW: tutto è ok e non c'è nulla nei registri. Le macchine sono inoltre monitorate con NAGIOS e non vi sono carichi o attività insoliti prima del congelamento.
Ho finito le idee; cos'altro posso fare o controllare?