Come posso vedere i log in un server dopo un blocco del panico del kernel?


10

Sto eseguendo una macchina gentoo Linux di produzione, e di recente c'è stata una situazione in cui il server si è bloccato nella mia sede condivisa e quando sono arrivato ho notato che il server era bloccato su quello che sembrava essere un blocco di panico del kernel. Ho riavviato la macchina con un riavvio difficile e sono rimasto deluso nello scoprire che non sono riuscito a trovare una briciola di prove da nessuna parte sul perché la macchina si è bloccata.

È vero che quando eseguo un riavvio difficile i messaggi si perderanno o c'è un'impostazione che posso fare da qualche parte dire in syslog-ng o forse in sysctl almeno per conservare il registro degli errori in modo da evitare che si verifichino tali incidenti nel futuro ? A proposito, sto eseguendo un kernel 2.6.x.

Grazie in anticipo.

Risposte:


5

Per registrare un panico nel kernel, usare netconsole è molto più semplice che usare un collegamento seriale;)

C'è una voce utile al riguardo su Ubuntu wiki che può essere utilizzata su altri gusti di Linux ... Mi ha aiutato ad esempio con Archlinux.

Si noti che netconsole può anche essere configurato all'avvio.


4

Generalmente in queste situazioni ho installato una console seriale remota e poi mi sono assicurato di registrare tutto ciò che appare sulla console. È possibile farlo collegando la porta seriale della macchina a un'altra macchina tramite un cavo RS-232. Questo potrebbe essere un po 'più complicato in questi giorni poiché le porte seriali stanno gradualmente scomparendo, ma penso che la maggior parte dei server li abbia ancora.

Quindi su quell'altra macchina, esegui il server e configura la registrazione della console. Questo fornisce un buon modo sia per registrare tutto sulla console sia per fornire un percorso di accesso alternativo al sistema.

Se non si desidera configurare e amministrare un'altra casella di Linux, un'alternativa è installare un server console seriale. Varie aziende come Avocent, Cyclades e Raritan realizzano queste scatole che forniscono un'interfaccia di rete a 2-48 porte seriali. Tuttavia, questo genere di cose sarà più costoso della semplice configurazione di un altro box Linux ovviamente.


4
Oltre alla risposta di Phil, nota che molti (la maggior parte?) * Sistemi NIX scaricano il kernel / RAM nella partizione di swap in caso di panico e copiano il dump /var/crasho /var/adm/crashal riavvio per consentire di attaccarlo con un debugger e vedere dove ha avuto luogo il panico. La console seriale è comunque un'ottima opzione, in quanto ti consente di vedere qual è stata l'ultima cosa che il server ha fatto prima panic()dell'ing.
voretaq7,

0

Puoi provare a replicare i messaggi syslog su un altro computer. Forse non tutti, ma solo avvisi e critiche e disabilitano la memorizzazione nella cache per loro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.