Ho notato da pochi giorni che si verifica lo stesso tipo di messaggi ripetuti e posso affermare positivamente che nulla è stato intenzionalmente cambiato (installato / disinstallato) in quel periodo.
ecco un esempio del messaggio /var/log/kern.log :
Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down
Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down
Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down
Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
dal file di registro completo - quando si tiene conto di tutti i messaggi di registro di questo tipo - posso concludere:
- eth0 fallisce ogni poche ore
- eth0 fallisce nel primo caso per due e nel secondo per 19 secondi
È il server di produzione di cui sto parlando qui.
Come risolvere questo problema, poiché il server di posta è in produzione e non riesco a tollerare guasti di rete della durata di 19 secondi?