Uno dei nostri server Linux (CentOS) era irraggiungibile ieri sera.
Il server non era raggiungibile in alcun modo tranne che per la console remota. Dopo aver effettuato l'accesso con la console remota, non è stato possibile eseguire il ping di nessun host esterno.
Un semplice service network restart
risolto il problema, ma mi chiedo ancora cosa avrebbe potuto causare questo. I miei file di registro sembrano non indicare alcun errore (ad eccezione dei vari demoni che necessitano di una connessione di rete e falliscono dopo l'errore di rete).
È possibile eseguire ulteriori passaggi per scoprire la causa di questo problema?
EDIT : questo è appena successo di nuovo. Il server non ha risposto completamente finché non ho emesso un riavvio del servizio di rete. Qualsiasi consiglio è il benvenuto. Questo potrebbe essere causato da un componente hardware difettoso?
Come da richiesta di Madhatters, ecco alcuni estratti dal registro in quel momento (la rete si è schiantata alle 20:13):
/ var / log / messages:
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=101 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=100 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=101 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:13:34 graviton junglediskserver: Connection to gateway failed: xGatewayTransport - Connection to gateway failed.
I primi tre messaggi sono semplici risposte alle regole di iptables che ho impostato tramite il firewall LFD. L'ultimo messaggio indica che JungleDisk, che utilizzo per i backup, non può più connettersi al gateway. A parte questo, non ci sono messaggi interessanti in questo periodo.
MODIFICA 4 dic: come da richiesta di Mattdm, ecco l'output di ethtool eth0
:
(Per favore, non che queste siano le impostazioni attualmente funzionanti . Se le cose dovessero andare di nuovo male, sarò sicuro di ripubblicare di nuovo se necessario.
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: g
Wake-on: d
Link detected: yes
Come da richiesta di Joris, ecco anche l'output di route -n
:
aron@graviton [~]# route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
xx.xx.xx.58 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.42 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.43 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.41 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.46 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.47 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.44 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.45 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.50 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.51 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.48 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.49 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.54 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.52 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.53 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.0 0.0.0.0 255.255.255.192 U 0 0 0 eth0
xx.xx.xx.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
169.254.0.0 0.0.0.0 255.255.0.0 U 0 0 0 eth0
0.0.0.0 xx.xx.xx.62 0.0.0.0 UG 0 0 0 eth0
Il xx.62 in basso è il mio gateway.
EDIT il 28 dicembre: il problema si è verificato di nuovo e ho avuto la possibilità di confrontare alcuni dei risultati dei test sopra. Quello che ho scoperto è che arp -an
restituisce un indirizzo MAC incompleto per il mio gateway (che non è sotto il mio controllo; il server si trova in un rack condiviso):
Durante il fallimento:
? (xx.xx.xx.62) at <incomplete> on eth0
Dopo service network restart
:
? (xx.xx.xx.62) at 00:00:0C:9F:F0:30 [ether] on eth0
È qualcosa che posso risolvere o è tempo di contattare il data center?