Ho ricevuto un'e-mail da un utente preoccupato che i seguenti errori su uno dei suoi server siano indicativi di un grave problema. Il problema è che gli errori che seguono sono tutto ciò che devo fare. Di solito mi considero un googler decente, ma in questo caso posso trovare solo un altro incidente in cui gli utenti hanno riscontrato questo errore relativo a "Directory filtro sonda":
[1044 snapshots @ abc]$
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: CPU:0
MC4_STATUS[Over|CE|MiscV|-|AddrV|-|Poison|CECC]: 0xdc0248d0001f010b
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: MC4_ADDR: 0x0000000000010f40
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: Northbridge Error (node 0): ECC Error in the
Probe Filter directory.
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: GEN
Da quello che posso dire, questo è successo solo una volta. Sfogliando i registri per altri errori hardware non si verifica altro che questo incidente.
Il post sul forum che ho citato sopra termina semplicemente dicendo all'utente di non preoccuparsene se è successo solo una volta e non ha causato problemi fatali. Questo è lo stesso consiglio che ho ricevuto dai miei colleghi, che hanno anche menzionato che ci sono troppe variabili (vale a dire che cosa stava funzionando alle 2:50 dell'8 settembre?).
Tuttavia, questo utente vuole essere rassicurato sul fatto che qualcosa non vada storto nel proprio sistema. Cosa possono indicare o essere correlati gli errori di cui sopra? Che cos'è la "directory del filtro della sonda?" Quali test posso eseguire per mettere a proprio agio l'utente in modo che questo non segnali la sua macchina per un destino imminente?
La distribuzione Linux della macchina è Red Hat Enterprise Linux Server versione 6.4 (Santiago).