Utilizzeresti la RAM ECC in una workstation?


21

La RAM ECC è consigliata per l'uso nelle workstation o è utilizzata solo nei server? Se la RAM non ECC funziona nei PC, perché dovremmo avere bisogno della RAM ECC?

Risposte:


25

Man mano che le cose vengono archiviate, lasciate e infine estratte dalla RAM, si verifica naturalmente un po 'di corruzione (le teorie variano, ma quella con il maggior peso in questo momento è EMI dal computer stesso). ECC è una funzionalità di RAM e schede madri che consente il rilevamento e la correzione di questa corruzione.

La corruzione è di solito piuttosto lieve (l'ECC può di solito rilevare e correggere 1-2 bit per "word" a 64 bit - e questo va oltre i tipici tassi di errore), ma aumenta in frequenza con la densità della RAM. Il tuo PC / workstation medio non lo noterà mai. Su un server in cui si esegue la RAM ad alta densità 24 ore su 24, 7 giorni su 7, in un ambiente molto richiesto che serve servizi critici, si fa tutto il possibile per evitare che le cose si rompano.

Si noti inoltre che la RAM ECC deve essere supportata dalla scheda madre e la workstation / PC media non la supporta.

La RAM ECC è più costosa di quella non ECC, è molto più sensibile alle velocità di clock e può subire un piccolo calo delle prestazioni (1-2%). Se aiuta, un'analogia che funziona è dalla RAM ai controller RAID. Sul tuo PC, quel RAID software assistito dall'hardware integrato nel tuo chipset è un'ottima protezione contro guasti di un singolo disco. Su un server, ciò non sarebbe mai abbastanza. È necessario un RAID completamente hardware di fascia alta, alimentato a batteria, con RAM integrata per assicurarsi di non perdere dati a causa di un'interruzione dell'alimentazione, guasti del disco o altro.

Quindi no, non hai davvero bisogno della RAM ECC nella tua workstation. Il vantaggio semplicemente non giustifica il prezzo.


2
Come sottolineato anche nella risposta di Basil Bourque , i prezzi sono pressoché convergenti in questi giorni (quando ho guardato più di recente, la differenza di prezzo era del ~ 10% che ti aspetteresti dall'area aggiuntiva del chip, per la stessa quantità utilizzabile di RAM) . Potrebbe valere la pena di rivedere in particolare l'ultima frase alla luce di ciò.
un CVn

10

Se questo articolo è qualcosa da seguire, allora dovresti usare ECC RAM.

Non si tratta solo di "Non eseguo un server, quindi non ne ho bisogno". Dipende da quanto apprezzi i tuoi dati. Non è solo una questione di crash occasionali: il problema è che potresti ottenere la corruzione e non avere modo di sapere che sta succedendo.


3
Dall'articolo: "[...] 4 GB di RAM hanno una probabilità del 96% di avere un errore bit in tre giorni senza RAM ECC". Sembra che i computer debbano andare costantemente in crash e che i dati debbano essere danneggiati continuamente. Eppure sembra che tutti stiano andando abbastanza bene senza ECC ... perché?
Calimo,

1
Questo perché l'articolo è falso quando si tratta del tasso di errore. Il tasso di errore effettivo è inferiore di molti ordini di grandezza. Vedi il relativo thread reddit reddit.com/r/programming/comments/ayleb/…
mimrock

Qualunque sia il tasso di errore, dipende anche da cosa è interessato. È probabile che non sia qualcosa che causa un arresto anomalo del sistema.
sudo,

8

La RAM ECC diventa più interessante con l'aumentare delle dimensioni della memoria. La probabilità di un errore a singolo bit in una macchina con 8 GB di RAM è molto più elevata rispetto ai giorni di un PC / XT 640K, semplicemente a causa del maggior numero di bit. Su un server di database in cui quella RAM potrebbe trovarsi in un buffer del disco, anche un errore di bit può danneggiare l'archiviazione del disco. In genere ci si aspetterebbe di utilizzare la memoria ECC su un server.

Alcune stazioni di lavoro (in particolare quelle con CPU Xeon o Opteron) occupano memoria registrata, che in ogni caso è disponibile solo con i sapori ECC. Su un PC desktop è possibile vederlo come eccessivo.


4

La RAM ECC è progettata per aiutare a prevenire e correggere errori basati sulla memoria, in genere utilizzando una sorta di codice di hamming o ridondanza modulare. Ciò è molto utile nei server che contenevano dati importanti o che richiedono elevata disponibilità, ma ha un costo.

Anche se probabilmente vale la pena pagare un extra per i tuoi server importanti, vuoi davvero farlo per il tuo computer desktop, importa se a volte si verifica un errore di memoria? Sicuramente importa se il tuo database SQL rilascia alcuni dati durante una transazione, ma ti importa se il tuo documento Word è influenzato da un leggero blip di memoria?


4

Se si desidera una workstation affidabile , si desidera RAM ECC per essa. Si arresta in modo anomalo meno frequentemente e il lavoro svolto su di esso e i documenti memorizzati nella RAM non verranno danneggiati in modo casuale.


4
Sembra un'incommensurabilmente piccola possibilità di una migliore stabilità. Gli unici arresti anomali relativi alla RAM di cui sono a conoscenza sulle workstation sono dovuti a RAM difettosa o applicazioni errate, mai qualcosa che ECC avrebbe impedito. Ha un senso (leggi: ancora solo un po 'di senso) sui server in cui stai scricchiolando costantemente terabyte di dati, ma sulle workstation forse l'unica cosa che si avvicina è il rendering di grafica di fascia alta o l'elaborazione video. In breve, penso che tu possa ottenere una workstation completamente affidabile senza ECC RAM.
Chris Thorpe,

Ho eseguito memtest86 diverse volte durante la notte senza alcun errore. Ecco quanto spesso si verifica il capovolgimento della memoria ... Se le vite dipendono da questo, ciò giustificherebbe l'uso dell'ECC, altrimenti non penso che questo sia un vero problema il 99,9% dei casi. È molto improbabile che 1 bit casuale al mese colpirà qualcosa di critico in terabyte di dati.
inf3rno

Ofc. ZFS è un'eccezione.
inf3rno,

1
@ inf3rno Quell'argomento? Pernottamento è niente. L'altitudine conta. Vivo in Colorado e sul sistema ECC vedo diversi errori correggibili ogni mese. Torna con i log di un sistema ECC o non hai informazioni. Leggi anche il rapporto di Google sugli errori ECC.
Zan Lynx,


4

Un ulteriore vantaggio di ECC rispetto a quanto menzionato sopra è che è possibile rilevare RAM difettosa. Durante l'esecuzione di una lunga sessione memtest86 di solito si riscontrano problemi, potrebbero esserci problemi molto specifici con la RAM che si presentano solo raramente e in alcuni casi d'uso. Questo può ancora accadere molto più frequentemente della corruzione da cui è progettata una RAM ECC perfettamente protetta per proteggerla, forse una volta al mese. Quindi, se installi un software di monitoraggio, puoi essere sicuro che la tua RAM è buona o sostituire i chip difettosi. Ancora un vantaggio marginale, ma poiché la memoria ECC non è molto più costosa della RAM normale, può valerne la pena.


1

La memoria ECC ora costa circa la stessa memoria non ECC, poiché i prezzi sono diminuiti. Quindi controlla i prezzi; se i prezzi sono vicini, acquista ECC se la tua postazione lo ospita.


1

Penso che ci possa essere un po 'di confusione solo in base al titolo della domanda.

Se intendi solo il PC desktop medio, di solito si basa su una piattaforma che non ha nemmeno il supporto ECC.

Se intendi un computer di classe workstation , molto probabilmente viene fornito con la memoria ECC, che ti interessi o no.
Nel complesso, la classe workstation si basa in genere su hardware essenzialmente server ma con una grafica adeguata e impacchettata in un fattore di forma diverso.

Il carico di lavoro previsto è anche più faticoso rispetto a quello del PC desktop, quindi se si riconosce che ECC ha senso per i server, penso che ECC non abbia molto senso anche per le stazioni di lavoro.

Per i PC desktop, c'è qualche dibattito sul fatto che ECC avrebbe senso o meno. Si può assolutamente sostenere che tutto dovrebbe avere l'ECC ma, al momento, non è pratico in quanto l'industria ha deciso di rendere l'ECC una caratteristica per differenziare l'hardware di fascia alta.


0

Secondo l'articolo Zan Lynx collegato nei commenti: Errori DRAM allo stato brado: uno studio sul campo su larga scala , gli errori non correggibili sono comuni mentre errori correggibili casuali compaiono raramente in un sistema. L'incidenza è probabilmente di pochi in un anno, ma dipende dall'uso.

Quindi, in un ambiente server, gli errori correggibili potrebbero non essere così importanti, ma si avvia raramente le macchine server, quindi errori non correggibili causati dal fallimento della RAM possono essere lì non rilevati per un po 'corrompendo i dati. Penso che sia il motivo principale per cui i server necessitano di ECC. Le workstation si avviano e quindi controllano frequentemente la RAM, in modo da poter rilevare guasti hardware ad ogni riavvio. Se quella frequenza è sufficiente per la tua azienda, penso che non avrai bisogno della RAM ECC nella tua workstation.

Se stiamo parlando di errori di memoria, è meglio versioni i documenti importanti sul server. Quindi, se la workstation legge e modifica qualcosa, il contenuto originale non deve essere sovrascritto sul server. I backup regolari possono fare lo stesso per te.

Un altro aspetto di questa domanda è la sicurezza. Se la tua stazione di lavoro è connessa a una rete non sicura, potrebbe essere vulnerabile all'attacco del martello , che sfrutta un fenomeno legato alla DRAM. Quindi dal punto di vista della sicurezza è meglio usare la RAM ECC.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.