Abbiamo lottato con il controller RAID nel nostro server di database, un Lenovo ThinkServer RD120. È un Adaptec rinominato che Lenovo / IBM duplica ServeRAID 8k .
Abbiamo corretto questo ServeRAID 8k fino all'ultimo e più recente:
- Versione RAID BIOS
- Versione del BIOS backplane RAID
- Driver di Windows Server 2008
Questo controller RAID ha avuto più aggiornamenti critici del BIOS anche nel breve periodo di 4 mesi in cui lo abbiamo posseduto e la cronologia delle modifiche è semplicemente ... beh, spaventosa.
Abbiamo provato le strategie di write-back e write-through sulle unità RAID logiche. Si verificano ancora errori I / O intermittenti durante l'attività del disco pesante. Non sono comuni, ma gravi quando si verificano, poiché causano timeout I / O di SQL Server 2008 e talvolta errori dei pool di connessioni SQL.
Eravamo alla fine della nostra corda per risolvere questo problema. A corto di cose hardcore come la sostituzione dell'intero server o la sostituzione dell'hardware RAID, stavamo diventando disperati.
Quando ho ricevuto il server per la prima volta, ho avuto un problema a causa del quale il vano unità n. 6 non veniva riconosciuto. Il passaggio da un disco rigido a un altro marchio, stranamente, ha risolto questo problema e l'aggiornamento del BIOS RAID (per la prima volta molte volte) lo ha risolto in modo permanente, quindi sono stato in grado di utilizzare l'unità "incompatibile" originale nel vano 6. Su un intuizione, ho iniziato a ritenere che i dischi rigidi SATA Western Digital che avevo scelto fossero in qualche modo incompatibili con il controller ServeRAID 8k.
L'acquisto di 6 nuovi dischi rigidi è stata una delle opzioni più economiche sul tavolo, quindi ho optato per 6 dischi rigidi Hitachi (aka IBM, aka Lenovo) secondo la teoria che un controller RAID IBM / Lenovo ha maggiori probabilità di funzionare con le unità in genere venduto con.
Sembra che quel sospetto sia stato ripagato: abbiamo passato tre dei nostri giorni di carico più pesanti (lun, mar, mer) senza un singolo errore I / O di alcun tipo. In precedenza, in questo lasso di tempo avevamo regolarmente almeno un "evento" I / O. Sembra che cambiare le marche di hard disk abbia risolto i nostri problemi intermittenti di I / O RAID!
Mentre capisco che IBM / Lenovo probabilmente testano il loro controller RAID esclusivamente con la propria marca di dischi rigidi, sono disturbato dal fatto che un controller RAID avrebbe problemi di I / O così sottili con particolari marche di dischi rigidi.
Quindi la mia domanda è: questo tipo di incompatibilità dell'unità SATA è comune con i controller RAID? Esistono alcune marche di unità che funzionano meglio di altre o sono "convalidate" rispetto a un controller RAID specifico? Avevo ipotizzato che tutti i dischi rigidi SATA di merce fossero simili e funzionassero ragionevolmente bene in qualsiasi controller RAID (di qualità sufficiente).