Perché l'unità Hitachi HDS5C3020 non partizionata inizia a consumare il 50% in più di energia 15 minuti dopo l'avvio?


19

In un sistema Debian 6.0.6 ci sono 74 pezzi di unità Toshiba DT01ABA200 da 2 TB. Queste unità sono identificate come unità Hitachi HDS5C3020BLE630 che eseguono la revisione del firmware MZ4OAAB0. 64 unità collegate tramite schede di espansione HP SAS HP a un controller SAS LSI 2008, altre 5 unità sono collegate direttamente alla scheda madre, 4 unità sono collegate a un controller PCI basato su Sil e l'ultima 1 unità è alimentata e non è collegato alcun cavo dati. Il BIOS integrato del controller LSI e della scheda Sil sono entrambi disabilitati e i moduli mpt2sas e sata_sil sono rimossi dal debian Linux 2.6.32-5-amd64 # 1 SMP Dom 23 settembre 10:07:46 UTC 2012 x86_64 kernel GNU / Linux. Il modulo mpt2sas viene caricato dopo l'avvio usando un comando modprobe in /etc/rc.local. Queste 74 unità non sono partizionate, né formattate e non montate.

Il sistema consuma:

  • con 0 unità : 70,6 - 70,9 Watt (anche 15 minuti dopo l'avvio);
  • con 74 unità : 330 - 360 Watt, subito dopo l'avvio (equivale a 3,5 - 3,9 W per unità in stand-by);
  • con 74 unità : 420 - 466 Watt, ogni volta nei 15 minuti di uptime (equivale a 4,7 - 5,3 W per unità in stand-by).

Le specifiche del convertitore elencano 4,7 W come lettura / scrittura e 3,3 W come consumo inattivo.

L'aumento del consumo di energia è molto probabile sulla linea a 5 V, perché dopo circa 1 minuto un "OCP (Power Over Protection Protection) dell'alimentatore (PSU) interrompe l'alimentazione. L'alimentatore utilizzato è un modello a binario singolo con un OCP di> 122A sulla linea 12V e> 55A sulla linea 5V.

Regressione:

  • Non importa se il valore APM dell'unità è impostato su disabilitato o 1 (massimo risparmio energetico).
  • Il sistema operativo non registra alcuna attività di lettura / scrittura in /proc/diskstats. I valori sono identici (28 operazioni di lettura, 0 operazioni di scrittura) come immediatamente dopo l'operazione modprobe.
  • Non è possibile verificare cosa succede quando si avvia nella scheda madre è BIOS - per escludere qualsiasi intervento del sistema operativo - perché la scheda madre Super Micro X8SI6-F con firmware 27/06/12 ha un bug che legge erroneamente una temperatura del sensore CPU +74,0 C come " Alto "in modalità BIOS e interrompe l'alimentazione dopo 1 minuto.

Cosa potrebbe causare l' attività di lettura / scrittura dell'unità su tutte le unità nel 15 ° minuto dopo l'avvio e come impedire che ciò accada?


Solo curioso ... Che tipo di sistema è questo? Sistema di backup? Tutto il software RAID?
ewwhite,

Attualmente solo test, destinato all'archiviazione di backup senza RAID. La ridondanza sarà fornita da server secondari e terziari opzionali.
Pro Backup

@ewwhite mi ricorda i baccelli Backblaze. Qualcuno ha dovuto menzionare quel nome.
Dmitri Chubarov,

@Dmitri Chubarov È come un pod di archiviazione Backblaze, ma senza moltiplicatori di porte SATA, altezza 5U, nessun RAID, 74 invece di 45 unità, un singolo PSU, solo 2,0 Watt di consumo energetico per il raffreddamento e quando tutte le unità girano in modalità inattiva con un differenza di temperatura di 6 gradi tra l'unità più fredda e più calda.
Pro Backup

Risposte:


20

Sembra che le unità stiano eseguendo lo scrubbing SMART (test offline automatico).

smartctl -a /dev/hdx

dovrebbe confermare la configurazione con:

Auto Offline Data Collection: Enabled.

Disabilita con:

smartctl --offlineauto=off /dev/hdx

Potrebbe essere anche qualcos'altro ...


smartctl --offlineauto=offha fatto il trucco. Almeno per 32 minuti non ci sono più enormi aumenti del consumo di energia che causano lo spegnimento dell'OCP dell'alimentatore. Come bonus hdparm -SX ora imposta le unità da "attivo / inattivo" a "standby". Tuttavia, le unità collegate al controller sata_sil non possono essere controller. La soluzione temporanea è collegare temporaneamente queste unità a un altro controller. L'impostazione della raccolta dati offline sopravvive ai riavvii e ai cicli di accensione.
Pro Backup
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.