Ancora preoccupato: l'adattatore per host interrompe gli errori di richiesta dopo aver seguito i passaggi consigliati


9

Sto ottenendo il famigerato timore: l'adattatore host interrompe l'errore di richiesta con il mio nuovo controller RAID Adaptec in I / O elevato. Ho letto diversi forum, anche Adaptecs , che impostando il valore / sys / block / sdX / device / timeout su 45 risolverà questo problema. Tuttavia sto eseguendo Ubuntu Server 12.04 che ha già questo valore a 45 per impostazione predefinita. Ho anche provato il suggerimento successivo che era quello di aggiornare il bios del mio mobo all'ultimo, che ho fatto.

Non sono sicuro che qualcun altro si sia imbattuto in questo errore "aacraid: L'adattatore host ha interrotto la richiesta" prima ancora di aver seguito questi passaggi.

Questo è quello che vedo nel mio syslog:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Ecco il mio uname -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Ringrazia tutti,

Jim

Risposte:


1

Nel caso in cui non lo avessi ancora risolto, di recente ho lottato con lo stesso problema che è rapidamente aumentato all'array sospeso ogni 5 minuti per un paio di minuti con l'aumento dell'IO. Ubuntu per impostazione predefinita utilizza lo scheduler CFQ che non è ottimale per l'hardware RAID. Passa lo scheduler a Noop con:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Personalmente sono bloccato con il vecchio kernel, ma mi è stato detto anche che l'aggiornamento al driver più recente dovrebbe risolvere il problema, ma non posso verificarlo. Ma anche così, passa a Noop. Poiché sysfs non è permanente, è possibile che si desideri impostare lo scheduler /etc/rc.localo utilizzare il elevator=parametro boot.

Presterei attenzione ad altri parametri del kernel e le impostazioni su Ubuntu sono impostazioni predefinite ragionevoli per l'hardware più comune, ma la maggior parte delle volte i server hanno bisogno di un'attenzione speciale indipendentemente dalla distro che stai utilizzando.


1

Se il controller RAID Adaptec ha il proprio firmware / BIOS, potrebbe essere necessario aggiornarlo. Abbiamo avuto problemi durante l'I / O elevato e abbiamo ottenuto "aachraid: richiesta di interruzione dell'adattatore per host" e abbiamo visto una versione del firmware più recente di quella attuale che diceva "Risolto un problema a causa del quale il firmware poteva bloccarsi durante uno stress I / O elevato". http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

Le note di rilascio sopra elencate elencano i seguenti modelli Adaptec: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

Abbiamo anche linee di registro come:

sd 0:0:0:0: timing out command, waited 360s

e

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

Nel cercare online per vedere altre persone che hanno un problema simile, abbiamo trovato un'altra linea di carte che ha avuto i seguenti problemi risolti dal firmware che potrebbero essere rilevanti:

I due precedenti si applicano ai modelli Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q e 81605ZQ.


Penso che il mio controller si bloccherebbe quando ho usato l' arcconfutility della riga di comando per interrogare lo stato dell'array come parte dei nostri normali script di monitoraggio di Nagios. Come indicato dalle note del firmware, l'utilizzo arcconfpuò causare il blocco del controller.
Stefan Lasiewski,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.