Ho un server HP ProLiant DL380 G7 in esecuzione come unità di archiviazione NexentaStor . Il server ha 36 GB di RAM, 2 controller SAS LSI 9211-8i (senza espansori SAS), 2 unità di sistema SAS, 12 unità dati SAS, un disco hot-spare, una cache L2ARC Intel X25-M e un acceleratore DDRdrive PCI ZIL. Questo sistema serve NFS a più host VMWare. Ho anche circa 90-100 GB di dati deduplicati sull'array.
Ho avuto due incidenti in cui le prestazioni sono aumentate improvvisamente, lasciando gli ospiti VM e le console Nexenta SSH / Web inaccessibili e richiedendo un riavvio completo dell'array per ripristinare la funzionalità. In entrambi i casi, è stato l'SSD Intel X-25M L2ARC a non funzionare o è stato "disattivato". NexentaStor non è stato in grado di avvisarmi dell'errore della cache, tuttavia l'avviso FMA ZFS generale era visibile nella schermata della console (non risponde).
L' zpool status
output ha mostrato:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Ciò non ha attivato alcun avviso all'interno di Nexenta.
Avevo l'impressione che un errore L2ARC non avrebbe avuto un impatto sul sistema. Ma in questo caso, era sicuramente il colpevole. Non ho mai visto alcun consiglio su RAID L2ARC. Rimuovere completamente l'SSD difettoso dal server mi ha riportato in esecuzione, ma sono preoccupato per l'impatto dell'errore del dispositivo (e forse anche per la mancanza di notifica da NexentaStor).
Modifica : qual è l'attuale SSD di scelta migliore per le applicazioni cache L2ARC in questi giorni?