C'è una bassa probabilità di completo fallimento dello chassis ...
Probabilmente riscontrerai problemi nella tua struttura prima di subire un guasto completo di un contenitore blade.
La mia esperienza è principalmente con custodie HP C7000 e HP C3000 blade. Ho anche gestito soluzioni blade Dell e Supermicro. Il venditore conta un po '. Ma in sintesi, le apparecchiature HP sono state stellari, Dell è andata bene e Supermicro era carente in termini di qualità, resilienza ed era solo mal progettato. Non ho mai riscontrato guasti sul lato HP e Dell. Il Supermicro ha avuto gravi interruzioni, costringendoci ad abbandonare la piattaforma. Su HP e Dells, non ho mai riscontrato un guasto completo allo chassis.
- Ho avuto eventi termici. L'aria condizionata è fallita in una struttura di co-locazione che ha inviato temperature a 115 ° F / 46 ° C per 10 ore.
- Sbalzi di corrente e interruzioni di linea: perdita di un lato di un feed A / B. Singoli guasti all'alimentazione. Di solito ci sono sei alimentatori nelle configurazioni del mio blade, quindi c'è un ampio avvertimento e ridondanza.
- Singoli guasti del server blade. I problemi di un server non influiscono sugli altri nel contenitore.
- Un incendio nel telaio ...
Ho visto una varietà di ambienti e ho avuto il vantaggio di installare in condizioni ideali per i data center, oltre che in alcuni luoghi più difficili. Sul lato HP C7000 e C3000, la cosa principale da considerare è che il telaio è completamente modulare. I componenti sono progettati per ridurre al minimo l'impatto di un guasto ai componenti che interessa l'intera unità.
Pensala in questo modo ... Il telaio principale C7000 è composto da gruppi frontplane (passivo) anteriore e backplane. L'involucro strutturale tiene semplicemente insieme i componenti anteriore e posteriore e supporta il peso dei sistemi. Quasi ogni parte può essere sostituita ... credimi, ne ho smontate molte. I principali licenziamenti riguardano la gestione di ventilatore / raffreddamento, alimentazione e collegamento in rete. I processori di gestione ( HP Onboard Administrator ) possono essere accoppiati per ridondanza, tuttavia i server possono funzionare senza di essi.
Contenitore completamente popolato - vista frontale. I sei alimentatori nella parte inferiore percorrono l'intera profondità del telaio e si collegano a un gruppo di backplane di alimentazione modulare nella parte posteriore della custodia. Le modalità di alimentazione sono configurabili: ad es. 3 + 3 o n + 1. Quindi la custodia ha sicuramente ridondanza di potenza.
Custodia completamente popolata - vista posteriore. I moduli di rete Virtual Connect nella parte posteriore hanno una connessione incrociata interna, quindi posso perdere un lato o l'altro e mantenere comunque la connettività di rete ai server. Esistono sei alimentatori sostituibili a caldo e dieci ventole sostituibili a caldo.
Contenitore vuoto - vista frontale. Nota che non c'è davvero nulla in questa parte del recinto. Tutte le connessioni vengono passate al midplane modulare.
Gruppo midplane rimosso. Notare i sei alimentatori per l'assemblaggio del piano centrale nella parte inferiore.
Assemblaggio del midplane. Qui è dove avviene la magia. Notare le 16 connessioni downplane separate: una per ciascuno dei server blade. Ho avuto guasti ai singoli socket / baie del server senza uccidere l'intero enclosure o influire sugli altri server.
Backplane (i) di alimentazione. Unità 3ø sotto il modulo monofase standard. Ho modificato la distribuzione di energia nel mio data center e ho semplicemente scambiato il backplane dell'alimentatore per gestire il nuovo metodo di erogazione dell'energia
Danneggiamento del connettore del telaio. Questo particolare involucro è stato lasciato cadere durante il montaggio, rompendo i pin di un connettore a nastro. Questo è passato inosservato per giorni, con il risultato che il telaio della lama in esecuzione ha preso FUOCO ...
Ecco i resti carbonizzati del cavo a nastro del piano centrale. Ciò controllava parte della temperatura del telaio e il monitoraggio ambientale. I server blade all'interno hanno continuato a funzionare senza incidenti. Le parti interessate sono state sostituite a mio piacimento durante i tempi di inattività programmati e tutto è andato bene.