In che modo i servizi con elevate percentuali di importazione installano abbastanza dischi rigidi abbastanza velocemente?


13

Amazon, Facebook e Google devono accettare TB se non PB al giorno, quindi ciò significa che hanno persone che installano continuamente nuovi dischi rigidi e cavi in ​​nuovi rack nello stesso modo in cui potresti costruire un server normale o viene utilizzata una tecnologia diversa per il collegamento di unità in massa?



Un altro aspetto a cui pensare è il tasso di guasti delle unità con così tanto spazio di archiviazione e come tengono il passo. Alcune persone hanno stimato che Google potrebbe avere un nuovo guasto dell'unità da qualche parte ogni minuto.
Matt,

Risposte:


16

Non so se qualcuno di loro stia installando l'hardware un server alla volta. Nel 2008 MS ha iniziato a costruire i suoi data center consegnando i server in container di spedizione sigillati e precablati di server che dovevano solo scaricare da un camion e collegare le connessioni di alimentazione / rete. Mentre la build 08 era un mix di container e tradizionale per il loro data center più recente, da allora sono passati a un design prefabbricato personalizzato che è resistente alle intemperie e non ha bisogno di essere alloggiato all'interno di edifici separati.

Sia HP che IBM vendono pacchetti simili con contenitori predefiniti pieni di server che richiedono solo connessioni di alimentazione / dati per la distribuzione.

Boyden Virginia Data Center di Microsoft con moduli prefabbricati esposti alle intemperie.


Questa è, per me, l'unica risposta che affronta davvero la domanda iniziale. +1
mveroone,

1
A proposito, ecco la fonte per quella foto . È un datacenter di Microsoft Azure in Virginia.
tedder42

Qualcuno deve ancora costruire / connettere / testare il server container di spedizione alla volta e google / facebook tendono a fare il loro hardware in casa.
Matt,

@mindthemonkey che viene eseguito nella stessa fabbrica usando la stessa manodopera cinese a basso costo in cui vengono assemblati i normali server / blade montati su rack utilizzati da tutti noi.
Dan è Fiddling di Firelight il


7

Google ha diverse tecnologie che hanno sviluppato internamente per archiviare queste enormi masse di dati. Utilizzando queste tecnologie possono effettivamente aggiungere carichi di camion di dischi rigidi nel loro cluster senza tempi di inattività, ma sì, hanno ancora bisogno che le persone lo facciano.

Per quanto ne so dal blog di Google, le due parti principali sono il file system di Google, che è un file system distribuito che può essere scalato su larga scala: Google File System

E oltre al file system di Google hanno Big Table, che è una sorta di database di valori chiave e si espande anche in enormi scale: Big Table

Per garantire l'alta disponibilità, tutto è ridondante molte volte, più di 3 volte nella maggior parte dei casi.


1
Penso che la domanda sia più orientata all'hardware, e la tua risposta sia un po 'fuori tema, ma questa è un'informazione di buona conoscenza.
mveroone,

5

È esattamente corretto. Ricordo che un giorno, i datacenter di Facebook stavano aggiungendo tre rimorchi per trattori pieni di dischi rigidi e server montati su rack nel giorno medio. Naturalmente, hanno schemi complicati per rendere ridondante e ridimensionabile l'archiviazione. Google, ad esempio, ha GFS . Facebook ha tre data center solo per le loro apparecchiature, ciascuno più grande di due Wal-Mart e uno nuovo pianificato quattro volte più grande dei loro centri esistenti.


2

Con le soluzioni di storage Open Compute di nuova generazione in grado di contenere 180 TB di disco in 4 unità rack, un PB non è davvero una grande quantità di spazio: l'aggiunta di 1 PB al giorno significherebbe il racking di 5 server di questo tipo al giorno, non è un grosso problema. Meglio ancora, questi si possono avere per circa $ 10K, il che significa che stai pagando meno di $ 60 per TB.

Quindi sì, la tecnologia è disponibile per tutti noi per fare lo stesso, ad un prezzo che non rompe la banca.

Ma devi tenere presente che le aziende più grandi ottengono sempre un affare migliore e firmano contratti di grandi dimensioni per procurarsi grandi quantità di spazio di archiviazione. Potrebbero avere piccole spedizioni distribuite nel corso dell'anno, ma non è come se ordinassero solo 1 PB alla volta.


1
Le specifiche del deposito aperto sono online . Con unità da 4 TB sono fino a 120 TB in 2U.
Matt,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.