Cosa differenzia l'archiviazione cloud (Amazon AWS, Microsoft Azure, google Apps) dalle tradizionali reti di archiviazione dei data center (SAN e NAS)?


8

Un po 'di confusione a causa della mia domanda per semplificare:

"Che tipo di archiviazione utilizzano i grandi provider di cloud e perché?"

Per quanto ne so, tuttavia non sono in grado di trovare alcun tipo di differenze di rete di archiviazione ufficiali tra data center e cloud tipici, tutti i provider di cloud utilizzano DAS diversi dai data center tipici.

Anche DAS presenta molti svantaggi rispetto a SAN o NAS, voglio apprendere i dettagli del perché i cloud utilizzano DAS per scopi di archiviazione o applicazione.

Qualsiasi risorsa o descrizione sarà apprezzata per chiarirmi.

EDIT: Mentre leggono il documento "Sfide di rete e approcci risultanti per la costruzione di cloud su larga scala, David Bernstein ed Erik Ludvigson (Cisco)" citano che,

Curiosamente non vediamo i cloud dei principali fornitori che utilizzano NAS o SAN. L'architettura cloud tipica utilizza DAS, che non è tipico degli approcci di archiviazione di Datacenter.

Ma qui c'è un conflitto: secondo me e anche affermato più avanti nel documento, Clouds dovrebbe usare SAN o NAS perché DAS non è appropriato quando una VM si sposta su un altro server ma deve ancora accedere all'archiviazione dal server originale.

Quali sono altri motivi per cui i cloud di effetti preferiscono DAS, NAS o SAN? che tipo di archiviazione utilizzano i grandi provider cloud e perché?


2
Stai chiedendo "Qual è la differenza per me tra l'archiviazione dei miei dati nel cloud e l'archiviazione utilizzando la mia SAN o NAS" o "Che tipo di archiviazione utilizzano i grandi provider di cloud e perché"?
Randy Orrison,

Risposte:


4

Questa risposta è stata modificata dopo che la domanda è stata chiarita.

Quali sono gli altri motivi per cui le nuvole preferiscono il DAS

Dove "DAS" significa archiviazione diretta collegata, ad esempio unità disco fisso SATA o SAS.

Tutti i fornitori di servizi cloud utilizzano DAS perché offre miglioramenti dell'ordine di grandezza in termini di prezzo / prestazioni. È un caso di ridimensionamento orizzontale .

In breve, i dischi rigidi SATA e i controller SATA sono prodotti economici. Sono prodotti del mercato di massa e hanno un prezzo molto basso. Costruendo un grande gruppo di PC economici con unità SATA economiche, Google, Amazon e altri ottengono una vasta capacità a un prezzo molto basso. Quindi aggiungono il proprio livello software in cima. Il loro software esegue la replica multi-server per prestazioni e affidabilità, monitoraggio, riequilibrio della replica dopo guasti hardware e altro.

Puoi dare un'occhiata a MogileFS come rappresentante più semplice del tipo di software che Google, Amazon e altri usano per l'archiviazione. Naturalmente è un'implementazione diversa, ma condivide molti degli stessi obiettivi e soluzioni di progettazione dei sistemi su larga scala. Se vuoi, ecco un punto di partenza per saperne di più su GoogleFS .

dichiarato più avanti nel documento, i cloud dovrebbero usare SAN o NAS perché DAS non è appropriato quando una VM si sposta su un altro server

Esistono 2 motivi per cui le SAN non vengono utilizzate.

1) Prezzo. Le SAN sono estremamente costose su larga scala. Sebbene possano essere la soluzione tecnicamente "migliore", in genere non vengono utilizzati in installazioni su larga scala a causa dei costi.

2) Il teorema del CAP Il teorema del CAP di Eric Brewer mostra che su larga scala non è possibile mantenere una forte coerenza mantenendo affidabilità, tolleranza ai guasti e prestazioni accettabili. Le SAN sono un tentativo di creare una forte coerenza nell'hardware. Ciò può funzionare bene per un'installazione di 5.000 server, ma non è mai stato dimostrato che funzioni con oltre 250.000 server di Google.

Risultato: finora i fornitori di cloud computing hanno scelto di estendere la complessità del mantenimento dello stato del server allo sviluppatore dell'applicazione. Le offerte cloud attuali non forniscono uno stato coerente per ogni macchina virtuale. I server delle applicazioni (macchine virtuali) potrebbero bloccarsi e i loro dati locali potrebbero andare persi in qualsiasi momento.

Ogni fornitore ha quindi la propria implementazione di archiviazione persistente, che dovresti usare per dati importanti. Le offerte di Amazon sono ottimi esempi; MySQL , SimpleDB e Simple Storage Service . Queste stesse offerte riflettono il teorema di CAP: l'istanza di MySQL ha una forte coerenza, ma una scalabilità limitata. SimpleDB e S3 si ridimensionano in modo fantastico, ma alla fine sono coerenti.


Ora la domanda è chiara. Grazie per i collegamenti li controllerò.
Berkay,

ho controllato tutti i collegamenti, grazie per le risposte. In generale possiamo dire che DAS è preferito per i fornitori di cloud, ma per alcune applicazioni è possibile utilizzare anche SAN o NAS.
Berkay

1

Se si utilizza DAS, la disponibilità è il problema

Se si utilizzano DAS poi la disponibilità è un problema loro. E se sono buoni, useranno diversi strati di astrazione per garantire che il loro problema non diventi il ​​tuo problema. Piuttosto che essere bloccati su come scelgono di montare i loro dischi all'interno del loro datacenter, il problema è se la disponibilità che garantiscono nel loro SLA è adeguata alle vostre esigenze. Oh, e il vero elefante nella stanza, cosa fai se falliscono (probabilmente non per alcuni fornitori ma dovresti comunque considerarli) e cosa fai se usi questi dati localmente e la tua connessione interweb è non disponibile: quest'ultimo è sostanzialmente più probabile della loro scelta di DAS che porta direttamente a un'interruzione.


0

Anche se non ho la risposta su DAS vs SAN / NAS ... Ci sono molte cose da considerare quando si cercano soluzioni di archiviazione.

La quantità di dati? Se stiamo prendendo in considerazione Gb, va bene, un NAS con un backup potrebbe fare il lavoro. Se ci sono terrabyte di dati, il prezzo aumenta molto velocemente.

Penso che il prezzo sia il fattore principale ... se si dispone di una SAN, è necessario:

  • Amministratori per configurarlo / gestirlo.
  • Sala server (elettricità, larghezza di banda, misure di sicurezza attorno a quella stanza, ...)

Eppure, non hai affatto ridondanza. Se hai accesso a un datacenter, le cose potrebbero essere diverse.

Un'altra cosa da considerare è l'accessibilità. Stai archiviando? Se l'accessibilità non è un problema, un paio di volte al giorno / settimana / mese archiviate nella soluzione di archiviazione.

Se invece hai dati a cui devi accedere costantemente, trovi rapidamente un collo di bottiglia di larghezza di banda, limitazione hardware (come I / O). D'altra parte, se si dispone di un'elevata quantità di trasferimento con i dati, ci sono buone probabilità che una soluzione di archiviazione online ti costi molto.

Il ROI (Return on Investment) è ciò su cui tutti i fornitori di soluzioni di archiviazione online pubblicizzano e spesso hanno ragione, a seconda dell'utilizzo, ovviamente.

In bocca al lupo.


0

(Solo opinione e ampiamente generalizzante.)

La differenza è lo strato di astrazione che stai osservando (in generale).

SAN / NAS in genere forniscono un volume sul quale è possibile installare un file system. Il valore di questo approccio al sistema finale è che hai esternalizzato i dettagli dell'hardware fisico (ad esempio livello RAID, posizione fisica, ecc.).

Al contrario, l'archiviazione cloud di solito ti fornisce un'interfaccia per un filesystem. Il vantaggio qui è che spesso puoi ottenere gratuitamente funzionalità di ordine superiore (ad esempio Dropbox esegue il controllo automatico delle versioni di ogni file, in modo trasparente).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.