Questa risposta è stata modificata dopo che la domanda è stata chiarita.
Quali sono gli altri motivi per cui le nuvole preferiscono il DAS
Dove "DAS" significa archiviazione diretta collegata, ad esempio unità disco fisso SATA o SAS.
Tutti i fornitori di servizi cloud utilizzano DAS perché offre miglioramenti dell'ordine di grandezza in termini di prezzo / prestazioni. È un caso di ridimensionamento orizzontale .
In breve, i dischi rigidi SATA e i controller SATA sono prodotti economici. Sono prodotti del mercato di massa e hanno un prezzo molto basso. Costruendo un grande gruppo di PC economici con unità SATA economiche, Google, Amazon e altri ottengono una vasta capacità a un prezzo molto basso. Quindi aggiungono il proprio livello software in cima. Il loro software esegue la replica multi-server per prestazioni e affidabilità, monitoraggio, riequilibrio della replica dopo guasti hardware e altro.
Puoi dare un'occhiata a MogileFS come rappresentante più semplice del tipo di software che Google, Amazon e altri usano per l'archiviazione. Naturalmente è un'implementazione diversa, ma condivide molti degli stessi obiettivi e soluzioni di progettazione dei sistemi su larga scala. Se vuoi, ecco un punto di partenza per saperne di più su GoogleFS .
dichiarato più avanti nel documento, i cloud dovrebbero usare SAN o NAS perché DAS non è appropriato quando una VM si sposta su un altro server
Esistono 2 motivi per cui le SAN non vengono utilizzate.
1) Prezzo.
Le SAN sono estremamente costose su larga scala. Sebbene possano essere la soluzione tecnicamente "migliore", in genere non vengono utilizzati in installazioni su larga scala a causa dei costi.
2) Il teorema del CAP Il teorema del CAP di
Eric Brewer mostra che su larga scala non è possibile mantenere una forte coerenza mantenendo affidabilità, tolleranza ai guasti e prestazioni accettabili. Le SAN sono un tentativo di creare una forte coerenza nell'hardware. Ciò può funzionare bene per un'installazione di 5.000 server, ma non è mai stato dimostrato che funzioni con oltre 250.000 server di Google.
Risultato:
finora i fornitori di cloud computing hanno scelto di estendere la complessità del mantenimento dello stato del server allo sviluppatore dell'applicazione. Le offerte cloud attuali non forniscono uno stato coerente per ogni macchina virtuale. I server delle applicazioni (macchine virtuali) potrebbero bloccarsi e i loro dati locali potrebbero andare persi in qualsiasi momento.
Ogni fornitore ha quindi la propria implementazione di archiviazione persistente, che dovresti usare per dati importanti. Le offerte di Amazon sono ottimi esempi; MySQL , SimpleDB e Simple Storage Service . Queste stesse offerte riflettono il teorema di CAP: l'istanza di MySQL ha una forte coerenza, ma una scalabilità limitata. SimpleDB e S3 si ridimensionano in modo fantastico, ma alla fine sono coerenti.