Persistenza dei dati Amazon EC2


25

Secondo le FAQ di Amazon EC2 , quando un'istanza viene chiusa i dati scompaiono. Quali passi posso prendere per conservare i dati nel caso in cui la mia istanza venga riavviata? Ho esaminato EBS e S3: uno di questi sarebbe utile per memorizzare un database attivo? Con quale frequenza vengono comunque riavviati gli esempi?


2
Un sidenote sulla terminologia: nota che terminare un'istanza è diverso dal semplice riavvio . La terminazione cancella l'archiviazione dell'istanza durante il riavvio no (vedere ad esempio stackoverflow.com/questions/637790/… ). Quindi non intendi davvero riavviare :)
Jonik

Risposte:


25

Come altri hanno già detto, EBS - Elastic Block Storage. Lo sto usando da solo ora che è stato rilasciato al pubblico. È meglio di S3 su più punti:

  • EBS sono veloci . Più veloce anche dei supporti locali, secondo Amazon.
  • EBS si monta come dispositivi adeguati . A differenza di S3, di cui avrete bisogno della logica di accesso all'espulsione S3 personalizzata nel codice o del middleware (JungleDisk, ElasticDisk, et al) che presentano i propri problemi e costi
  • È facile eseguire il backup di EBS . Amazon ti dà la possibilità di scattare istantanee, che vengono salvate su S3
  • EBS è portatile tra istanze: i volumi possono essere smontati da un'istanza e collegati a un'altra istanza
  • I dispositivi EBS possono anche essere RAID insieme per una maggiore affidabilità

Finora la mia esperienza con EBS è stata la cosa più positiva di AWS con cui ho avuto a che fare.


Aggiornamento: mentre la mia esperienza con EBS è stata positiva, altri hanno avuto problemi. In particolare, EBS non implementa correttamente fsync (). Ted Dziuba ha alcune parole interessanti a riguardo nel suo post sul blog Amazon - The Purpose of Pain : Myth 2: Architecture Will Save You from Cloud Failures

Questo diventa ancora più divertente con Amazon Elastic Block Store, che, come hanno scoperto gli amministratori di Reddit, accetterà felicemente le chiamate a fsync () e mentirà in faccia, dicendo che i dati sono stati scritti su disco, quando potrebbero non esserlo stato.


Le EBS sono a volte veloci, a volte lente. RAIDare più volumi insieme aiuta molto.
Ceejayoz,

4

EBS funzionerebbe sicuramente per un database ed è uno degli esempi nella descrizione EBS di Amazon . "Amazon EBS è particolarmente adatto per le applicazioni che richiedono un database ..."

EBS funzionerà proprio come un dispositivo a blocchi (pensa al disco rigido), offrendoti ampia libertà e comodità durante l'utilizzo. S3 è concettualmente più simile a un FTP molto veloce, con un'API speciale. Si potrebbe presumibilmente usarlo come parte di un database, ma i database standard non vengono eseguiti su di esso (ancora?).

Ti consigliamo di rivedere le descrizioni di prestazioni (EBS> S3), durabilità (S3> EBS) e prezzo di Amazon (dipende).


2

Come menzionato in altre risposte, EBS è la soluzione standard per l'archiviazione su disco persistente e conveniente. Dovrebbe essere l'opzione predefinita. In effetti, i tipi di istanza EC2 più recenti lo utilizzano per impostazione predefinita, rispetto allo spazio di archiviazione dell'istanza originale e non persistente.

Tuttavia, quando si considera la persistenza, si dovrà anche considerare attentamente la disponibilità (evitando i tempi in cui i dati non sono disponibili) e la durata (evitando la perdita di dati) per i dati.

EBS copre i casi d'uso di base, ma tieni presente:

  • S3 è progettato per una maggiore durata rispetto a EBS. In poche parole, conservano più copie dei dati e richiedono una durata estremamente elevata del 99,999999999% per S3 (consultare le Domande frequenti su S3). L'effettiva probabilità numerica qui (che è così alta da rendere più probabili le invasioni marziane) non è così importante come il fatto che AWS ha puntato la propria reputazione sulla durabilità S3 e ha un ottimo record qui. Lo stesso non vale per EBS.
  • Mentre Amazon non fornirà statistiche su questo direttamente, molte persone credono che l'archiviazione di istanze abbia storicamente offerto una disponibilità superiore rispetto a EBS.

Le recenti interruzioni di AWS, un grave fallimento di più giorni nel 2011 e un altro nel 2012 , forniscono alcuni esempi della complessità di EBS e dei rischi piccoli ma non trascurabili di interruzioni e perdita di dati.

In conclusione: per essere sicuri di non perdere i dati, conservare i backup dei dati in S3 . Le istantanee EBS sono un modo semplice per farlo per EBS. Se l'alta disponibilità è fondamentale, considerare anche l'uso dell'archiviazione di istanze in più zone di disponibilità (in aggiunta o al posto di EBS).


0

Sembra che se sei preoccupato di perdere dati, allora hai bisogno di EBS sopra menzionato . C'è un po 'di introduzione qui .

Personalmente non ho esaminato molto più di questo finora, sto usando S3 per i backup attualmente.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.