I servizi cloud ospitati da Amazon Web Services , Azure , Google e molti altri pubblicano il S ervizio L evel A greement , o SLA, per i singoli servizi che forniscono. Architetti, ingegneri di piattaforma e sviluppatori sono quindi responsabili di metterli insieme per creare un'architettura che fornisca l'hosting per un'applicazione.
Presi in isolamento, questi servizi di solito forniscono qualcosa nell'intervallo da tre a quattro nove di disponibilità:
- Azure Traffic Manager: 99,99% o "quattro nove".
- SQL Azure: 99,99% o "quattro nove".
- Servizio app di Azure: 99,95% o "tre nove cinque".
Tuttavia, se combinati insieme in architetture esiste la possibilità che un singolo componente possa subire un'interruzione con conseguente disponibilità complessiva che non è uguale ai servizi del componente.
Disponibilità del composto seriale
In questo esempio ci sono tre possibili modalità di errore:
- SQL Azure non è attivo
- Il servizio app non è attivo
- Entrambi sono in calo
Pertanto la disponibilità complessiva di questo "sistema" deve essere inferiore al 99,95%. La mia logica per pensare questo è se lo SLA per entrambi i servizi era:
Il servizio sarà disponibile 23 ore su 24
Poi:
- Il servizio app potrebbe essere disponibile tra 0100 e 0200
- Il database esce tra 0500 e 0600
Entrambe le parti componenti sono nel loro SLA ma il sistema totale non è stato disponibile per 2 ore su 24.
Disponibilità seriale e parallela
In questa architettura ci sono un gran numero di modalità di errore, principalmente:
- SQL Server in RegionA non è attivo
- SQL Server in RegionB non è attivo
- Il servizio app in RegionA non è attivo
- Il servizio app in RegionB non è attivo
- Gestione traffico non è attivo
- Combinazioni di cui sopra
Poiché Traffic Manager è un interruttore, è in grado di rilevare un'interruzione in entrambe le regioni e instradare il traffico verso l'area di lavoro, tuttavia esiste ancora un singolo punto di errore sotto forma di Traffic Manager, quindi la disponibilità totale del "sistema" non può essere superiore al 99,99%.
In che modo è possibile calcolare e documentare la disponibilità composta dei due sistemi sopra indicati per l'azienda, potenzialmente richiedendo una nuova ricerca se l'azienda desidera un livello di servizio superiore a quello che l'architettura è in grado di fornire?
Se vuoi annotare i diagrammi, li ho creati in Lucid Chart e ho creato un collegamento multiuso, tieni presente che chiunque può modificarlo in modo da poter creare una copia delle pagine da annotare.