Innanzitutto, la disponibilità totale o il tempo di attività di un cluster dipende dalla dimensione necessaria di una parte del cluster per essere attivo affinché l'intero cluster sia considerato "attivo".
- È sufficiente una macchina funzionante? Ciò significherebbe che ogni singola macchina può prendere il pieno carico se necessario.
- Devono essere tutti attivi contemporaneamente? Cioè, non c'è ridondanza.
- O forse due su tre online sono sufficienti? Ciò consentirebbe un carico di lavoro maggiore rispetto al primo caso.
Come hai scoperto, i primi due casi sono abbastanza semplici da calcolare. Lascia che la probabilità che un singolo server sia online in qualsiasi momento p = 0.95. Ora, per tre server, la probabilità che siano tutti online contemporaneamente è p 3 = 0,857375.
Nel caso opposto, in cui almeno una macchina dovrebbe essere attiva in un dato momento, è più facile calcolare invertendo il problema e osservando le probabilità che le macchine siano offline . La probabilità che una singola macchina sia offline è q = 1- p = 0,05, e quindi la probabilità che siano tutte inattive contemporaneamente è q 3 = 0,000125, dando probabilità 1- q 3 = 1- (1- p ) 3 = 0.999875 che almeno uno è attivo.
Il caso 2 su 3 è leggermente più difficile da calcolare. Esistono quattro possibili situazioni in cui almeno due server su tre sono attivi. 1) ABC è attivo, 2) AB è attivo, 3) AC è attivo, 4) BC è attivo. Le probabilità per tutti questi sono, rispettivamente, ppp , ppq , pqp e qpp . Poiché i casi sono disgiunti, le probabilità possono essere sommate, dando un totale A = p 3 + 3 p 2 q = 0.992750.
(Questo può essere esteso a più macchine. I fattori sono i ben noti coefficienti binomiali , quindi contare i diversi casi a mano funziona principalmente come un esercizio.)
Naturalmente, calcoli come questo sono molto più facili da gestire utilizzando un programma per computer pronto all'uso ... È possibile trovare almeno un calcolatore online qui:
http://stattrek.com/online-calculator/binomial.aspx
Inserendo i valori di input: probabilità di successo = 0,95, numero di prove = 3, numero di successi = 2, si ottiene il risultato "Probabilità cumulativa: P (X ≥ 2) = 0.99275". Vengono inoltre forniti alcuni altri valori correlati e lo strumento online semplifica la riproduzione anche con altri numeri.
E sì, tutto quanto sopra presuppone che i server non funzionino in modo indipendente, ovvero a) ho ignorato qualsiasi problema relativo al cluster nel suo insieme, b) non esiste nulla come l'invecchiamento dei componenti che renderebbe probabile il fallimento dei server o quasi allo stesso tempo.