Lavoro per un'azienda di Fortune 500 che lotta per misurare accuratamente le prestazioni e la disponibilità per applicazioni ad alta disponibilità (ad esempio, app che aumentano del 99,5% con 5 secondi di navigazione da pagina a pagina). Teniamo conto dei tempi di inattività pianificati e non programmati per determinare questo numero di disponibilità. Tuttavia, recentemente abbiamo aggiunto una CDN al mix, il che complica un po 'le nostre metriche. La CDN ora gestisce circa il 75% del nostro traffico, inviando il resto ai nostri server.
Cerchiamo di misurare ciò che chiamiamo "vera esperienza dell'utente" (ovvero, i nostri script di test emulano un tipico utente facendo clic sull'applicazione.) Questi script di monitoraggio si trovano al di fuori della nostra rete, il che significa che stiamo colpendo la CDN di circa il 75% di il tempo.
Il management ha deciso di prendere lo scenario peggiore per misurare la disponibilità. Quindi, se i nostri server di origine stanno riscontrando problemi, ma la CDN sta pubblicando i contenuti correttamente, continuiamo a fare colpo sulla disponibilità. Lo stesso vale il contrario. Il mio pensiero è che fino a quando "l'esperienza dell'utente" avrà successo, non dovremmo punirci inutilmente. Dopotutto, un CDN è lì per migliorare le prestazioni e la disponibilità!
Mi chiedo solo se qualcuno ha qualche conoscenza su come le altre società Fortune 500 calcolano i loro numeri di disponibilità? Guardo apple.com, ad esempio, di una vetrina che utilizza un CDN che non sembra mai essere inattivo (a meno che non ci sia un annuncio di prodotto importante). Sarebbe bello avere alcuni dati concreti e concreti perché non credo che dobbiamo ferirci inutilmente su queste metriche. Noi stiamo facendo le decisioni di business sulla base di questi numeri.
Posso dire, tuttavia, dato che queste metriche sono visibili alla direzione, i problemi vengono risolti e risolti piuttosto rapidamente (leggi: abbiamo tagliato la burocrazia abbastanza rapidamente.) Sfortunatamente, come sviluppatore, non voglio che il management pensi che l'applicazione è attiva o negativa perché alcuni fattori esterni (ad esempio, CDN) stanno influenzando i numeri.
Pensieri?
(Ho erroneamente pubblicato questa domanda su StackOverflow, scusa in anticipo per il cross-post)