Cercando di provare a creare un po 'di resilienza nella nostra configurazione Ansible che si occupa di provisioning e configurazione.
Comprendo alcuni metodi di test sul lato della configurazione delle cose, ma mi chiedo come implementare meglio i test sul lato del provisioning delle cose e se ci sono strumenti che possono aiutare con questo tipo di implementazione.
Attualmente molti dei nostri test vengono eseguiti in serie durante il playbook, il che ha molto senso per cose come "è arrivato il servizio; è il vip disponibile; ha terminato questo compito asincrono", ma ciò che veramente mi preoccupa è la nostra capacità di gestire la deriva di configurazione a livello di applicazione e di provisioning (come la configurazione della macchina virtuale). Sono consapevole che Ansible non è lo strumento migliore per lavorare con la deriva della configurazione, ma sono curioso di vedere le tue opinioni.
Se hai qualcosa per automatizzare completamente il processo ancora meglio. (abbiamo alcuni brutti script che riportano quotidianamente in forma rilassata).
Nota : al momento abbiamo alcune condizioni in cui potrebbe verificarsi una riprovision (ad es. Ricostruzione da backup, problema di sistemi critici) ma in genere passa in rassegna alcune delle attività di configurazione rispondenti e non ci pensa più.
I'm aware Ansible isn't the best tool for working with configuration drift
Spiega per favore.