Attività giornaliere / settimanali / mensili / annuali


8

Questo dovrebbe probabilmente essere wiki della comunità. Sto cercando di elaborare un elenco di tutti i compiti di amministratore di sistema che dovremmo svolgere regolarmente perché credo che non stiamo facendo abbastanza nella nostra azienda. L'atteggiamento qui è che risolvere i problemi è scomodo, ma non abbiamo tempo per eseguire la manutenzione preventiva o il miglioramento continuo.

Quotidiano:

  • scambiare nastro / unità di backup notturni
  • verifica che gli aggiornamenti antivirus siano stati inviati a tutti i sistemi

Settimanalmente:

  • scambiare nastro / unità di backup settimanali
  • pulire i file temporanei da tutti i sistemi
  • deframmentare tutti i sistemi

Mensile:

  • pianificare miglioramenti dell'infrastruttura
  • consegnare / inviare apparecchiature obsolete al riciclatore di elettronica
  • ricostruire o sostituire le postazioni di lavoro obsolete
  • test di ripristino dal backup

Annuale:

  • ricostruire o sostituire i server obsoleti
  • sostituire le batterie UPS

Hai ragione, dovrebbe essere wiki della community. Inoltre, non avere troppa fretta per separare compiti del genere. es. Pianificazione, ricostruzione di macchine, ecc. devono essere eseguiti come richiesto, non assegnati come attività settimanale (o qualsiasi altro periodo specifico).
John Gardeniers,

Risposte:


7

Se non si dispone di tempo sufficiente per eseguire la manutenzione preventiva e impiegare la maggior parte del tempo a risolvere problemi, è necessario rivedere l'intera metodologia. Invece di dirti cosa dovresti fare ogni periodo ti darò alcune idee in modo che non dovrai fare cose.

Per prima cosa hai bisogno di un buon sistema di monitoraggio e di tutta l'automazione che puoi gestire. Questi due elementi dovrebbero liberare più tempo di quanto molti amministratori si rendano conto fino a quando non lo hanno impostato bene.

Alcune delle cose che il tuo sistema di monitoraggio dovrebbe fare per te sono:

  • Ti avvisa quando le code del filtro posta o spam diventano troppo grandi o improvvisamente.
  • Ti avvisa quando lo spazio su disco diventa troppo basso, l'utilizzo della CPU diventa troppo alto, ecc.
  • Registra cose come l'utilizzo del disco in modo da poter vedere le tendenze nel tempo.
  • Stessa cosa con le cassette postali.
  • Ti avvisa quando il firewall registra un numero anomalo di accessi.
  • Stessa cosa per tutto ciò che serve al mondo esterno. ad es. DNS e server web.
  • Avvisa se gli aggiornamenti AV sono troppo vecchi se su qualsiasi macchina il software AV è spento o disinstallato.

La deframmentazione non dovrebbe nemmeno essere nel tuo elenco di attività perché dovrebbe essere un processo automatizzato. All'intervallo desiderato, fare in modo che il server esegua i controlli del disco e una deframmentazione dopo un riavvio. Prendi in considerazione l'idea di collegarlo a un sistema per installare aggiornamenti e patch in coda (che sono stati precedentemente testati su una macchina non di produzione).

Le cartelle temporanee possono anche essere pulite con l'automazione. Creo una semplice applicazione che viene attivata dopo un riavvio che attende per 10 minuti e quindi pulisce tutte le posizioni temporanee. Il ritardo è garantire che non elimini i file che potrebbero essere necessari per un'installazione o un aggiornamento che si completa dopo il riavvio (appreso nel modo più difficile!).

Una cosa che devi fare manualmente in qualsiasi momento ti piace è monitorare il sistema di monitoraggio e l'automazione, solo per sicurezza. Controllo quotidianamente il mio ma non ho riscontrato un problema per oltre un anno.

Quando fai funzionare il tuo sistema e l'automazione assicurati di avere anche un sistema di controllo della versione per inserirlo. Può essere davvero fastidioso scoprire che l'ultimo piccolo aggiustamento ha rotto qualcos'altro ma non ricordi esattamente cosa hai cambiato.


Quale singolo sistema di monitoraggio può fare tutto questo? Se esiste, lo voglio!
Cypher,

@Cypher, stai pensando troppo strettamente. Un singolo sistema di monitoraggio includerà normalmente più componenti, come Nagios e MRTG, così come un sistema operativo è più di un componente.
John Gardeniers,

suppongo che speravo davvero di aver perso uno strumento straordinario che potesse sostituire la dozzina di strumenti che attualmente uso per tutte quelle cose. :) +1 per gli strumenti di automazione e monitoraggio automatico: se devo fare qualcosa più di una volta, viene automatizzato.
Cypher,

@Cypher, quel pedaggio fantastico che stai cercando non è altro che il computer stesso. Fallo funzionare per te, piuttosto che lavorare per esso. ;)
John Gardeniers,

1

In Daily, avrei avuto Check Event Logs, manualmente o tramite uno script di qualche tipo.

Forse mensile potrebbe includere aggiornamenti del sistema operativo?

Vorrei anche dire ogni anno dare un'occhiata a dove manutenzione / garanzia è sui vostri server.


1

Mensile:

  • riesaminare l'utilizzo dell'infrastruttura - questo è probabilmente sommato al bit dei "miglioramenti dell'infrastruttura del piano", ma non è possibile fare piani a meno che non si sappia (ad es. "disporre di dati concreti") quali bit devono essere migliorati.

Trimestrale:

  • Test del failover dell'infrastruttura: dal livello app (server web, e-mail) al livello rete (switch, collegamento di rete) al livello fisico (alimentazione), se hai ridondanza nel sistema che ti aspetti di essere in grado di salvarti, deve essere mantenuto e testato periodicamente.

1

Ecco alcuni backup mensili che potresti non aver pensato:

1) Anche se automatizzato, copio ancora la configurazione del mio switch di rete principale su un computer locale
2) Configurazioni del firewall
3) Configurazioni SAN
4) configurazioni ISA esportate (vittoria 2003)
5) Prenotazioni statiche DHCP (win 2008)
6) voci DNS (vittoria 2008)
7) Chiavi di crittografia (archiviate in file binari) su KeePass, soprattutto perché i nostri backup sono crittografati - inoltre salvati al di fuori dei nostri sistemi di backup
8) la nostra cartella della documentazione IT, inoltre salvata al di fuori dei nostri sistemi di backup

0

In Daily, potrei raccomandare di aggiungere l'abbonamento alle note mailing list sulla vulnerabilità delle patch e di avere un processo su patch / aggiornamenti.

Questo potrebbe accadere solo una volta al mese, ma basta un solo messaggio mancante su una vulnerabilità dei prodotti per causare molte interruzioni.

Penso che questo potrebbe essere ridotto in un paio di parole per adattarsi a una riga, se sei d'accordo.

BTW; Questa è una grande lista, non vedo l'ora di vederne il completamento /.


0

Audit interni:

  • Confronta i sistemi attivi con l'elenco dei sistemi sottoposti a backup. Qualcosa è entrato di nascosto nella produzione senza backup? (almeno mensilmente se non più spesso a seconda di quanto viene distribuito)
  • Vai a visitare i tuoi nastri se hai un caveau fuori sede. Assicurati che siano dove dovrebbero essere. (una o due volte l'anno)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.