Qual è il più grande risparmio di tempo che hai implementato? [chiuso]


37

Quali modifiche che hai implementato hanno avuto il maggiore impatto sul risparmio di tempo nel carico di lavoro quotidiano del sysadmin? Quali sono i tuoi trucchi per lavorare in modo più efficiente e fare più cose o lavorare di meno per gli stessi risultati?

Sto pensando all'automazione, ai cambiamenti nel flusso di lavoro / nei processi, ai nuovi strumenti, a smettere di fare del tutto, l'outsourcing, una migliore delega, la modifica di software / hardware, la riduzione della burocrazia, ecc.


Questa domanda è fuori tema in base alle attuali regole di attualità.
HopelessN00b,

Risposte:


30

monitoraggio + allerta - che è un'ottima rete di sicurezza. proprio come gli sviluppatori scrivono unit test per assicurarsi che le cose non si incasinino quando aggiornano il codice, mi affido al monitoraggio come ulteriore rete di sicurezza nel caso in cui rovini qualcosa [che è disconnettere un server, negare il traffico di produzione sul firewall ecc.] . dà tranquillità: se le cose si rompono lo saprò prima che i clienti chiamino.


Inoltre: abbiamo un enorme televisore sul muro, che mostra gli schemi rotanti della nostra rete (fatto con nagios e nagvis). Crea un'ottima visibilità e l'ultima versione di nagvis è sorprendente. Dà al tuo capo e ai tuoi utenti la sensazione di avere il controllo (cosa che hai una volta che hai questo).
Wolfgangsz,

26

Per me, è stata un'autenticazione centralizzata.

Sono arrivato al punto di amministrare una quarantina di macchine Slackware e ognuna aveva l'autenticazione locale PLUS l'autenticazione Samba locale. Avevo anche una soluzione VPN in cui era necessario configurare ciascun account, oltre a un server jabber interno e un server di posta elettronica interno. Tutto aveva il suo account. MAC (mosse, aggiunte, modifiche) erano pazzi.

Quindi sono passato da Slackware a CentOS, ho creato un'infrastruttura di Active Directory e ho usato Likewise Open per autenticare tutte le mie macchine Linux contro AD. Probabilmente mi ha risparmiato 20 ore al mese senza scherzare nemmeno un po '.

Ora ho tutto ciò che posso autenticare tramite AD e posso funzionare moltissimo. Non posso raccomandare abbastanza l'autenticazione centralizzata se stai ancora facendo le cose alla vecchia maniera.


Sai se allo stesso modo open risolverà il problema con domini affidabili che samba fa? Vedi serverfault.com/questions/35492/…
chmeee

1
chmeee: Non lo so, poiché la mia infrastruttura non è complicata come la tua. Ti suggerisco di provarlo su una scatola di ricambio. Allo stesso modo Open è gratuito e non modifica affatto il dominio, a parte l'aggiunta della macchina all'unità organizzativa dei computer AD.
Matt Simmons,

Perché AD e non OpenLDAP o Redhat / Netscape? È prevalentemente una rete Windows?
David Gardner

Perché conoscevo AD e non OpenLDAP o Redhat Directory Server
Matt Simmons,

20

Sono d'accordo con le ovvie scelte qui; Automazione e autenticazione centrale. Tuttavia, sembra che devo essere il ragazzo a menzionare la documentazione .

Documentando quanti più problemi, flussi di lavoro, installazioni e guide possibili, le persone sono state in grado di risolvere alcuni dei loro problemi senza la necessità di coinvolgere il nostro dipartimento.

Un altro grande risparmio di tempo è il rilevamento dei problemi .

Essere in grado di dare la priorità alle attività, assegnarle ai membri del team e sbarazzarsi di tutto il disordine delle persone che inviano richieste via e-mail, msn o semplicemente arrivano in ufficio. Questo aiuta anche i nostri buoni amici, i manager a vedere quanto sei efficiente (se vuoi).

Quindi, naturalmente, la ciliegina sulla torta sarebbe la mia tazza "RTFM" (Leggi il manuale fine) che viene sollevata molto.


Il monitoraggio + avviso imho è molto meglio della documentazione. È una documentazione implicita (non è che non mi piacciono i documenti scritti). Concordato sul rilevamento dei problemi, non potevo farne a meno
serverhorror il

2
Monitonring + Alerting sono il "cosa". La documentazione è il "perché".
David Mackintosh,

Puoi avere tutto il monitoraggio e gli avvisi che ti piacciono, ma se non hai alcuna documentazione su cosa fare quando il cercapersone si spegne o note su come estendere il monitoraggio, rimarrai bloccato nel rispondere a tutte le pagine e nel mantenere tutto il monitoraggio da soli. La documentazione consente il trasferimento di conoscenze in modo da poter costruire il proprio team e consentire ad altri di intervenire per condividere il lavoro.
dannyman,

17

L'automazione dell'infrastruttura con uno strumento come Chef o Puppet è la cosa migliore che ho implementato sui sistemi che gestisco. Il monitoraggio è ottimo e tutto, ma spesso, far funzionare bene i vari bit con il resto dell'infrastruttura richiede molto lavoro. Chef e Puppet sono entrambi fantastici nell'automazione dell'intera infrastruttura, fornendo molta colla che un tempo veniva scritta a mano. Raggruppando in particolare quali server forniscono quali servizi.

Chef ha la capacità integrata di interrogare il server per attributi e ricette applicati su altri nodi, in modo da poter chiedere chi sono i web server di produzione o chi è il master del database, rendendo l'automazione molto più semplice. Anche Puppet può farlo, ma richiede uno strumento di classificazione dei nodi esterno come iClassify .

Ciò dovrebbe avere ovvie implicazioni per gli strumenti di monitoraggio e trend come Nagios e Munin. Può anche, ad esempio, fornire una configurazione automatizzata di ambienti con bilanciamento del carico, in modo che gli LB possano interrogare tutti i server Web che devono essere coperti per una particolare app.

L'altro grande risparmio di tempo che ho implementato in una varietà di ambienti è build automatizzate, come kickstart (redhat / centos) e preseed (debian / ubuntu). Questo dovrebbe essere ovvio per la maggior parte delle persone, ma può sorprendere il numero di siti che continuano a creare sistemi a partire da CD. È ancora meglio se la build automatizzata prepara il sistema per eseguire Chef o Puppet per preparare tutti gli altri beni.


2
La gestione della configurazione (ho usato le marionette) e il server PXE (calzolaio) mi hanno fatto risparmiare molto tempo. Ma il più grande risparmio di tempo è derivato dalla "gestione del tempo". Ho trovato il libro di Tom Limoncelli "Gestione del tempo per amministratori di sistema" prezioso in questo. Ora che la mia giornata è più strutturata e pianificata, dedico meno tempo alla "pianificazione" e alla procrastinazione e più tempo a fare ciò che è rilevante.
aussielunix,

Simpatici strumenti di automazione, ma conosci strumenti simili a Chef o Puppet che non si basano su Ruby?
Andrioid,

@Android - cfEngine, ma Chef e Puppet sono più bravi a lavorare, così come Ruby: D.
jtimberman,

Dai un'occhiata a Bcfg2. È simile per funzionalità a Puppet ma scritto in Python.
Kamil Kisiel,

16

Monitor multipli, con una finestra aperta sulla console di ciascun server di cui ero responsabile.


6
Ciò scalerà solo finora.
Teddy,

Sì. Anche se potrei continuare ad aggiungere macchine aggiuntive con monitor aggiuntivi, ma in realtà puoi solo andare così lontano.
Alan H,

7

Il monitoraggio è ovviamente eccezionale, ma non sono sicuro che sia un risparmio di tempo. Per quanto mi riguarda, si trattava di una registrazione centralizzata, con un sistema di visualizzazione che filtrava il banale, evidenziava il pericoloso (guasto del disco, rilevatore di virus) e mostrava tutto il resto per la categorizzazione.

syslog (e perl) per la vittoria.

Fondamentalmente mi ha permesso di leggere i registri degli eventi di tutti i computer della rete mentre mangiavo il mio bagel; almeno un controllo sommario per cercare qualcosa di spaventoso. Enorme risparmio di tempo.


+1 registrazione centralizzata e report perl con script.
David Mackintosh,

Stiamo implementando il controllo log sui nostri server. Ci vuole un po 'di tempo per aggiungere filtri per le linee che non ci interessano, ma è utile.
David Pashley,

1
Conosco la sua pubblicità ma dai un'occhiata a Splunk, un sistema di centralizzazione dei log con un front-end meraviglioso.
James,

6

Rimossi i diritti di amministratore locale per tutti gli utenti. (se posso)

Questo ha avuto l'effetto di ora non devo occuparmi di nessuno dei, come posso installare l'applicazione X (perché non ti è permesso ora), il mio computer ha un virus / spyware, il mio computer funziona lentamente e praticamente tutto ciò che è collegato a questo.

Non ho mai capito quanto questo rendesse stabili le workstation fino a quando non mi sono imbattuto in una workstation che era stata completamente persa nei controlli, negli aggiornamenti di Windows, ecc. Era in esecuzione da circa 4 anni senza un singolo aggiornamento. Penso di essere su Windows SP1. Quel sito non si è mai lamentato di eventuali problemi con esso e quando l'ho scoperto, l'ho trovato funzionante.


Questo è davvero un buon consiglio per una piccola azienda che sta facendo la scomoda transizione in una media impresa.
staticsan

1
Vorrei solo aggiungere che non funziona per raggruppare tutti gli utenti in base a una politica come questa. Se ci sono utenti legittimi (ad es. Sviluppatori) devono essere trattati in modo diverso. In caso contrario, a) non possono svolgere il proprio lavoro eb) lo sovvertiranno comunque, causando altri problemi. Pertanto, la politica deve essere consapevole di molti tipi di utenti.
jplindstrom,

Non dare per scontato che gli sviluppatori abbiano bisogno dell'accesso di amministratore. Se non hanno accesso come amministratore, forse svilupperanno effettivamente programmi che funzionavano correttamente come utenti limitati (per cambiare). Ci sono utenti che ne hanno bisogno, ecco perché gli verrebbe assegnato un secondo account per installare il software, ecc. Quindi il loro account giornaliero è ancora un utente limitato. Proprio come funziona il mondo Linux. Se lo sovvertono, è facile, licenzia la prima persona, il resto si metterà in fila molto velocemente. Se hanno bisogno di qualcosa di installato per fare il loro lavoro, quindi richiedi ciò di cui hanno bisogno, non l'accesso di amministratore.
SpaceManSpiff,

6

Virtualizzazione (VMware)

Tra la distribuzione di server da modelli, la gestione di server da un'unica interfaccia, il monitoraggio dettagliato dell'hardware integrato nel client dell'infrastruttura, ha davvero cambiato il modo in cui amministriamo la nostra infrastruttura.

E l'impatto che ha avuto sul modo in cui pensiamo al nostro "hardware" l'ha reso davvero un punto di svolta. I cluster non sono più "troppo costosi" perché possiamo distribuirli virtualmente. Hai bisogno di più server Citrix, clonalo. Finché manteniamo la nostra fattoria hardware fisica che fornisce risorse adeguate (e quei server ora sono davvero dei prodotti di base), tutto è perfetto.


4

cfengine per la gestione della configurazione sotto debian / linux.

openvpn per collegare le stazioni satellitari

tighvnc attraverso la VPN per raggiungere i 2300 client Windows nelle stazioni satellitari.

munin e nagios per il monitoraggio e la comunicazione

smartmontools sui server per controlli automatici automatici (e mail di stato, se qualcosa va storto)

raid1 (mirroring) sui server. Se un disco si guasta, il server è ancora in esecuzione - questo è davvero importante per la mia gestione del tempo.

Meta

TeamWork - È inutile fare tutto da solo. condividi il lavoro e insieme sei più produttivo.

l'atmosfera lavorativa rispetta i tuoi compagni, fai battute e ridi - questo è estremamente utile per un'atmosfera positiva e creativa.

Buon lavoro! amico, adoro il mio lavoro! Questo mi rende davvero goog (penso;))


4

Per me è stato assumere un ottimo amministratore di sistema.


3

Fantoccio. L'idea di cambiare un posto e avere tutti i sistemi interessati è fantastica.

Abbinalo a installazioni standard ed è molto veloce per aprire un nuovo sistema. Tu esegui il netboot ed esegui un'installazione stock, quindi il burattino prende il sopravvento e tutto è configurato.

Infine, standardizzare. No, non vuoi davvero 35 diverse distribuzioni Linux e 4 diverse versioni di Solaris. Lavora per passare a un'installazione standard. Ogni sistema unico che spegni ti fa risparmiare un sacco di tempo.


2

Aggiungi un altro voto per il monitoraggio. Il principio è abbastanza semplice: voglio sapere cosa sta succedendo prima che gli utenti siano interessati. L'amministrazione di sistema dovrebbe idealmente essere un ruolo trasparente. Gli utenti non devono sapere né preoccuparsi di ciò che stai facendo. Dal loro punto di vista dovrebbe semplicemente funzionare. Gli utenti felici e soddisfatti dovrebbero eguagliare gli amministratori felici e soddisfatti.

Una cosa che viene spesso trascurata nell'IT è che i computer sono lì per lavorare per noi, non il contrario. Tuttavia, conosco gli amministratori che passano una parte significativa della loro giornata a controllare manualmente i loro server e i loro registri. Perché? I computer possono monitorarsi a vicenda e con un po 'di scripting è possibile ricevere solo la parte interessante dei registri. Davvero, non è necessario superare alcuni milioni di voci informative, come il lavoro di stampa di Fred o il trasferimento DNS è andato a buon fine. Dimmi solo quando non lo sono.


2

Il più grande risparmio di tempo che ho implementato è stato Disk Imaging delle nostre workstation di produzione. Sono tutti uguali e nessuno memorizza nulla a livello locale, quindi se c'è un problema riesco a ri-immaginare la macchina ed è tutto pronto, come nuovo.


2

Il tempo risparmiato è molto importante quando i sistemi sono inattivi.

Ho documentato tutte le informazioni sul contratto di supporto in file di testo standardizzati in una struttura di directory standardizzata. Ne avevo una centrale e ne conservavo più di una copia.

Ogni bit di informazione (portale web, numero di telefono, punto di contatto, data di scadenza, numero di contratto, scorciatoie del menu del telefono, ecc.) È stato preceduto da un tag standard nel vecchio formato .ini (tag: dati).

Trovare un numero di telefono era semplice come andare alla directory di livello superiore ed eseguire:

grep Phone */*support.txt | more

Dove il primo carattere jolly si è espanso al fornitore e / o al nome del prodotto.

Non ho usato Excel, Word, OpenOffice, un database, ecc., Semplicemente perché quando qualcosa non funziona, qualcosa potrebbe essere la cosa che contiene le informazioni di supporto. Inoltre, questi non sono facilmente visualizzabili dalla schermata della console in modalità testo.

Ho anche documentato tutte le procedure nello stesso modo.


Eseguito l'upgrade per la realizzazione del valore commerciale del tempo.
jplindstrom,

2

Ho implementato un Wiki del dipartimento IT (usando Mediawiki per gli interessati) diversi anni fa. Quando abbiamo iniziato a sentirci a nostro agio nell'usarlo, la risposta a molte domande poste in ufficio era "Hai controllato il wiki?" Ci è voluto un po 'di tempo per abituarci a controllare il Wiki per informazioni specifiche, ma una volta fatto ci siamo resi conto che è un grande potenziale. Abbiamo tutte le informazioni di cui abbiamo bisogno a portata di mano: se c'è qualcosa che non c'è, abbiamo la possibilità di aggiungere / cambiare rapidamente una pagina.



1

Sono d'accordo con pQd sul monitoraggio.

Anche se non abbiamo ancora visto tutti i vantaggi, l'implementazione della gestione della configurazione tramite Puppet è promettente per farci risparmiare una notevole quantità di tempo e ridurre notevolmente gli errori.


1

Ho trovato AutoIt e successivamente AutoHotkey e mi sono innamorato.

L'ultimo lavoro che ho avuto è stato per un produttore di veicoli personalizzati. Gli assemblatori erano utenti di computer minimamente competenti e riuscirono a mandare in crash il programma che dovevano usare per inserire il lavoro che stavano svolgendo. Ogni giorno, più volte al giorno, dovevo andare in più di 15 postazioni di lavoro in 3 diversi edifici e uccidere il programma bloccato, riavviarlo e riportarlo alla schermata di immissione dei dati. Alla fine ho installato VNC in modo da poterlo fare da remoto, il che ha ridotto i tempi di viaggio ma mi ha comunque coinvolto nel ricordare di entrare e ripristinare le macchine ogni tanto. Quando ho trovato AutoIt, mi sono reso conto che avrei potuto impostare il programma per guardare il computer e se non ci fosse stato alcun input per 5 minuti, avrebbe potuto ripristinare il programma e digitare e fare clic su tutto il necessario per riportarlo alla schermata di input.


1

++ per l'autenticazione centrale e la gestione dell'account, compresa la creazione dell'account E la gestione della risoluzione Abbiamo AD (due foreste) e LDAP (e, fino a poco tempo fa NDS) con vari gruppi che accedono a risorse esistenti in entrambe le directory. Il tempo che dedichiamo per sincronizzare le directory e gestire tutte le risorse in una o l'altra delle directory è valso la pena.

La prossima vittoria più grande è stata qualsiasi quantità di automazione, sia che si tratti di pulizia dell'account, centralizzazione della configurazione o che cosa hai.

Non sono sicuro di quanto tempo risparmi effettivamente il monitoraggio, ma è essenziale. Non ci vuole molto perché un ambiente diventi abbastanza grande o abbastanza complesso da rendere impossibile e inefficace il "controllo manuale". Inoltre, è bello dormire a volte. ;)

Questo potrebbe essere un po 'fuori dalla vena principale di pensare a questo, ma abbiamo anche avuto una grande vittoria quando abbiamo standardizzato la nostra piattaforma hardware. Abbiamo scelto una piattaforma server che fosse realizzabile internamente per tutto il nostro sistema operativo e lo abbiamo bloccato per diversi anni. Abbiamo imparato l'hardware e abbiamo imparato la sua gestione remota e consente di risparmiare tempo ed energia in vari modi:

  1. Non è più necessario supportare mezza dozzina o più tipi di server traballanti ognuno con le proprie peculiarità
  2. Supporto cross-team: quando si tratta di hardware, la gente di Unix lo sa, la gente di Windows lo sa, anche le persone di rete ne hanno abbastanza familiarità da metterlo in una mano secondo necessità poiché varie delle loro appliance girano sull'hardware.
  3. pezzi di ricambio!

Lo stesso vale per build di sistemi operativi standard, documentate e riviste. Può sembrare semplice ma mi imbatto spesso nei negozi in cui le build non sono standard e non c'è fine a scherzare per vedere se questo strumento o quello strumento è presente o se un determinato server ha le sue impostazioni giuste. Questo tipo di caos può trasformare anche i compiti e i problemi più elementari in licenziamenti.


1

Imparare a delegare e fidarmi dei miei colleghi - una volta che sai che puoi distribuire pezzi di lavoro ad altre persone, la vita diventa molto più rilassata. E non perché sono pigro e tutti gli altri fanno il mio lavoro per me; è la tranquillità che deriva dal sapere che hai un buon backup. E, naturalmente, configurazioni del sistema operativo ben monitorate e standardizzate su hardware standard. Va da sé.

Il mio obiettivo per l'automazione è sempre stato che ora ricevo di nuovo una e-mail che dice "Così e così si è rotto sul server. È stato risolto." e poi, una volta che ho inviato il bug agli sviluppatori, posso tornare a leggere il giornale e bere un caffè. Non ci siamo ancora arrivati, ma abbiamo fatto molta strada dal caos reattivo che abbiamo usato per combattere ogni giorno.


1

Di recente ho implementato AntHill Pro al lavoro e ora ho tutte le nostre build e implementazioni per una serie di progetti completamente automatizzati e monitorati. Ciò ha incluso la creazione di una libreria Ant di distribuzione Tomcat condivisa utilizzata da tutti i progetti, semplificando la manutenzione di tali progetti in AHP. Il prossimo è la creazione di una libreria simile per le distribuzioni CDA del sito.

Anche se non mi fa risparmiare tempo personalmente, fa risparmiare tempo ai nostri sviluppatori e al nostro personale operativo. Mi piace essere la tanica di petrolio per le ruote degli altri. :-)

Spero di dare un'occhiata a Chef and Puppet per dare una mano sul lato infrastrutturale dell'automazione delle cose.

Oh, e la documentazione è un aiuto ENORME. Consente di risparmiare molto tempo per indirizzare le persone a un documento ben scritto piuttosto che rispondere alla stessa domanda 20 volte.


1

Il mio più grande risparmio di tempo sono stati gli script preconfigurati per l'installazione delle nostre workstation Linux. abbiamo appaltatori che vanno e vengono continuamente, quindi abbiamo un pool di postazioni che vengono riutilizzate regolarmente. Quando tornano all'IT, inseriamo il CD di installazione, aggiungiamo il file preconfigurato al comando di installazione e in 20 minuti (e non vengono più premuti da nessuno di noi) la scatola torna a una nuova installazione di base funzionante, con tutti gli strumenti e preconfigurati per funzionare nella nostra rete. Plug'n'play.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.