I server devono essere spenti di notte?


144

C'è un server che viene utilizzato dalle 4:30 del mattino fino alle ~ 22:00.

Dovrebbe essere spento? Penso che sia un server e che non avrà problemi a rimanere su, ma professori seri mi stanno dicendo che è pericoloso e che la MH può fallire entro 2 anni. Il proprietario del server ritiene che il suo vecchio server in esecuzione dal 1995 senza backup e un singolo disco rigido (se il disco rigido si guasta è avvitato) non ha avuto problemi perché lo spegneva di notte.

Cosa credi per questo?

Ora ha un array RAID 1, backup del disco rigido esterno e backup del disco rigido completo server su DVD e su Internet.


62
+1 perché anche se questa è una domanda di cui non credo che nessuno di noi abbia mai intrattenuto il pensiero, chiaramente alcune persone lo fanno e ha bisogno di una risposta.
Mark Henderson

8
I tuoi professori non eseguono server. Stanno eseguendo workstation con demoni di rete.
Pezzi di pancetta l'

4
Non è possibile utilizzare alcune impostazioni di alimentazione per spegnere i dischi rigidi quando non sono in uso? Stesso vantaggio in termini di usura, ma non è necessario spegnere l'intera macchina.
Brendan Long,

34
Professori di inglese lit?
Iain Holder,

28
Non consiglierei di prendere consigli dalle persone che non eseguono backup. Soprattutto no, se lo fanno per oltre 15 anni. Il risparmio di energia elettrica è l'unico argomento per spegnerlo. La vita sarà ridotta a causa del riscaldamento e del raffreddamento ogni giorno.
Malte,

Risposte:


153

Per paragonarlo a un'analogia con un'auto: un taxi può percorrere oltre 500.000 chilometri prima di dover ricostruire un motore. La ragione di ciò è perché sono sempre in funzione, 24 ore su 24, 7 giorni su 7, e dopo che il motore di un'auto ha raggiunto la temperatura, la quantità di usura che riceve mentre è in funzione è notevolmente ridotta.

Un computer è un po 'lo stesso. La maggior parte dell '"usura" delle parti può verificarsi all'avvio del server. Basta collegare un misuratore di amplificatore al computer e accenderlo. Quando si avvia, la potenza che assorbe sale molto in alto, e poi si deposita una volta che tutti i dischi sono stati fatti girare e il processore è inizializzato. Inoltre, pensa a quanta attività su disco subisce il server durante l'avvio rispetto a quando funziona. È probabile che l'accesso al disco dall'avvio del sistema operativo sia un'attività piuttosto solida, mentre quando il sistema operativo è in esecuzione, a meno che non sia un server di database molto pesante (suppongo di no), molto probabilmente i dischi rimarranno abbastanza inattivi. Se c'è un momento in cui fallirà, è probabile che sarà all'avvio.

Accendere e spegnere il server è un'idea stupida. Non solo per menzionare che la maggior parte dei server può richiedere da 2 a 5 minuti per superare i controlli del BIOS, è anche una grande quantità di tempo sprecato.


Aggiornamento 2018: dato che la maggior parte dei computer è ora essenzialmente allo stato solido, questa risposta potrebbe non essere più accurata come una volta. L'analogia dei taxi non si adatta ai server moderni di oggi. Detto questo, in genere continui a non spegnere i server.


15
Potresti aggiungere alcuni link alla ricerca su questo argomento?
mafu,

15
@mafutrct: WikiBook on HD Failure e Google Labs Study on HD Failure mostrano prove inconculsive che suggeriscono che i cicli di alimentazione influiscono sulla durata dell'unità e che il tempo di attività totale non è tanto quanto il batch / fortuna del sorteggio. Anche le cose ovvie come il trauma fisico hanno il massimo effetto.
Chris S,

3
Come fanno ad alimentare il taxi se è sempre in funzione? È illegale nella maggior parte delle giurisdizioni.
Razze di leggerezza in orbita

8
@Tomalak - beh, il punto dell'analogia era che il motore del Taxi ha raggiunto la temperatura e in questo periodo si verifica meno usura. Nei 90 secondi necessari per ricaricare un taxi, il motore non ha la possibilità di raffreddarsi, quindi l'usura è ancora ridotta. Su un computer, viene "raffreddato" (ai fini dell'analogia) all'istante e ogni avvio è un avvio "a freddo".
Mark Henderson

6
@Fergus - beh, questo vale solo per le scatole fisiche. Se hai una VM sentiti libero di accenderla / spegnerla quanto vuoi. Ma non otterrai alcun salvataggio o risparmio energetico da esso.
Mark Henderson

70

Spegnere e riaccendere il server ogni giorno causerebbe probabilmente un errore più rapido rispetto al lasciarlo acceso.


3
Molto probabilmente a causa dello stress del disco @ boot; inoltre, avevo un server che funzionava felicemente per anni, poi mi sono rifiutato di presentarsi al riavvio. Si scopre che il disco di avvio si stava lentamente deteriorando, con l'MBR completamente illeggibile - ma l'MBR è stato letto solo all'avvio, quindi nessuno se ne è accorto. Per fortuna, il disco è completamente morto solo dopo una frenetica corsa per recuperare tutto ciò di cui non è stato ancora eseguito il backup.
Piskvor,

Dubito che ciò avvenga con lo spegnimento una volta al giorno, anche i dischi aziendali hanno un conteggio di accensione di 300.000 nei dettagli tecnici. Il problema deriva dalla gestione dell'energia che lo fa ogni 15 minuti.
Lothar,

Non capisco come una risposta che affermi semplicemente i pensieri di qualcuno senza alcun ragionamento su cosa abbia mai ricevuto così 70 voti.
Bassie-c,

52

L'unica cosa che riesco a vedere è quasi vicina a ciò che ti è stato detto è che le unità possono guastarsi entro 2 anni. Possono infatti fallire in qualsiasi momento. Sono sicuro che molti di noi hanno ricevuto almeno un nuovissimo drive che era DOA. In media, le unità server dureranno da circa 3 anni in su, con 10 o 20 anni non troppo rari. Ciò non significa che ogni singola unità non si guasterà molto prima.

I server (ovvero una macchina con componenti di livello server adeguati) sono progettati per funzionare continuamente. Non c'è motivo di spegnerlo di notte, ma alcuni ottimi motivi per lasciarlo in funzione. La notte, o qualunque altra ora sia "silenziosa" per un determinato sistema, è il momento di eseguire tutta la manutenzione e l'automazione.

ad esempio, i backup vengono eseguiti meglio quando non vi è o poca attività dell'utente. Questo aiuta a garantire che i backup siano coerenti. Sicuro ci sono modi per aggirare questo, ma perché non dare ai tuoi backup tutte le possibilità di successo quando non c'è nulla da perdere nel farlo?

Qualcuno che esegue un "server" con un singolo disco e nessun backup è un pazzo, non un amministratore. L'unica ragione per cui se l'è cavata è la pura e semplice fortuna. Non aveva assolutamente nulla a che fare con lo spegnimento della macchina di notte.


Ho intenzione di fare un'ipotesi qui e dire che "l'amministratore" che non sta eseguendo i backup non sta utilizzando componenti di livello server adeguati.
intuito il

23

I server sono progettati per funzionare 24x7. L'arresto dei server durante la notte è estremamente non tipico. I dischi rigidi del server sono progettati per essere più affidabili delle unità desktop e ora che si dispone di backup e RAID 1, non si subirà la perdita di dati se una delle due unità si guasta.

Ciò di cui mi preoccuperei ora per questo server di 16 anni è una scheda madre o un guasto all'alimentazione non ridondante.


Sembra logico :) È un pc powerola motorola .. non è ancora morto!
GorillaApe

13

Non ho mai spento un server la sera prima.

I dischi rigidi si guastano quando si guastano. L'accensione e lo spegnimento della macchina non rallenta il funzionamento dell'unità. Ho visto i dischi rigidi spediti dal fornitore che erano già danneggiati e ho visto i dischi in esecuzione (e utilizzati attivamente) per oltre 5 anni senza guasti.

I tuoi professori sono idioti.


2
Accendendo e spegnendo la macchina, l'unità si guasterà più lentamente se viene lasciata spenta per periodi di tempo abbastanza lunghi. Se si spegne la macchina per 10 anni, l'unità è più o meno garantita per durare almeno 10 anni. La domanda è per quanto tempo la macchina media deve essere lasciata fuori per avere un effetto positivo.
intuito il

4
@intuited Se si accende la macchina dopo 50 anni di attesa e l'unità non si avvia, è durata 0 anni, 50 anni o cosa?
Cade Roux,

@Cade Roux: non ne ho idea. Cosa importa? Anche se lo contiamo come 0, questo valore anomalo non cambierà in modo significativo la media complessiva.
intuito il

1
@intuited è stato uno scherzo - ma in realtà, probabilmente inclinerà la ricerca media.google.com/archive/disk_failures.pdf E da questi dati, è possibile che un nuovo disco acceso dopo essere stato seduto sullo scaffale per 5 anni sarà più probabilità di guasto di un'unità in esecuzione per 5 anni. Il punto è controverso perché non paga per lasciare l'hardware inattivo più di quanto non faccia per spegnerlo e riaccenderlo. L'hardware si degrada e diventa obsoleto e deve essere utilizzato il valore massimo prima che si esaurisca e venga sostituito.
Cade Roux,

@Cade Roux: dalla ricerca di Google a cui ti sei collegato: Come è comune nelle distribuzioni di classe server, i dischi sono stati accesi, funzionanti e generalmente in servizio per praticamente tutta la loro vita registrata. Quindi la ricerca non è rilevante qui. Indica che l'unità ancora nuova sarà più probabile che quella vecchia si guastasse durante un determinato periodo di tempo dopo che è stata riaccesa, ma ciò presuppone che quella vecchia non si sia già guastata nei 5 anni in cui è stata in esecuzione.
intuito il

11

Questo mette anche un "aspetto umano" più grande sul server. Anche se si utilizzano le impostazioni di alimentazione per spegnerlo e accenderlo nei momenti corretti, è necessario che qualcuno controlli il server per assicurarsi che tutti i servizi richiesti, ecc. Vengano avviati correttamente. È tempo prezioso che puoi insegnare ai professori su backup e RAID.

Quando esegui i backup? Darei qualsiasi cosa per una finestra di 6 ore per eseguire i miei backup giornalieri, aggiornamenti, aggiornamenti rapidi, ecc. Se non altro, questo tempo di inattività può essere utilizzato per questo.

Vi sfido ad andare da questi "professori seri" e fornire ricerche che dimostrano che lasciare il computer su 24x7 è male per questo. Vorrei eseguire il backup di ciò che stanno dicendo.


Ho detto seriamente perché uno di loro ha progettato processori, i sistemi embedded conoscono il kernel Linux in modo molto dettagliato. Per quanto riguarda i backup, ho creato degli script per il backup automatico, ma poi il proprietario e l'amministratore mi sembravano WTF. "NO, voglio farli manualmente ogni giorno" e non "tar e comprimerli".
GorillaApe

2
@Parhs In poche parole, sei più intelligente dei tuoi superiori. Sarebbe saggio da parte tua abbandonare e trovare un vero mentore prima di aver trascorso troppo tempo all'ombra di idioti che non ti lasceranno fare la cosa giusta.
Skyhawk,

10

Realisticamente, la maggior parte dei server dovrebbe essere disponibile 24 ore su 24, 7 giorni su 7. Chiaro e semplice.

In caso contrario il tuo non lo è, c'è molto dibattito tra i quali causerà più usura sul tuo server, la costante espansione e contrazione tra accendere il tuo server e farlo riscaldare, quindi spegnerlo e farlo raffreddare o l'usura dei componenti dovuta all'uso costante.

Non ho ancora visto alcuna ricerca su ciò che è peggio, e dubito fortemente che il tuo professore abbia accesso ad alcune ricerche che sostengono diversamente.

Alla fine dovrai prendere la decisione in base alle tue esigenze, ma il vantaggio in termini di costi per la maggior parte delle aziende è avere i loro server e servizi sempre disponibili, non solo quando qualcuno entra e lo accende. Soprattutto quando si discute sul fatto che potresti effettivamente creare più problemi ai tuoi server spegnendoli.


7

Ciò che è più importante è il raffreddamento. Il raffreddamento fa una grande differenza. La temperatura all'interno della scatola potrebbe essere molto più alta della stanza. Installerei un software per monitorarlo come sempre. Confrontando i moderni hard disk con quelli che hai sostituito, funzionano a caldo. Alcuni hanno bisogno di fan per raffreddarli A volte un piccolo fan può fare una grande differenza. La durata dell'HD e del server dipenderà dal raffreddamento.


5

Sì, non un'opzione. Dì ai tuoi professori che lo standard del settore è di lasciarli in funzione 24 ore su 24, 7 giorni su 7 e di avere una garanzia per l'hardware guasto. Se il server ha 16 anni, immagino che non otterrai questa garanzia.
Se il server esplodesse, quale tempo di recupero dovresti crearne uno nuovo con le informazioni di backup? Comincerei a suggerire ai clienti che il loro server ha raggiunto la fine del ciclo di vita e che dovrebbero iniziare a cercare fondi per uno nuovo.


5

È vero che le sollecitazioni meccaniche del ciclo di alimentazione sono difficili sull'HDD. Inoltre, c'erano alcune unità più vecchie che (se sufficientemente raffreddate) potevano smettere di funzionare del tutto a causa della "stiction".

Con circuiti progettati in modo inadeguato, anche le correnti di spunto provenienti dall'accensione della macchina potrebbero sollecitare alcuni componenti, anche se non è così probabile.

Detto questo, c'è della verità che lasciare la macchina accesa ha il suo pedaggio: i condensatori. I numerosi condensatori elettrolitici sulla scheda madre sono probabilmente il collegamento più debole dell'affidabilità del sistema. Questi condensatori sono classificati per la loro capacità di gestione corrente / tensione, temperatura operativa e durata. I condensatori tipici saranno classificati per diverse migliaia di ore. I cappucci per impieghi gravosi / di lunga durata sono classificati per diverse decine di migliaia di ore e temperature più elevate.

Questo è il motivo per cui a volte vedi schede madri in vendita dotate di "condensatori di livello server" - perché quelle macchine funzionano alla massima velocità 24x7 e masticano per tutta la loro durata della scheda madre.


Più di 15 anni fa ho sentito il termine "statistica del disco" o qualcosa del genere, la spiegazione fornita era dopo aver funzionato per anni i polimeri nei lubrificanti del disco iniziano a formare lunghe catene e quando il disco viene spento e smette di far girare i cuscinetti cogliere e non ricominciare '. In caso di interruzioni di corrente in un controller di dominio, in genere un gruppo di server non si riavviava. Ovviamente, non ho idea di quali dischi utilizzino come / invece di cuscinetti ora.
jqa,

+1 per lo stress. Mi chiedevo se qualcuno lo avrebbe menzionato. @james, si chiama "striction", e c'è stato molto lavoro fatto per inventare lubrificanti per le unità che non si addensano nel tempo, uso / abuso. Le cose sono migliori di prima, ma accendere e spegnere le unità non è ancora una buona idea perché è molto probabile che muoiano quando si interrompe l'alimentazione, o perché un componente salta o i motori di azionamento non possono iniziare a girare i piatti
Greg,

La maggior parte delle schede madri prodotte dal 2008 (forse prima) per ora utilizzano condensatori a stato solido, che hanno una durata MOLTO MOLTO più elevata rispetto ai componenti elettrolitici. Gli alimentatori sono ora l'unico posto dove si vedono ancora condensatori elettrolitici.
Mircea Chirea,

Questa è stiction (stick + friction), non striction. :-)
kindall

2

Quando ho ricevuto dal server la manutenzione preventiva mensile del server, il server ha iniziato con un arresto ogni mese. Ciò tendeva a provocare guasti ai componenti. Il programma è cambiato in trimestrale, quindi solo quando richiesto. Non consiglierei di spegnere un sistema così vecchio a meno che non fosse necessario.


Sì, ho visto anche server con uptime di oltre 1000 giorni. Ma non riavviare regolarmente (caldo) è un peccato; meglio incontrare un sistema guasto dopo un riavvio pianificato che dopo uno non pianificato. Inoltre, questi riavvii tendono a svelare errori di configurazione.
sjas,

1

Una cosa non menzionata è che la maggior parte dei server ha attività di manutenzione che svolgono su base giornaliera, settimanale o mensile. Questi sono quasi sempre programmati per la notte, quando l'attività dovrebbe essere al minimo.

Su un sistema Red Hat, ad esempio, queste attività iniziano alle 4:02 del server. A seconda del server, potrebbero essere eseguiti da alcuni secondi a un'ora o più. Se accendi il server alle 4:30, queste attività di manutenzione verranno avviate immediatamente (da Anacron) e i primi utenti che accederanno da allora a 5 ore verrebbero influenzati in una certa misura.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.