Dischi danneggiati nel server antico


12

Ho un server Netware 3.12 dell'era 1998 che esegue tutto nel nostro campus: contabilità generale, acquisti, libro paga, informazioni sugli studenti, voti, tu lo chiami. Il server ha un controller RAID Adaptec con due volumi:

  1. RAID 1, 2 dischi scsi da 17 GB, Seagate ST318417W
  2. RAID 5, 3 dischi scsi da 4 GB, 2 Seagate ST34573W e 1 ST34572W.

Siamo attualmente nelle prime fasi di un progetto per sostituire questo sistema, ma non si passa semplicemente a un nuovo sistema come quello e quindi devo mantenere questo server attivo almeno fino a novembre 2011.

Questa settimana non abbiamo avuto un guasto ma due dischi rigidi. Per fortuna provengono da volumi diversi e siamo in grado di continuare a funzionare per il momento, ma data la natura stretta di questi guasti ho seri dubbi sul fatto che sarò in grado di evitare guasti catastrofici da questo server attraverso l'obiettivo di novembre così com'è senza ripristinando la ridondanza RAID - ci vorrà solo un altro guasto dell'unità ovunque e io sarò completamente hosed.

Siamo abbastanza fortunati da avere dei "pezzi di ricambio" identici in giro per entrambe le unità, ma i pezzi di ricambio sono in condizioni sconosciute. Ho provato a scambiarli solo con, ma il controller RAID non è abbastanza intelligente da gestirlo e rende il sistema non avviabile.

Per quanto riguarda il controller RAID stesso, c'è un'utilità che posso accedere durante il POST tramite un collegamento Ctrl-A, ma da lì non posso fare molto utile. Per gestire effettivamente i volumi devo prima avviare Netware, a quel punto posso usare CI/O Array Management Software Version 2.0per guardare effettivamente le informazioni sul volume. Ho il sospetto che il modo normale di gestire le cose sia quello di avviare da un floppy speciale con il software del controller su di esso, ma quel floppy è scomparso da tempo.

Analizzando le opzioni nel software RAID, penso che l'unico modo supportato per sostituire un disco in un volume RAID esistente sia quello di aggiungere fisicamente il disco, avviarlo e configurarlo come "riserva" per un volume, forzare il volume da utilizzare l'unità di riserva per sostituire un disco discendente esistente (e a questo punto sto solo indovinando) in modo che il disco discendente diventi la riserva, ripari il volume, rimuova la scorta dal volume, quindi spenga e rimuova il disco. Quindi ricominciare tutto da capo per l'altro disco guasto. Tutto ciò equivale a molti tempi di inattività, supponendo che riesca persino a farlo funzionare e che i miei ricambi siano utili.

Per quanto riguarda la ricerca di ricambi affidabili, non ho idea di dove iniziare a cercare un nuovo disco scsi da 4 GB o nemmeno quale sistema scsi esatto sto cercando, poiché ha attraversato diverse iterazioni nel tempo.

Un'altra opzione è migrare questo su una macchina virtuale (hyper-v), ma tutti i precedenti tentativi che abbiamo fatto in quest'area non sono riusciti ad andare molto lontano. Quando questa macchina è stata installata mi stavo appena diplomando al liceo, e quindi richiede una conoscenza di livello inferiore di netware e dos di quanto abbia mai sviluppato, o se da allora me ne sono dimenticato (non sono nemmeno esattamente un dos neophyte).

Parte del mio problema è che questo è un server ad alto utilizzo, e rimuoverlo per alcuni giorni per capire che le cose non voleranno molto bene.

Per quanto riguarda la domanda, sto cercando qualcosa che possa essere utile in questa situazione: una raccomandazione su un posto dove trovare buoni pezzi di ricambio di questa era, esperienza personale per riparare volumi RAID usando un controller simile o costruire un hyper-v vm da un vecchio server netware, una linea su un floppy con un software migliore per il controller RAID, consigli su un buon consulente Novell in Nebraska che sarebbe in grado di sistemare le cose, un'altra opzione che non ho ancora preso in considerazione, ecc.

Aggiornamento:
per i backup, abbiamo solo buoni backup (recentemente verificati tramite ripristino) dei dati , niente per il software che esegue effettivamente le cose.

Aggiornamento 2:
solo un rapporto sui progressi che attualmente ho un'installazione di Netware 3.12 funzionante in VMWare Virtual Server 2.0, grazie in gran parte alla guida che ho trovato qui:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html

I prossimi passi sono la preparazione di volumi vuoti di netware per abbinare i volumi aggiuntivi sul mio server esistente, prendendo un dump di tutto sull'unità C: \ e volumi di netware sul mio server esistente e scoprendo da tali informazioni quali moduli devono essere aggiunti a netware, installando le mie licenze (abbiamo ancora quel disco, se va bene) e spostando i dati.

Ho l'approvazione per arrestare il server per una settimana dopo il primo dell'anno (purtroppo non prima), quindi, oltre a creare volumi vuoti, il resto del lavoro dovrà aspettare fino ad allora.

Aggiornamento finale (5 gennaio 2011):
questa settimana sono stato in grado di far funzionare i ricambi in entrambe le matrici di raid senza perdita di dati. Entrambi sono ora elencati dal controller come "ERRORE TOLLERANTE" (yay!). Sono stato anche in grado di sfruttare i progressi del mio ultimo aggiornamento e ora ho un server "di riserva" funzionale in VMWare Server 2.0. Il ricambio può essere eseguito e utilizzare il nostro software erp, ma non riesco a metterlo in produzione perché non riesco (ancora) a stampare da quella scatola (e non ho idea del perché). Anche così, questa VM farà un pizzico se non ho altra scelta, e tra essa e gli array RAID riparati mi sento a mio agio a vivere con la situazione fino a quando non posso spazzare via la macchina a novembre.

Epilogo (16 gennaio 2012):
il progetto di sostituzione di questo server con un sistema completamente nuovo è stato avviato come previsto. Evviva per non più netware! Tutti grandine SQL Server! Il re è morto. Lunga vita al Re!

Abbiamo ancora in programma di mantenere il vecchio server in esecuzione per un po 'di più, fino a quando il nostro audit post-fiscale non sarà completato ad agosto. Ma se si verifica un fallimento tra oggi e allora, nessuno si lamenterebbe troppo.


1
Quale è la domanda?
Andyhky,

Vedi l'ultimo paragrafo
Joel Coel l'

2
Come altri, ho perso interesse molto prima di arrivare al paragrafo della domanda. Potresti considerare di riformattare il tutto per porre la domanda prima o di condensarla.
John Gardeniers,

2
Voglio metterlo in prospettiva (che potresti già sapere): la tua INTERA operazione si basa su una macchina di 12 anni che non puoi sostituire per un anno intero. Hai un problema.
Jeff Ferland,

2
Grazie per l'aggiornamento sul tuo progetto. Sono felice di sapere che la tua migrazione ha avuto successo.
Starfish,

Risposte:


12

Get (e continuano ad ottenere, al giorno o più spesso) buone copie di backup dei dati dei file condivisi ora . Se perdi la macchina probabilmente non sarai in grado di trovare i dischetti necessari (sì) per ripristinarla. Ottieni una copia della partizione DOS da cui Netware avvia anche, se possibile, anche.

Sembra una scheda RAID AAA-131 Adaptec (o qualcosa dell'epoca). Se ho ragione, non troverai software di gestione molto migliore perché non esiste nessuno (vedi http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html per le ultime versioni disponibili). Ho usato molte di quelle carte "nel corso della giornata" e hanno funzionato bene.

Se è un AAA-131, fai molta attenzione quando giochi con la sua configurazione . Non è possibile configurare un set RAID senza cancellare i dischi su tali schede. Ciò significa, ad esempio, se si toglie la scatola e si collegano alcuni dischi di prova e, per esempio, si cancella la configurazione e si effettua un set RAID su di essi, quando si ricollegano i dischi di "produzione" non ci sarà modo di usarli senza che la scheda li formatta per prima. Si. È così male.

Novell Netware verrà eseguito negli hypervisor VMware. Consiglierei di contrattare con qualcuno che abbia discreta esperienza Novell Netware (ci sono persone qui-- Ti sto guardando, Sysadmin1138-- che ce l'hanno) per aiutarti a spostare i contenuti del server in un ambiente virtuale dove , almeno, puoi continuare.

Se i computer client sono moderni e hanno un client di rete Microsoft installato, è possibile che la migrazione a un computer basato su Windows Server sia effettivamente semplice e veloce. Visualizzate il computer Windows Server con lo stesso nome del server Netware, esponete una struttura di directory condivisa con la stessa convenzione di denominazione UNC del computer Netware, copiate tutti i file e duplicate le autorizzazioni sul computer di destinazione (manualmente). Potrebbe non essere così difficile da fare e potresti "organizzare" in anticipo la migrazione in un laboratorio di prova e testare alcuni client con esso per decidere cosa deve essere modificato dal punto di vista dell'ambiente di script / utente.

Probabilmente puoi ottenere dell'hardware di ricambio da eBay. Qualunque cosa tu compri di quell'annata, però, avrà anche problemi di affidabilità.

Se fossi in te, farei stare bene qualcuno con Windows Server per aiutarti a organizzare una migrazione lontano da quella scatola ORA . Probabilmente il caso può essere fatto alla direzione per spendere un po 'di soldi, dato che potresti perdere l'intero contenuto della scatola Netware praticamente in qualsiasi momento. La scatola sostitutiva non avrebbe bisogno di una grande potenza (dato quello che stai sostituendo) quindi le licenze e il backup del software sarebbero i tuoi maggiori costi. I problemi di migrazione relativi al client potrebbero essere minimizzati usando un consulente che è bravo con gli script e può pianificare i dettagli della modifica delle impostazioni relative al client attraverso l'accesso e gli script di avvio.


Il software di gestione del campus che eseguiamo su questa macchina richiede la directory Novell per la sua configurazione di sicurezza, altrimenti farei AD solo in un batter d'occhio. Terrò a mente di non giocare troppo con il controller RAID.
Joel Coel,

4
@Joel Coel: Yeeouch. Che schifo Quindi virtualizzalo il più rapidamente possibile. Quella vecchia di un controller RAID fornirà un BIOS Int 13 che consentirà agli strumenti di imaging del disco DOS (come il vecchio GHOST per DOS) di funzionare correttamente. Otterrei un'immagine settore per settore di tutte le partizioni di Netware e quindi ottenere qualcuno che ti aiuti a migrare in dischi virtuali per l'hypervisor di tua scelta.
Evan Anderson,

Sto lavorando a una risposta ora.
sysadmin1138

10

Lo so, poiché l'ho fatto (Ciao Evan), VMWare ha un supporto NetWare decente. Anche per le cose davvero vecchie (quello che stai correndo). NetWare di quei NOOP vintage spegne la CPU quando è inattiva invece di HALTing, quindi qualsiasi CPU che viene fornita in una VM verrà ancorata. Questo è lo scopo degli strumenti VMWare, non lo fanno. VMWare è in circolazione dagli anni '90 (e ha anche avuto uno stand in BrainShare per diversi anni) e ha dovuto farlo, ecco perché hanno il supporto. La virtualizzazione di Microsoft è abbastanza nuova da non aver mai dovuto virtualizzare NetWare, quindi non funziona lì.

Se questo server è critico come dici tu, scattare per alcune licenze VMWare dovrebbe essere una vendita facile. Come minimo, richiedi una licenza VMWare Workstation, che almeno porterà questo server in un ambiente virtuale. VMWare Server è gratuito (credo) se proprio devi. Una volta fatto quel lavoro, puoi considerare di spostarlo su qualcosa come ESXi fino a quando non può essere sostituito formalmente.

Ci sono altre opzioni, a seconda delle tue abilità in Linux. Novell ha impiegato parecchio tempo a ottenere Xen (non KVM, Xen, sebbene entrambi utilizzino qemu) per supportare NetWare. Probabilmente funzionerà con NW3.12, anche se dovrai essere sicuro di utilizzare la modalità di virtualizzazione completa , non la paravirtualizzazione.

Quel server è abbastanza nuovo e dovrebbe contenere un'unità CD-ROM, che probabilmente sarà la tua grazia salvifica. Una volta completato il backup, avvialo su un ISO-Linux se lo desideri. Non sarà in grado di ottenere i dati, ma dovrebbe vedere il disco rigido. A quel punto, esegui una ddcopia completa di entrambi i volumi in un'altra parte della tua rete. Quelle immagini di unità possono essere utilizzate direttamente da qemu come unità virtuali.

Ci sono modi per convertire immagini generate da dd in VMware VMDK, ma non le ho usate io. Google loro, sono là fuori.


Alcune vecchie schede RAID Adaptec non sono supportate da Linux. L'OP può essere bloccato utilizzando un'utilità di imaging DOS (per sfruttare il BIOS Int13 della scheda). Una buona utility dd-a-vmdk che ho usato è: sourceforge.net/projects/raw2vmdk
Evan Anderson

Dispone di unità CD, ma risulta che l'unità non ha funzionato :(
Joel Coel,

5

Questo non è davvero utile in termini di domanda (francamente hai già dei pezzi di ricambio e l'unico suggerimento utile che ho per l'approvvigionamento di dischi vintage sarebbe " Invia i numeri di modello dell'unità a Google Shopping "), ma prima di toccare qualsiasi altra cosa dovresti davvero ASSICURARSI DI AVERE UN BUON BACKUP E PUOI RIPRISTINARLO CON SUCCESSO A UNA NUOVA MACCHINA IN UNO STATO UTILIZZABILE .

Se questa macchina è critica come sembra dalla tua descrizione, quella dovrebbe essere la tua priorità di zeroth in questo momento. Se da un po 'di tempo non esegui correttamente un test di ripristino sui tuoi backup, dovresti presumere che siano inutili e devi assicurarti di poter effettivamente recuperare se questa macchina dovesse esaurire l'ultimo e morire su di te.
Se un altro disco si esaurisce e non hai backup utilizzabili, è praticamente il gioco del pallone. Passerai immediatamente al tuo nuovo sistema, che tu sia pronto o meno.

Solo i miei $ 3,50.


Concordato. Metti alla prova la tua capacità di ripristino. # 1 Prima cosa. Senza un modo per ripristinare, potresti non avere backup. (Ci sono stato, l'ho fatto. Fa schifo. Non farlo.)
Minamhere

2

Altri hanno già indirizzato i backup, ecc., Quindi non ripeterò nulla di tutto ciò. Ci sono un paio di cose che puoi fare per migliorare le tue possibilità che il sistema continui a funzionare.

Inizia investendo in un filtro di linea di qualità davvero buona e posizionalo tra l'UPS e il server. Ormai quei vecchi dischi saranno piuttosto suscettibili a causa di picchi, picchi e anche fluttuazioni di approvvigionamento abbastanza piccole.

Vedo dal tuo aggiornamento che hai già installato le unità di riserva, ma questo è quello che avrei raccomandato: prima di provare le unità di riserva nel server inseriscile in un'altra macchina e stressalo con un software di burn-in o, se non è possibile ottenerlo, cicli di test continui utilizzando il normale software di test dell'unità. Continuate così per almeno alcuni giorni prima di dichiarare affidabili le unità. Le vecchie unità che sono state archiviate sono notoriamente inaffidabili e possono fallire con la caduta di un cappello.


1

Suggerimenti eccellenti sopra. Prova anche questo: su hardware moderno di riserva, prova a ripristinare l'intero sistema dall'ultimo backup completo. Assicurarsi che la macchina di scorta non sia in rete.

Cos'è, temo che potresti dire? Non hai backup e / o una procedura di ripristino? Bene, ora sai a cosa stai lavorando per la prossima settimana?


1

Rispondendo solo a doppiamente / triplicamente / quadruplicamente consigliamo di effettuare un backup ogni giorno fino a quando non si trova una soluzione. Se non riesci a sostituire facilmente le unità morte, l'unica soluzione è migrare a nuove unità. Che ciò significhi creare un nuovo server o migrare lentamente il server esistente per utilizzare nuove unità nel server esistente, è l'unica opzione.

Abbiamo avuto 2 dischi rigidi su 3 guasti in una sola notte in un array RAID 5 di 7 anni. I nostri backup erano decisamente obsoleti. 8 giorni e $ 17.000 dopo, una società di recupero dati è stata in grado di ripristinare l'intero server Exchange, ma nessuno è stato soddisfatto. (Tranne me, perché dovevo fare backup ogni giorno. Sull'hardware che avevo richiesto ma nessuno avrebbe comprato per me, ma questo fatto è andato perso per tutti gli altri ...)

L'unica cosa positiva che ne è derivata è che il cliente ha immediatamente approvato la mia richiesta di acquisto di 6 mesi per l'hardware sostitutivo. Ma, merda santa, sono stati 8 giorni estremamente stressanti. Fatti un favore, esegui subito un backup e inizia a lavorare su un piano di backup "mettiti subito in funzione su qualunque hardware tu possa trovare nel tuo ufficio".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.