Perché 5 diversi iMac hanno sviluppato partizioni OS X corrotte quando le unità fisiche sono a posto?


9

Sono un tecnico per il mio distretto scolastico locale e stiamo riscontrando alcuni problemi con il nostro iMac Multimedia Lab. Negli ultimi nove mesi, 5 dei 22 iMac hanno sofferto di corruzione del filesystem. L'unica soluzione per queste macchine è stata cancellare completamente la partizione OS X e ricominciare da capo (con il ripristino appropriato da Time Machine).

Ecco l'elenco dei motivi per cui so che si tratta di corruzione del file system:

  • L'iMac non avvierà OS X. L'ho visto fermarsi sul "palpitante", sulla barra di avanzamento o solo sul logo Apple.

  • Il montaggio del disco iMac tramite la Modalità disco di destinazione (adoro quella funzione) ha esito positivo, ma solo per la partizione Bootcamp. La partizione OS X non riesce a montare.

  • Una verifica del disco rivela che la partizione OS X deve essere riparata (ho visto voci di fratelli non validi, bambini orfani ecc.). Il tentativo di riparare il disco non riesce. Quest'ultimo tentativo (proprio ieri) ha affermato che non è stato possibile ricostruire gli alberi del catalogo B. Avrei dovuto prendere appunti più completi su ciò che era stato detto ogni volta, ma ogni volta fino a quest'ultimo pensavo fosse uno strano evento da un milione di milioni. Un colpo di fortuna

  • Anche il tentativo di riparare o ricostruire le unità con Drive Genius 3 fallisce Finora il 98% dei file dell'utente è stato recuperato tramite Data Rescue 3 Il disco rigido fisico non sembra guastarsi (il recupero dei file dall'unità non si blocca o "beachball ", l'unità non viene visualizzata e scompare in Utility Disco, Finder rimane reattivo, ecc.)

  • Normalmente lo aggiungerei a una serie di dischi rigidi. È appena successo a essere il ragazzo sfortunato che ha acquistato una cattiva serie di iMac, giusto? Ecco dove le cose iniziano a diventare interessanti. Vi presento l'elenco delle stranezze:

  • Le unità vengono verificate correttamente tramite SMART

  • La RAM viene estratta
  • Dopo aver eliminato e ricreato la partizione (e reinstallato OS X) tutti i problemi scompaiono.
  • La corruzione non è avvenuta due volte sullo stesso Mac
  • Bootcamp è installato sulla stessa unità e funziona prima, dopo e durante la corruzione sul lato Mac.
  • La partizione Bootcamp non ha riscontrato questo problema su QUALUNQUE degli iMac

Inoltre, per escludere l'ovvio:

  • Non ci sono stati sopraccigli o sovratensioni

  • Dubitiamo seriamente di un virus, poiché i malfunzionamenti compaiono ovunque contemporaneamente (due macchine sono cadute contemporaneamente circa un mese fa) a mesi di distanza. Inoltre, i documenti dell'utente vengono ripristinati dopo la riformattazione, quindi si potrebbe supporre che se si trattasse di un programma dannoso il Mac continuerebbe a fallire ancora e ancora.

  • Le macchine sono state in una zona climatizzata

  • Non è stato interessato lo stesso utente

  • A volte il problema si verifica dopo un inevitabile arresto forzato (che si verifica solo di rado. Queste macchine non vengono spente eccessivamente in modo improprio. Solo ciò che ti aspetteresti con un Mac Lab che esegue multimedia cinque giorni alla settimana), altre volte è completamente fuori uso -il blu

Il software utilizzato di frequente include:

  • iPhoto
  • iDVD
  • iMovie
  • Safari

Le macchine sono anche caricate con Parallels 5, che carica la partizione Bootcamp in una VM. Parallels è stato impostato tramite la procedura guidata standard, nessuna configurazione oddball o hack.

E, ultimo ma non meno importante, le specifiche:

  • iMac 10,1 (21,5 pollici)
  • Stock azionari
  • OS X Snow Leopard (ultimi aggiornamenti)
  • Memoria di riserva
  • Partecipa alla nostra infrastruttura di Active Directory
  • File system HFS + (senza distinzione tra maiuscole e minuscole, impostazione predefinita per OS X Snow Leopard)
  • Nessuna manutenzione fuori dall'ordinario. programmi. Drive Genius è stato caricato ieri pomeriggio (DOPO il recupero dall'ultimo errore) per eseguire una verifica su tutti gli iMac, ma non è stato installato prima. Tutti i Mac, sia quelli che hanno fallito in passato sia quelli che non hanno mai fallito, sono passati a pieni voti.

TL; DR: la partizione OS X è stata danneggiata su cinque diversi iMac, ma le unità fisiche vanno bene. PERCHÉ!?!?!


Off Argomento: 8¼b: è possibile utilizzare Maiusc + Invio per inserire le interruzioni di riga nelle caselle di commento. Ho anche sentito che ci sono plugin per browser (script utente?) Là fuori che inverte il ruolo di enter & shift-enter, quindi enter inserirà un'interruzione di riga e shift-enter invierà il commento.
Jason Salaz,

+1 domanda ben documentata. Hai mai considerato che potrebbe essere un atto degli studenti?

In che modo iMac 10,1 si associa a iMac {early | mid | late} 20YX per esaminare facilmente il lato hardware delle cose? Se sostituisci i #desktopcomputers con uno dei numeri di serie, support.apple.com/manuals/#desktopcomputers otterrà il nome descrittivo per i tuoi iMac.
bmike

Risposte:


6

HFS Plus (HFS +) è un file system fragile e un po 'obsoleto. Se lo cerchi su Google, troverai molti rapporti sulla corruzione del filesystem.

Il riavvio senza smontare il filesystem è il modo migliore per corromperlo. Questo accade quando il mac si blocca per qualche motivo (nel mio caso è la scheda video NVIDIA) o interruzioni di corrente.

Ecco alcuni suggerimenti che IMHO dovrebbe ridurre le possibilità di corruzione del filesystem:

  1. Quando il sistema si blocca, prova a riavviare da ssh. Quando il sottosistema grafico di my mac si libera, è ancora accessibile tramite SSH: prova ad aprire la connessione ssh dalla tua rete e riavviala. È possibile utilizzare Apple Remote Desktop (€ 62) per questa attività. Dovresti prima abilitare l'accesso ssh.

  2. Fare diskutil verifyVolume /periodicamente. Sì, anche se HFS + è un filesystem con journal, la corruzione è possibile. Puoi utilizzare Apple Remote Desktop per eseguirlo contemporaneamente su tutti i computer della classe.

  3. Usa più volumi. L'uso di più volumi dovrebbe ridurre le possibilità di corruzione. La divisione /da /Users/dovrebbe facilitare il ripristino (o / o / gli utenti saranno danneggiati). Si noti che questo probabilmente potrebbe complicare le cose con Bootcamp.

  4. Montare le partizioni con opzioni che riducono la scrittura. Il montaggio di partizioni con noatimeopzione dovrebbe ridurre la scrittura su di esso. Per impostazione predefinita, ogni volta che si accede a un file, il timestamp di accesso viene "toccato".

  5. Assicurarsi che non vi siano tentativi di montare la partizione HFS + da altri sistemi operativi. È possibile che qualcuno stia avviando una distro linux da usb / dvd e stia montando /in modalità rw o stia giocando con le impostazioni del journal?

Spero che la mia risposta sia utile.

PS: la corruzione di solito è graduale non improvvisa. C'è la possibilità che qualcosa di specifico stia causando questo, software o flusso di lavoro. La mia mente è su Parallels 5, ma dovrebbe corrompere il volume del bootcamp, non quello di MacOS. Cercare i loro KB non rivela nulla di utile.

PPS: è fragile perché non ha un sistema reale per correggere la corruzione all'interno di un file. Un diario registra i trasferimenti e tenta di ricopiare i dati al fine di riportare il filesystem in uno stato coerente ma se il file perso è vitale (come i dati effettivi della struttura del filesystem), allora non c'è ricorso. Infatti, poiché il File di catalogo (che elenca tutte le informazioni sui dati logici) viene archiviato come file, se danneggiato in alcuni punti l'intero file system viene reso inutilizzabile dati di immondizia o spazzatura parzialmente curata nel caso in cui sia danneggiato e si verifica un replay di journal che gli fa ristrutturare il filesystem in un modo che non è coerente con i dati (ad esempio, i file aeb sono rispettivamente 1 MB e 2 MB, ma il replay li cambia in 2 MB e 1 MB, risultando nella metà del contenuto di B essendo all'interno di A).


2
Qualsiasi filesystem avrà problemi considerando le circostanze. Ma "Fragile" e "Un po 'datato"? Veramente? Un po 'datato nella mia mente non è un journaling. E questo non è il caso di HFS +.
Jason Salaz,

Se il filesystem fosse fragile, tutti i Mac non avrebbero problemi? Installazioni con centinaia di mac che controllano la disconnessione improvvisa dell'alimentazione e un programma continuo di avviamenti sicuri, le riparazioni del file system annulleranno questo tipo di cose sul nascere.
bmike

+1 per HFS Plus (HFS +) è un file system fragile. Ho sperimentato questo scenario esatto con due dischi rigidi. Windows non è interessato, hfs + non può essere riparato. Ricreare la partizione e reinstallare os x funziona bene
Clint Good

2

Cose che potrebbero farlo dalla cima della mia testa ...

hai detto che non hai avuto sbalzi di tensione o cali di tensione. Come lo confermi? Avevamo un'aula in cui gli alimentatori per PC sembravano soffiare a caso. Abbiamo dovuto fare in modo che il personale addetto alla manutenzione collegasse un misuratore di monitoraggio al circuito e abbiamo scoperto che la presa ha enormi picchi di tensione.

La memoria non è inserita correttamente e non corrompe i dati.

Cavi di trasmissione allentati.

dischi rigidi marginali che hanno una serie di settori difettosa ma non abbastanza male da innescare avvisi o scansioni per settori danneggiati.

Qualcosa sul lato Windows tramite bootcamp sta modificando l'unità in un modo che non piace all'unità. Protezione da copia? Utilità di guida?

Hai detto che è in un laboratorio. Cosa gestiscono gli studenti? Stai monitorando o bloccando cosa può essere eseguito che potrebbe essere in esecuzione?

Hai detto che questo sembra essere casuale, non ci sono due macchine che succedono di seguito. Questo mi indurrebbe a sospettare che sia uno studente o un gruppo di studenti a causarlo o che ci sia un problema di alimentazione casuale in laboratorio. Esiste un modo per rintracciare chi ha usato l'ultima macchina per vedere se questo problema sembra seguire magicamente uno dei tuoi utenti?


Non abbiamo utilizzato alcuna apparecchiatura di monitoraggio dell'alimentazione, no. Semplicemente cancellando il rapporto degli insegnanti del liceo su quello. modifica GAH! Nota per sé: il tasto Invio non crea una nuova riga in modalità commento.
EightQuarterBit

Potrebbe voler provarlo. Non c'erano neppure indicazioni di un simile problema in classe, ma il direttore IT era un laureato in ingegneria elettrica al college e glielo fece controllare. Ha fatto la matematica e ha scoperto che stavano avendo picchi periodici di migliaia di volt ...
Bart Silverstrim

Abbiamo eseguito un test RAM su ogni macchina che ha avuto questo problema, hanno superato tutti. Penseresti che se i cavi dell'unità fossero allentati il ​​problema si sarebbe manifestato sulla stessa macchina alcune volte sullo stesso iMac, piuttosto che su più iMac. Inoltre, se fosse un cavo di trasmissione allentato, è strano che non si sia verificato con le partizioni Bootcamp.
EightQuarterBit

È possibile che le unità siano davvero marginali, ma ho difficoltà a comprarla. Ho controllato, ricontrollato e verificato tre volte queste unità. Ho usato l'utilità disco di Apple e Drive Genius 3 per scansionare lo snot dai dischi. Inoltre, non ho mai visto un disco marginale senza avere almeno alcuni indicatori in SMART. Ho visto dischi rigidi "danneggiati" che hanno superato SMART, ma avevano ancora conteggi di settore trasferiti elevati e quant'altro quando si utilizzava un'utilità SMART. Queste unità? Nada.
EightQuarterBit

Ho pensato di rovinare Windows con la partizione Mac e non l'ho ancora escluso. Tuttavia, il fatto che il driver bootcamp di Apple monterà SOLO partizioni HFS + come di sola lettura sembra precluderlo. Non stiamo usando alcun tool su disco o utility di tipo "deep freeze" sul lato Windows.
EightQuarterBit

1

Hai preso in considerazione un controllo periodico delle macchine? Puoi facilmente pianificare i passaggi settimanali di verifica fsck (fino a quando non capisci perché si sta verificando la corruzione) e quindi mensilmente per tenere d'occhio le cose.

Con un file system journaled, ci vuole un po 'di trattamento ripetuto per i mac per degradare al punto da non avviarsi. Anche il cattivo software non scrive sul lato del sistema di avvio, quindi sospetto che qualcosa sia chiaramente sbagliato. Sui Mac che si spengono in modo pulito e attirano l'attenzione ogni volta che vengono riparati errori minori del filesystem (ogni volta che un Mac si riavvia e fsck non è in esecuzione in modalità Preen è un segno di problemi all'orizzonte).

Con una distribuzione di 25 mac, puoi facilmente passare un po 'di tempo a essere proattivo sui controlli del file system e vedere quali non si spengono in modo pulito configurando un server syslog o un altro sistema di controllo centralizzato.


0

Vorrei prendere in considerazione l'attività degli studenti. Se stai eseguendo bootcamp e OS X, scommetto che gli studenti si stanno schiantando sul lato Mac per eseguire il boot camp, perché non sono pazienti. Questo può succedere anche se è presente un blocco schermo.

Suggerisco:

  1. Rimuovi il campo di addestramento. Esegui invece una macchina virtuale in Parallels o Virtual Box. (Ho scoperto che Windows XP in VirtualBox funziona abbastanza bene.) Configuralo in modo che la Macchina Virtuale sia immutabile, memorizzata localmente sulla vecchia partizione bootcamp. Ciò impedirà ai bambini di rovinarsi con l'installazione di Windows. Reindirizza la loro home directory per leggere la loro home directory del Mac sul tuo server. (Questa è una PITA da configurare per la prima volta, poiché comprende circa un milione di regedit)

  2. Stabilire una qualche forma di monitoraggio dell'accesso in modo da sapere quali studenti hanno utilizzato quali macchine. Questo ha il vantaggio di poter individuare lo stesso bambino che accede su più macchine, di solito facendo questo come un favore per qualcuno che è vietato. Ho impostato che quando lo stesso login era su due macchine, entrambe le macchine venivano riavviate.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.