Come fare in modo che Linux si avvii in modo affidabile su macchine multi-CPU?


2

Ho due macchine, una con core AMD Opteron 4x12 (processore AMD Opteron (tm) 6176), una con core Xeon 2x8 (HT disabilitato; CPU Intel (R) Xeon (R) E5-2660 0 @ 2.20GHz). Su entrambe le macchine ho difficoltà durante l'avvio di Linux usando kernel recenti. Il sistema si blocca durante l'inizializzazione del kernel, prima o appena quando initramfs ha iniziato a inizializzare l'hardware. L'ultima cosa che è stata visualizzata è stata una stacktrace come questa:

CPU: 31 PID: 0 Comm: swapper/31 Tainted: G      D      3.11.6-hardened #11
Hardware name: Supermicro X9DRT-HF+/X9DRT-HF+, BIOS 3.00 07/08/2013
task: ffff880854695500 ti: ffff880854695a28 task.ti: ffff880854695a28
RIP: 0010:[<ffffffff8100a82e>]  [<ffffffff8100a82e>] default_idle+0x6/0xe
RSP: 0000:ffff8808546b3ec8  EFLAGS: 00000286
RAX: ffffffff8100a828 RBX: ffff880854695a28 RCX: 00000000ffffffff
RDX: 0100000000000000 RSI: 0000000000000000 RDI: ffff88107fdec690
RBP: ffff8808546b3ec8 R08: 0000000000000000 R09: ffff880854695500
R10: ffff880854695500 R11: 0000000000000001 R12: ffff880854695a28
R13: ffff880854695a28 R14: ffff880854695a28 R15: 0000000000000000
FS:  0000000000000000(0000) GS:ffff88107fde0000(0000) knlGS:0000000000000000
CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 000002b43256a960 CR3: 00000000016b5000 CR4: 00000000000607f0
Stack:
 ffff8808546b3ed8 ffffffff8100aec9 ffff8808546b3f10 ffffffff8109ce25
 334ab55852ec7aef 000000000000001f ffffffff8102d6c0 0000000000000000
 0000000000000000 ffff8808546b3f48 ffffffff810276e0 ffff8808546b3f28
Call Trace:
 [<ffffffff8100aec9>] arch_cpu_idle+0x20/0x2b
 [<ffffffff8109ce25>] cpu_startup_entry+0xed/0x138
 [<ffffffff8102d6c0>] ? flat_init_apic_ldr+0x80/0x80
 [<ffffffff810276e0>] start_secondary+0x2c9/0x2f8

Ho compilato il kernel da solo e funziona benissimo, se avvio con nolapic. Tuttavia, viene utilizzato solo un core. Inoltre, il kernel di RHEL6 sembra funzionare bene. Ho il sospetto che ci siano alcune patch usate per far funzionare le cose. L'uso del file di configurazione del kernel da RHEL6 e la creazione di un kernel più recente comporta gli stessi problemi. Sulla macchina Xeon, le cose sono migliorate disabilitando completamente Hyperthreading. La macchina ora si avvia correttamente almeno 4 su 5 volte. E se si avvia, le cose multicore funzionano bene. Tuttavia, mi chiedo cosa fare della macchina AMD.

Quindi per riassumere:

  1. Il kernel 3.6 - 3.11 di Gentoo non avvierà in modo affidabile quelle macchine a meno che non si riduca la quantità di core (ad es. Tramite nolapic).
  2. Il kernel RHEL6 (che è 2.6.32) si avvia bene.
  3. La configurazione del kernel RH utilizzata per compilare un kernel 3.x non produrrà un kernel funzionante.
  4. Non specifico per la distribuzione (a parte il kernel utilizzato).
  5. Queste tracce dello stack sono state stampate ogni minuto o giù di lì. Il kernel sembra essere bloccato in un ciclo infinito.

Tuttavia, è necessario un kernel recente per vari motivi.

Quindi la domanda è:

  1. Cosa fa il kernel RHEL6, cosa non fanno i kernel vanilla o gentoo?
  2. Esiste un'opzione di avvio che potrebbe portare a un avvio affidabile con tutti i core abilitati?

Meglio, Adam

Risposte:


0

Mi sono reso conto che il kernel del disco di installazione di Gentoo funziona bene. Costruire un kernel usando la sua configurazione risolve il problema. Tuttavia, non so ancora quale opzione abbia causato il problema in primo luogo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.