Ubuntu Box con più schede grafiche NVIDIA


3

Di recente ho acquistato una confezione da System76 con più GPU: una Quadro M6000 e due Tesla K40.

Quando lo faccio lspci | grep -i nvidiadice

05:00.0 VGA compatible controller: NVIDIA Corporation Device 17f0 (rev a1)
05:00.1 Audio device: NVIDIA Corporation Device 0fb0 (rev a1)
06:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)
09:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)

Quindi, sono .. Ma quando lo faccio nvidia-smi -Lmostra solo

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)

e, ls -l /dev/nvidia*spettacoli

crw-rw-rw- 1 root root 195,   0 Aug  9 03:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Aug  9 03:29 /dev/nvidiactl
crw-rw-rw- 1 root root 248,   0 Aug 12 16:19 /dev/nvidia-uvm

Non posso esserne sicuro, ma /dev/nvidia0suppongo sia il Quadro M6000, e forse il fatto che non ci sia un /dev/nvidia1o un /dev/nvidia2, è un altro sintomo (o forse la causa) della scatola che non vede i Tesla K40 .. Inoltre , i miei programmi di test che chiamano cudaGetDeviceCount , producono solo una GPU ..

Sto eseguendo Ubuntu 14.04.3 e ho installato cuda_7.0.28_linux.run(e installato i driver NVIDIA tramite quel file di esecuzione).

Perché le altre carte sono inaccessibili? Come posso renderli accessibili?


Ho avuto così tanti problemi nel tentativo di installare più schede Nvidia su Ubuntu che ho rinunciato. Meglio consultare direttamente il supporto di Nvidia: mi piacerebbe il GPU Computing, in realtà sono bravi ad aiutarti, ma Linux non è il loro forte

Risposte:


2

Tutto apposto! txbob sui forum nvidia di devtalk mi ha dato abbastanza indicazioni per arrivare alla soluzione.

Quindi, in sostanza, nouveau stava interferendo con i driver nvidia, e anche se ho visto un disable-nouveaufile /etc/modprobe.d, non aveva ancora avuto effetto, perché non ho rifatto il initramfs...

Quindi, per farlo, dovevo farlo

rm -f /boot/initrd*
update-initramfs -c -k all
update-grub2

successivamente, nvidia-smi -Lrendimenti correnti

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)
GPU 1: Tesla K40c (UUID: GPU-e992022a-724f-8f47-e08f-a954053020e6)
GPU 2: Tesla K40c (UUID: GPU-4d14695e-3e43-bf43-a3e3-91190f696d39)

Quindi, tutto bene ora! Spero che questo possa aiutare qualcun altro!


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.