NVIDIA-SMI non è riuscita perché non è in grado di comunicare con il driver NVIDIA. Assicurarsi che il driver NVIDIA più recente sia installato e in esecuzione


23

Ho appena installato CUDA su un notebook come questo:

sudo apt-get install cuda

Come detto qui .

La compilation funziona bene ma quando provo a eseguire ho riscontrato il seguente problema: Errore CUDA in file.cu:128 code = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))"

La mia versione di nvcc:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Informazioni sulla scheda grafica:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Ho anche installato VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. A seguito di ciò .

Quando provo a eseguire qualcosa su Bumblebee ho capito: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

driver nvidia non funzionante.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Sembra che la versione 375 di NVIDIA sia installata ma non riesco a farlo funzionare.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

E alcune informazioni sul driver.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Penso che possa esserci qualche problema con la versione del driver:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Cosa mi sto perdendo?


come si installano i driver?
Charlie Parker,

Si è verificato lo stesso errore e nessuna delle risposte ha funzionato. Che cosa ha fatto il lavoro era un semplice: $ reboot now.
Darthbhyrava,

Risposte:


14

Se nvidia-sminon sei riuscito a comunicare ma hai installato il driver così tante volte, controlla prime-select.

  1. Esegui prime-select queryper ottenere tutte le opzioni possibili. Dovresti vedere almeno nvidia | intel.
  2. Scegli prime-select nvidia.
  3. Se dice nvidia is already selected, selezionane uno diverso, ad es. prime-select intel, Quindi torna a NVIDIAprime-select nvidia
  4. Riavvia e controlla nvidia-smi.

Mi ha aiutato. Grazie!
Yaroslav Schubert,

oh, prime-select querynon ho nemmeno elencato le informazioni, credo di avere 2 problemi ora ...
Inspi,

11

Potresti voler installare cuda toolkit. Utilizzando il seguente comando per installarlo.

sudo apt install nvidia-cuda-toolkit

Al termine dell'installazione, riavviare la macchina. nvidia-smidovrebbe funzionare.


per me va bene !!
x0v

Questo funziona per me
Sundeep,

6
Qui non ha funzionato
Bill Kotsias il

1
non farlo se hai cuda> = 10. Eseguirà il downgrade del tuo cuda a 9, che è attualmente disponibile su Ubuntu senza CUDA PPA.
Loretoparisi,

Facendo sudo apt-get purge nvidia-*prima, quindi la riga sopra ha risolto tutto ciò che riguardava CUDA per me, installato 430 driver con CUDA 10.1
Dinari

6

Ho disabilitato Secure Boot e ha funzionato abbastanza bene.

@ rod-smith ha risposto a un'altra domanda più specifica che spiega come farlo, fondamentalmente è una configurazione di installazione, ma ha anche scritto un buon articolo su come farlo qui .


2
Mi ha aiutato anche con il driver nvidia 390! Non avrei mai pensato che potesse essere a causa di un avvio sicuro, grazie :)
Samutamm,

La modalità UEFI con l'avvio protetto disattivato è già stata eseguita qui. =) Sembra che non funzioni per tutti, sfortunatamente.
Renan Willian Prado,

3

dal momento che non posso commentare la risposta di @ Rodolfo sopra (non abbastanza reputazione), sto aggiungendo una nuova risposta.

Sul mio computer ho dovuto configurare Secure Boot di conseguenza sul mio sistema operativo. Ho una scheda madre ASUS con Ubuntu 18.04 e ho provato a installare NVIDIA CUDA 10.1 Update 2 con il driver NVIDIA in pacchetto. Ho riscontrato lo stesso problema descritto sopra. A quanto pare, Secure Boot è stato impostato sulla modalità UEFI di Windows. La modifica in Altro sistema operativo lo ha riparato per me.


1
Grazie, ho dovuto disabilitare Secure Bootquale è stato riattivato automaticamente durante un aggiornamento automatico di Windows / BIOS !!! Ora nvidia funziona bene.
Bill Kotsias,

ti dispiacerebbe spiegare come hai cambiato l'avvio sicuro in Altro sistema operativo ?
Inspi,

1
@BillKotsias grazie! : D
Marek,

1

Per i futuri lettori:

Sono su un'istanza di macchina virtuale (Google Cloud Platform)

e sto seguendo questa idea per installare Cudae CuDNnsulla mia macchina virtuale.

Ho dovuto caricare manualmente la CuDNnparte. (Basta metterlo là fuori.)

Ora, arrivando all'errore:

Stavo avendo questo problema, ma un riavvio completo dell'istanza ha fatto il lavoro. E per riavvio completo intendo interrompere l'istanza e riaccenderla di nuovo.

Spero che questo aiuti qualcuno.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.