NVIDIA-SMI a échoué car il n'a pas pu communiquer avec le pilote NVIDIA. Assurez-vous que le dernier pilote NVIDIA est installé et fonctionne

23

Je viens d'installer CUDA dans un ordinateur portable comme celui-ci:

sudo apt-get install cuda

Comme dit ici .

La compilation fonctionne très bien mais quand j'essaye de lancer j'ai le problème suivant: erreur CUDA à file.cu:128 code = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))"

Ma version nvcc:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Informations sur la carte graphique:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

J'ai également installé VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Suite à cela .

Quand j'essaye d'exécuter quelque chose sur Bumblebee, j'ai obtenu ceci: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

le pilote nvidia ne fonctionne pas.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Il semble que la version nvidia 375 soit installée mais je ne peux pas le faire fonctionner.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Et quelques informations sur le pilote.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Je pense que cela peut être un problème de version de pilote:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Qu'est-ce que je rate?

Rodolfo
la source
comment installez-vous les pilotes?
Charlie Parker
Face à la même erreur, et aucune des réponses n'a fonctionné. Qu'est-ce que le travail était simple: $ reboot now.
darthbhyrava le

Réponses:

14

Si vous nvidia-smine parvenez pas à communiquer mais que vous avez installé le pilote tant de fois, vérifiez prime-select.

  1. Exécutez prime-select querypour obtenir toutes les options possibles. Vous devriez voir au moins nvidia | intel.
  2. Choisissez prime-select nvidia.
  3. S'il est indiqué nvidia is already selected, sélectionnez-en un autre, par exemple prime-select intel, puis revenez à nvidiaprime-select nvidia
  4. Redémarrez et vérifiez nvidia-smi.
Phuc Le
la source
M'a aidé. Merci!
Yaroslav Schubert
euh oh, prime-select queryje n'ai même pas répertorié les informations, je suppose que j'ai maintenant 2 problèmes ...
Inspi
11

Vous souhaiterez peut-être installer la boîte à outils cuda. Utilisez la commande suivante pour l'installer.

sudo apt install nvidia-cuda-toolkit

Une fois l'installation terminée, redémarrez la machine. nvidia-smidevrait marcher.

Jack Chan
la source
travaille pour moi !!
x0v
Cela fonctionne pour moi
Sundeep
6
Cela n'a pas fonctionné ici
Bill Kotsias
2
ne faites pas cela si vous avez cuda> = 10. Il rétrogradera votre cuda à 9, qui est actuellement disponible sur ubuntu sans CUDA PPA.
loretoparisi
Faire sudo apt-get purge nvidia-*avant, puis la ligne ci-dessus a corrigé tout ce qui était lié à CUDA pour moi, installé 430 pilotes avec CUDA 10.1
Dinari
6

J'ai désactivé le démarrage sécurisé et cela a très bien fonctionné.

@ rod-smith a répondu à une autre question plus spécifique expliquant comment le faire, c'est essentiellement une configuration, mais il a également écrit un bon article sur la façon de le faire ici .

Rodolfo
la source
2
Cela m'a également aidé avec le pilote nvidia 390! Je n'ai jamais pensé que cela pourrait être dû à un démarrage sécurisé, merci :)
samutamm
Le mode UEFI avec Secure Boot désactivé est déjà fait ici. =) On dirait que cela ne fonctionne pas pour tout le monde, malheureusement.
Renan Willian Prado
3

comme je ne peux pas commenter la réponse de @ Rodolfo ci-dessus (pas assez de réputation), j'ajoute une nouvelle réponse.

Sur ma machine, j'ai dû configurer Secure Boot en fonction de mon système d'exploitation. J'ai une carte mère ASUS exécutant Ubuntu 18.04 et j'ai essayé d'installer NVIDIA CUDA 10.1 Update 2 avec le pilote NVIDIA fourni. J'ai rencontré le même problème que celui décrit ci-dessus. Il s'est avéré que le démarrage sécurisé était réglé sur le mode Windows UEFI. Le changer pour un autre OS l'a corrigé pour moi.

Markus
la source
1
Merci, j'ai dû désactiver Secure Bootce qui était automatiquement réactivé lors d'une mise à jour automatique de Windows / BIOS !!! Maintenant, nvidia fonctionne bien.
Bill Kotsias
Pourriez-vous expliquer comment vous avez changé le démarrage sécurisé en un autre système d'exploitation ?
Inspi
1
@BillKotsias merci! : D
Marek
1

Pour les futurs lecteurs:

Je suis sur une instance de machine virtuelle (Google Cloud Platform)

et je suis ce principe pour installer Cudaet CuDNnsur ma VM.

J'ai dû télécharger manuellement la CuDNnpièce. (Juste le mettre là-bas.)

Maintenant, arrivons à l'erreur:

J'avais ce problème mais un redémarrage complet de l'instance a fait le travail. Et par redémarrage complet, je veux dire arrêter l'instance et la réactiver.

J'espère que ça aidera quelqu'un.

Pramesh Bajracharya
la source