阅读排行

ubuntu上安装NVIDIA驱动、CUDA、CUDNN

Ubuntu18.04环境下的安装:

主要参考下面这个博客：

https://blog.csdn.net/u010801439/article/details/80483036

https://blog.csdn.net/ice__snow/article/details/80144503

1.安装GPU英伟达驱动（针对ubuntu18.04）

step .1：首先，检测你的NVIDIA图形卡和推荐的驱动程序的模型。执行命令：

$ ubuntu-drivers devices

输出结果为：

== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001180sv00001458sd0000353Cbc03sc00i00
vendor   : NVIDIA Corporation
model    : GK104 [GeForce GTX 680]
driver   : nvidia-304 - distro non-free
driver   : nvidia-340 - distro non-free
driver   : nvidia-384 - distro non-free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin

== cpu-microcode.py ==
driver   : intel-microcode - distro free

从中可以看到，这里有一个设备是GTX 680 ，对应的驱动是NVIDIA -304,340,384 ，而推荐是安装384版本的驱动。

step.2，安装驱动

你可以选择，安装所有推荐的驱动，如下命令

$ sudo ubuntu-drivers autoinstall

你也可以选择，只安装其中一个驱动，命令如下

$ sudo apt install nvidia-340

OK 驱动安装完成，重新启动

4.安装CUDA（针对18.04）

安装CUDA 这里需要注意;

咱们需要根据cuDNN 来选择，如图，首先，cuda只能支持17.04,16.04的ubuntu 下载安装，但，实际上，有点类似于word一样（高版本word能打开低版本的word文件 .）18.04版本的系统，能够安装16.04版本对应的CUDA。

技术分享图片

目前cuda 最高版本为9.2，且只支持 16.04,17.04 这两个系统，而且，我们安装完CUDA 之后还需要安装cuDNN。

那么cuDNN 的版本又有什么选择呢，如下

技术分享图片

首先，根据cuDNN 的版本，目前，较为完善的，是cuDNN v7.0.5 ,其适用于 CUDA 9.1 版本，所以，咱们在选择安装cuda的时候，选择 CUDA 9.1。下载地址

技术分享图片

按下图进行选择

技术分享图片

对应的有一下四个文件，需要统统下载，第一个是主文件，后3个相当于补丁。

技术分享图片

开始安装：

step .1 GCC 降级

由于CUDA 9.0仅支持GCC 6.0及以下版本，而Ubuntu 18.04预装GCC版本为7.3，

故手动进行降级：

step .1 GCC 降级

由于CUDA 9.0仅支持GCC 6.0及以下版本，而Ubuntu 18.04预装GCC版本为7.3，

故手动进行降级：

sudo apt-get install gcc-4.8 
sudo apt-get install g++-4.8

装完后进入到/usr/bin目录下

  $ls -l gcc*

会显示以下结果

lrwxrwxrwx 1 root root 7th May 16 18:16 /usr/bin/gcc -> gcc-7.3

发现gcc链接到gcc-7.0, 需要将它改为链接到gcc-4.8，方法如下:

sudo mv gcc gcc.bak #备份 
sudo ln -s gcc-4.8 gcc #重新链接

同理，对g++也做同样的修改：

ls -l g++* 

lrwxrwxrwx 1 root root 7th May 15:17 g++ -> g++-7.3

需要将g++链接改为g++-4.8:

sudo mv g++ g++.bak 
sudo ln -s g++-4.8 g++

再查看gcc和g++版本号：

gcc -v 
g++ -v

均显示gcc version 4.8 ，说明gcc 4.8安装成功。

step. 2 安装cuda ,及其补丁

输入命令安装Base Installer：

sudo sh cuda_9.1.85_387.26_linux.run

需要注意的是，之前已经安装过显卡驱动程序，故在提问是否安装显卡驱动时选择no,其他 选择默认路径或者yes即可。

然后，继续执行以下操作安装3个 patch ：

sudo sh cuda_9.1.85.1_linux.run
sudo sh cuda_9.1.85.2_linux.run
sudo sh cuda_9.1.85.3_linux.run

安装完毕之后，将以下两条加入.barshrc文件中.

export PATH=/usr/local/cuda-9.1/bin${PATH:+:$PATH}}      #注意，根据自己的版本，修改cuda-9.2/9.0...
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} #注意，根据自己的版本，修改cuda-9.2/9.0...

OK ,那么，到这一步，cuda 就安装完成了

确认CUDA工作

找到samples，一般在home目录下

cd ~/NVIDIA_CUDA-9.1_Samples/
make

等待编译完成，

cd ./bin/x86_64/linux/release

使用deviceQuery 测试

$ ./deviceQuery

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 960M"
  CUDA Driver Version / Runtime Version          9.1 / 9.1
  CUDA Capability Major/Minor version number:    5.0
  Total amount of global memory:                 2004 MBytes (2101870592 bytes)
  ( 5) Multiprocessors, (128) CUDA Cores/MP:     640 CUDA Cores
  GPU Max Clock rate:                            1176 MHz (1.18 GHz)
  Memory Clock rate:                             2505 Mhz
  Memory Bus Width:                              128-bit
  L2 Cache Size:                                 2097152 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Supports Cooperative Kernel Launch:            No
  Supports MultiDevice Co-op Kernel Launch:      No
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.1, CUDA Runtime Version = 9.1, NumDevs = 1
Result = PASS

3.安装cuDNN（针对18.04）

cuDNN 的安装，就是将 cuDNN 包内的文件，拷贝到cuda文件夹中即可。

step.1按照第四点分析的内容，我们需要下载的cuDNN 版本为

技术分享图片

cuDNN v7.0.5 library for liunx，下载地址（需要注册才能进行下载）

下载完毕后，切到默认的Downloads文件夹，可以看到 cudnn-9.1-linux-x64-v7.tgz 压缩包

先解压，然后将其中的内容复制到CUDA安装文件夹里面.

step.2 复制cuDNN内容到cuda相关文件夹内

sudo cp cuda/include/cudnn.h    /usr/local/cuda/include      #注意，解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*

到此处，所以的安装就完成。

接下来就可以安装相应的软件，如：anaconda,pycharm tensorflow 等。。。

Ubuntu16.04环境下的安装:

安装nvdia驱动和cuda:

主要参考了下面这个博客

https://blog.csdn.net/u010837794/article/details/63251725

下面是所有CUDA版本的网页链接

https://developer.nvidia.com/cuda-toolkit-archive

然后cd指令进入/usr/local/cuda/samples，执行下面的命令来build samples

sudo make all -j64

全部编译完成后，ｃｄ进

入/usr/local/cuda/samples/bin/x86_64/linux/release，运行deviceQuery

./deviceQuery

如果出现显卡信息，则驱动及显卡安装成功，结果如下：

技术分享图片

安装CUDNN：

把cudnn压缩包下载下来后，按照如下步骤安装即可：

1、删除原来的cudnn系统路径下的一些文件

sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*   #这里*是通配符，libcudnn*指的是名字中带有libcudnn的所有文件

2、安装刚才解压的cudnn版本，在终端cd到刚解压的cuda文件夹，然后继续输入下面两个指令，这两个指令相当于把解压后的cuda文件夹下的一些文件拷到系统路径下面

sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib64/lib* /usr/local/cuda/lib64/       #这里*是通配符，lib*指的是名字中带有lib的所有文件

3、在系统路径下建立软链接（解压出来的lib64下面有3个so文件。分别是

libcudnn.so 和 libcudnn.so.5以及 libcudnn.so.5.1.3文件。并且这3个点so文件大小都一样。其实都是软连接！libcudnn.so链接到libcudnn.so.5，而

libcudnn.so.5.又链接到libcudnn.so.5.1.3。真正的文件只有

libcudnn.so.5.1.3）

cd /usr/local/cuda/lib64
sudo chmod +r libcudnn.so.5.1.10
sudo ln -sf libcudnn.so.5.1.10 libcudnn.so.5
sudo ln -sf libcudnn.so.5 libcudnn.so

接下来设置环境变量：

sudo gedit /etc/profile

在打开的文件中加入如下两句话

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存后，使环境变量立即生效，

source /etc/profile

文章来自：https://www.cnblogs.com/yqyouqing/p/9277691.html