引言
笔者学校服务器的系统是Ubuntu 16.04 ,显卡GeForce RTX 2080Ti。 想将cuda升级到11.3,以及一系列的cudnn+驱动的升级
1. 驱动升级
1.1 找到合适自己的版本 1.2 找到对应的版本,下载安装包: 如果和笔者需要的版本一致的这里附上下载链接 链接:https://pan.baidu.com/s/1yStk0RVw0PLW7jmqqSkPbQ 提取码:b2c4 可以看到选定版本支持服务器的配置
接下来就开始在服务器上安装驱动
1.3 卸载现有驱动,重新安装
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
直到下面的命令不输出任何内容,则卸载成功
sudo dpkg --list | grep nvidia-*
执行安装命令
sudo bash NVIDIA-Linux-x86_64-470.57.02.run -no-opengl-files -no-x-check
其中添加-no-opengl-files -no-x-check 是为了解决如下问题 网上找了很多方法,比如禁用指令sudo service lightdm stop ,安装后在启用sudo service lightdm start ,都未能解决上述问题。所以可以直接尝试上述的方法。
接下来开始继续安装(笔者只留下部分截图,没有截图的用文字描述):
- 1.The distribution-provided pre-install script failed! Are you sure you want to continue?
选择 yes 继续 - 2.Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?
选择 No 继续 - 3.Nvidia’s 32-bit compatibility libraries?
选择 No 继续
- Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择Yes 继续
安装完毕,在终端输入指令显示如下
nvidia-smi
2. CUDA升级
目前官网已经升级到cuda11.4,但是没有Ubuntu16.04的系统,因此找到之前发布的版本: 选择匹配的版本
执行官网的安装指令(也可以选择其他两种方式进行安装)
wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
sudo sh cuda_11.3.1_465.19.01_linux.run
- 1.终端显示“Do you accept the previously read EULA?”
输入accept - 关键一步!!!终端显示“Install NVIDIA Accelerated Graphics Driver for
Linux-x86_64 384.81?”一定要输入no!!!!! - 一路
yes 最终在终端显示如下,则说明安装成功: 安装完成后可在 /usr/local/ 下看到安装好的cuda
cd /usr/local/
ls
3. cudnn
一定要与上面的CUDA进行匹配,cudnn的下载是需要注册登录的。 进入官网,选择指定的版本。 下载之后进入压缩包所在文件夹,执行解压指令:
tar zxvf cudnn-11.3-linux-x64-v8.2.1.32.tgz
在路径中生成cuda文件夹,然后复制 lib64 和 include 文件夹到 /usr/local/cuda-11.3,命令如下:
sudo cp cuda/include/cudnn.h /usr/local/cuda-11.3/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.3/lib64
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn.h /usr/local/cuda-11.3/lib64/libcudnn*
nvcc -V
终端显示如下:
|