?配置pytorch 环境用于深度学习
💻Ubuntu20.04 安装显卡驱动
显卡型号是GM200[GeForce GTX TITAN X] 网上搜索了许多教程,本人尝试了最简单的方法: 按下win可以唤出 Software & Updates 管理界面,然后选择“Addtional Drivers”,本人选择第一个选择; 安装结束了,在终端测试,是否安装成功; 若显示内容,表示驱动安装成功。
nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.47.03 Driver Version: 510.47.03 CUDA Version: 11.6 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:03:00.0 On | N/A |
| 22% 45C P8 22W / 250W | 262MiB / 12288MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1157 G /usr/lib/xorg/Xorg 78MiB |
| 0 N/A N/A 1833 G /usr/bin/gnome-shell 84MiB |
| 0 N/A N/A 3157 G ...644175923361352850,131072 93MiB |
+-----------------------------------------------------------------------------+
💻Ubuntu20.04 安装CUDA和cuDNN
😍安装CUDA
请认准官网版本CUDA11.2
1. runfile 本地安装
运行.run文件,进入协议说明: 错误说明:安装cuda的时候提示有多个显卡驱动:Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing. ?将命令行路径切换到安装文件所在目录,输入sudo sh cuda_11.2.0_460.27.04_linux.run ,输入密码进行安装。 ?安装过程中会有提示,需要输入accept,去掉Driver 选项,继续选择Install .安完会有driver未安装提示。
所以Driver就不要了,除了第二个,其他的都不要。(括号里面的叉号是选择的意思,回车进行选择)
Do you accept the above EULA? (accept/decline/quit):
│ accept
│─────────────────────────────────────────────────────
│ CUDA Installer
│ - [ ] Driver
│ [ ] 418.39
│ + [X] CUDA Toolkit 11.2
│ [ ] CUDA Samples 11.2
│ [ ] CUDA Demo Suite 10.2
│ [ ] CUDA Documentation 10.2
│ Options
│ Install
————————————————
──────────────────────────────────────────────────────────────────────────────┐
│ A symlink already exists at /usr/local/cuda. Update to this installation? │
│ Yes
│ No
————————————————
2. 添加环境变量
这一步必不可少。 终端输入命令:vim ~/.profile 按i进入编辑模式,输入:
export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
:wq!保存文件并退出。 重新执行文件:
source ~/.profile
nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Nov_30_19:08:53_PST_2020
Cuda compilation tools, release 11.2, V11.2.67
Build cuda_11.2.r11.2/compiler.29373293_0
😍安装cudnn
🔐采用tar方式安装
1.下载tgz文件地址
自己找cudnn官方下载地址
2. 解压tgz文件
tar -zxvf cudnn-11.2-linux-x64-v8.1.1.33.tgz
cd cuda
3. 进行拷贝操作
$ sudo cp cuda/include/cudnn.h /usr/local/cuda-10.2/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
4. 查看cudnn版本
$ cat /usr/local/cuda-10.2/include/cudnn.h | grep CUDNN_MAJOR -A 2
以上命令出现问题:cat: /usr/local/cuda/include/cudnn_version.h: 没有那个文件或目录
关于cudnn版本的查看,大部分教程给的操作都是 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 但是新一点的cudnn都无法再通过这条指令查看版本号了 这是因为,新一些的cudnn版本信息都写在在cudnn_version.h而不是cudnn.h
解决此问题:
$ sudo cp cuda/include/cudnn_version.h /usr/local/cuda/include
$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
--
🔐采用deb方式安装
1.选择下载地址
cudnn官方下载地址
2. 安装方式选择(deb)
- tar方式: 直接下载 cuDNN Library for Linux
- deb方式: 需要下载 runtime 、developer 和 Samples
推荐使用deb方式安装:使用tar方式安装没有cudnn_doc_v7文件,无法验证是否安装成功;
3. 将下载的三个文件copy至 home/your_username目录下
4. 执行命令安装3个库文件(先runtime,再developer,最后samples)
sudo gdebi libcudnn8_8.1.1.33-1+cuda11.2_amd64.deb
sudo gdebi libcudnn8-dev_8.1.1.33-1+cuda11.2_amd64.deb
sudo gdebi libcudnn8-samples_8.1.1.33-1+cuda11.2_amd64.deb
5.测试cuDNN是否安装成功
1)复制cuDNN samples到home目录下
$ cp -r /usr/src/cudnn_samples_v7 /$HOME
2) 进入home目录
$ cd $HOME/cudnn_samples_v7/mnistCUDNN/
3) 编译mnistCUDNN
$ sudo make clean
$ sudo make
4)运行mnistCUDNN
$ sudo ./mnistCUDNN
|