IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Ubuntu 20.04 系统下(子系统)深度学习环境配置(Pytorch + GPU) -> 正文阅读

[人工智能]Ubuntu 20.04 系统下(子系统)深度学习环境配置(Pytorch + GPU)

Ubuntu 20.04 系统下(子系统)深度学习环境配置(Pytorch + GPU)

🍀 前序(避坑)

上回我在虚拟机中装的Ubuntu,并安装Nvidia驱动,输入命令ubuntu-drivers devices,可以看到无推荐安装的驱动,如下所示:

在这里插入图片描述
最后使用sudo apt install nvidia-driver-510安装,后来安装cuda后,用nvcc -V检查,也证明确实安装成功了:

在这里插入图片描述
但始终不能解决这个问题:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

后来经过种种资料和事实证明:虚拟机中不支持安装Nvidia驱动于是我装了 Ubuntu 子系统进行实验,终于成功,希望大家避坑


🍀 安装 Nvidia 驱动

可以看到,出现了很多推荐的驱动,这才正常:

在这里插入图片描述
同意安装推荐版本(510),在终端输入如下命令,即可自动安装

sudo ubuntu-drivers autoinstall 

安装成功,如图所示:NVIDIA-SMI 510.47.03

在这里插入图片描述


🍀 安装 CUDA 11.5

安装教训:

  1. 我之前安装的cuda11.6,直到安装cuDNN才发现没有对应的版本,这也提示我们要安装cuda前,先去看看cuDNN对应的cuda版本。大家如果是初次安装,可以跳过下面的卸载命令
  2. 不要安装版本不对应的cuDNN,我初次安装cuda11.6版本,而cuDNN最高支持11.5,我安装了,结果验证cuDNN不能使用,所以不要有侥幸心理
sudo /usr/local/cuda-11.6/bin/cuda-uninstaller
sudo rm -rf /usr/local/cuda-11.6/

输入命令进行安装:

wget https://developer.download.nvidia.com/compute/cuda/11.5.0/local_installers/cuda_11.5.0_495.29.05_linux.run
sudo sh cuda_11.5.0_495.29.05_linux.run

在这里插入图片描述
在这里插入图片描述

具体安装过程:
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述
环境变量:

打开文件,配置环境变量,然后用nvcc -V查看 cuda 信息,证明 cuda 安装成功

gedit ~/.bashrc
export PATH=/usr/local/cuda-11.5/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.5/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc

在这里插入图片描述
在这里插入图片描述


🍀 安装 cuDNN for CUDA 11.5

cuDNN是对CUDA的补充,需要Nvidia账号和密码,注册登录即可下载,本节中我找到CUDA11.5对应版本的cuDNN进行安装,参考了一篇不错的博客: Ubuntu 20.04安装CUDA 11.0、cuDNN 8.0.5、PyTorch 1.7.0

在这里插入图片描述
下载成功

在这里插入图片描述
解压上图黄色的压缩包到当前文件夹

tar zxvf cudnn-11.5-linux-x64-v8.3.0.98.tgz -C ./ 

解压后多了一个cuda目录

在这里插入图片描述

cuda目录下面有include和lib64两个子目录,将这两个目录下面的所有文件拷贝到CUDA 11.6的安装路径对应的目录下面即可,作为对cuda的补充

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

完成后,删除.tgz文件和cuda文件夹,已经没用了

更改usr/local/cuda/下的includelib64文件夹的权限,否则会出问题

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* 

附:常用的修改权限的指令

sudo chmod 600 ××× (只有所有者有读和写的权限)
sudo chmod 644 ××× (所有者有读和写的权限,组用户只有读的权限)
sudo chmod 700 ××× (只有所有者有读和写以及执行的权限)
sudo chmod 666 ××× (每个人都有读和写的权限)
sudo chmod 777 ××× (每个人都有读和写以及执行的权限)

在这里插入图片描述
安装其余三个Deb包

注意:这三个包的安装顺序不要乱

sudo dpkg -i libcudnn8_8.3.0.98-1+cuda11.5_amd64.deb
sudo dpkg -i libcudnn8-dev_8.3.0.98-1+cuda11.5_amd64.deb
sudo dpkg -i libcudnn8-samples_8.3.0.98-1+cuda11.5_amd64.deb 

安装第一个Deb包时候,弹出根目录空间剩余0,记得当时设置了25.5G,确实太小,于是我扩容了根目录后,重新进行安装三个包:

在这里插入图片描述
验证是否安装成功

cp -r /usr/src/cudnn_samples_v8/ ~
cd ~/cudnn_samples_v8/mnistCUDNN/
make clean && make
./mnistCUDNN

报以下编译错误 fatal error: FreeImage.h

在这里插入图片描述
尝试解决

sudo apt-get install libfreeimage3 libfreeimage-dev

无用,即使sudo apt-get update后再试这条命令:

在这里插入图片描述
找了半天,终于有一篇博客拯救我

  • 失败原因:各种系统资源安装包等、其挂载的服务器可能是国外的或者此时访问的人数过多导致连接超时后服务器连接失败,致使资源下载失败
  • 解决方案:可以把原来的cn.archive.ubuntu.com服务器地址更换成网易163的服务器源,能有效的提高各种资源的下载速度和安装速度

操作如下

1. 找到sources.list文件,用文本编辑器打开

在这里插入图片描述
2. 文件全选,替换为如下代码(我的系统是ubuntu 20.04,所以用focal,大家可以用lsb_release -a查看并相应替换代码中所有的focal,然后整体再替换sources.list)

在这里插入图片描述

deb http://mirrors.163.com/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.163.com/ubuntu/ focal-security main restricted universe multiverse
deb http://mirrors.163.com/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.163.com/ubuntu/ focal-proposed main restricted universe multiverse
deb http://mirrors.163.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.163.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.163.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.163.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.163.com/ubuntu/ focal-proposed main restricted universe multiverse
deb-src http://mirrors.163.com/ubuntu/ focal-backports main restricted universe multiverse

3. 之后sudo apt-get update一下,执行sudo apt-get install libfreeimage3 libfreeimage-dev不报任何错,至此,我们再验证cuDNN是否安装成功

在这里插入图片描述
4. 执行make clean && make,不报错,再次验证编译错误 fatal error: FreeImage.h已解决
在这里插入图片描述
5. 执行./mnistCUDNN,最后显示Test Passed!,激动到哭

在这里插入图片描述


🍀 安装 Pytorch

换源,首先打开文件:

gedit ~/.condarc

将下面代码进行替换:

channels:
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
show_channel_urls: true

在这里插入图片描述
刷新路径:

source ~/.bashrc

打开官网:
在这里插入图片描述
执行命令:conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch,输入yes,等待安装完成

在这里插入图片描述

🍀 验证 Pytorch + GPU 环境是否搭建成功

python3
import torch
import torchvision
print(torch.cuda.is_available())

输出True,代表环境配置成功

在这里插入图片描述


欢迎评论区纠错和讨论!希望自己走的弯路,能让大家避开,更多疑问联系我,QQ:743337163

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-03 16:13:20  更:2022-03-03 16:17:33 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 18:46:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码