本文整理了笔者在windows系统下配置tensorflow2的GPU运行环境时遇到的一些问题。
安装NVIDIA驱动程序
要想使用GPU运行深度学习模型,首先要确保你的计算机上有独立显卡,并安装与你的显卡适配的NVIDIA驱动程序,显卡信息查看方式为“控制面板-小图标查看方式-设备管理器-显示适配器”,NVIDIA驱动程序可以上官网下载并安装。
安装CUDA
安装好驱动程序后还需要安装适配版本的CUDA,下载及安装方法参考这里。 具体来说,首先查看NVIDIA驱动程序版本。在桌面上右键选择NVIDA控制面板(如果没有该选项这说明尚未安装NVIDIA驱动程序或该计算机上没有GPU),打开后依次选择“菜单栏帮助-系统信息”,并弹出如下窗口: 红框中即为你安装的NVIDA控制面板版本。然后去官网中查看适配的CUDA版本(Table 3),最后从官网下载并安装该版本的CUDA,例如笔者安装的是CUDA 11.5,下载地址在这里。
创建环境
笔者创建了一个tensorflow的专用虚拟环境,当然你也可以直接使用base环境并跳过这一步,这个完全看个人需要。 使用命令行来创建环境。首先使用如下代码来查看现有环境:
conda info -e
创建一个新环境:
conda create -n tensorflow python=3.8
激活创建好的新环境:
conda activate tensorflow
配置环境
创建好后就可以开始配置tensorflow的环境了。首先使用命令行安装tensorflow:
pip install tensorflow
安装好后,笔者在python中使用tf.test.is_gpu_available() 来检验是否可以使用GPU,结果出现了如下bug:
Could not load dynamic library ‘cusolver64_11.dll‘; dlerror: cusolver64_11.dll not found
Could not load dynamic library ‘cudnn64_8.dll‘; dlerror: cudnn64_8.dll not found
在网上查了一下,只要将报错中提示缺失的两个组件安装上即可。
- 第一个是cusolver64_11.dll,下载及安装方法可以参考这里。
- 第二个是cuDNN,直接去官网下载即可,新用户需要先注册一个NVIDIA账号,注册好后就可以免费下载并安装了。详细安装方法可以参考这里。
安装好这两个组件后笔者就可以正常使用GPU来运行tensorflow了!
参考资料
[1] https://blog.csdn.net/qq_23013309/article/details/103965619 [2] https://blog.csdn.net/hungita/article/details/120150989 [3] https://blog.csdn.net/wilde123/article/details/116903346
|