起因
- nvidia-smi与nvcc --version版本不一致
原因参考https://blog.csdn.net/weixin_39518984/article/details/111406728 - 实验需要更高版本的cuda
tensorflow cuda cudnn版本对应参考 https://blog.csdn.net/weixin_45184581/article/details/124583991
卸载旧的cuda
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
去/usr/local/cuda-9.0文件夹下检查一下,一般来讲还有一些cudnn文件,把它删干净
sudo rm -rf /usr/local/cuda-9.0
安装新cuda
下载地址https://developer.nvidia.com/cuda-toolkit-archive 按提示的命令分别下载和安装 安装时:
不要安装驱动
修改环境变量
sudo gedit ~/.bashrc
把原来的内容改为
export PATH="/usr/local/cuda-11.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH"
保存退出执行
source ~/.bashrc
验证cuda
cd /usr/local/cuda-11.6
chmod 777 samples
cd samples
git clone https://gitee.com/liwuhaoooo/cuda-samples.git
下载完之后
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
安装成功
安装cudnn
下载地址https://developer.nvidia.com/zh-cn/cudnn 要先注册登录 下载后解压,进入解压后的文件夹
sudo cp include/cudnn.h /usr/local/cuda-11.6/include
sudo cp lib/libcudnn* /usr/local/cuda-11.6/lib64
sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*
|