CUDA版本的导致的tensorflow运行异常
CUDA11.1+cudnn8.0.5导致的tensorflow运行-1073741571 (0xC00000FD)错误
最近想用一下unet++框架,电脑是RTX6000显卡,查看官网之后下载了CUDA11.1+CUDNN8.0.5版本,然后下载了tensorflow-gpu2.4.0,keras为2.6.0版本,然后我已经写好了测试代码,运行始终报错-1073741571 (0xC00000FD) 我一直以为是我写的代码有问题,我就在GitHub上找了一份unet模型代码,结果还是出现这个错误,但GitHub上有人说了代码没有问题,百思不得其解,我查了这个错误是栈溢出,需要将局部变量声明为全局变量,但是我跟踪了错误发现这句话是在tensorflow里面model.fit()函数里面抛出来的,这让我怎么改,我总不能修改人家的源代码吧 后来我就在另一台电脑上配置了环境,由于没有安装cuda,安装的时cpu版本的tensorflow2.4.1,很奇怪就能正常运行了,我就很蒙蔽,难道时tensorflow版本不对吗,然后我在conda里面新配置了一个python环境,安装的包完全和另一台电脑一模一样,居然还不行,还是这个错误,我很疑惑为什么会这样,然后我去搜了很多网站,然后找到了这篇文章 https://stackoverflow.com/questions/67565119/process-finished-with-exit-code-1073741571-0xc00000fdwhen-training-cnn-in-k 这篇文章的问题和我的基本一致,而且也是装的cuda11.1,然后我在想是不是cuda的问题,毕竟两台电脑只有是否安装cuda这一个差别,但安装cuda和cudnn很麻烦,我就想在代码里面禁用掉cuda试一下,然后我在代码里面添加了禁用代码
神奇的事情发生了,程序可以正常跑了 因此,可以断定一定时cuda的问题,但是不是版本的问题我还不太确定,我准备明天卸载cuda11.1安装cuda11.0试一下能否成功。 这件事情折磨了我四五天了,马上面临大论文开题,被这个问题困扰的很难受。 2021.10.1
|