1.原因
只有一块amd显卡rx580,最近显卡又贵,不想换,想着便宜了买块新1660
2.准备
首先要准备ubuntu系统,去官网下载,百度搜ubuntu就是。 一开始我总是把ubuntu写成ubantu,没发现搜错。 之后准备安装双系统,这是按照他人的文章一步步作的。 后来重装了很多次,发现ubuntu安装分区时不需要那么麻烦,记住分‘/’,‘/home’,‘/snap’和启动项就行了。
3.ubuntu20系统问题
我第一次装完系统,发现software-center打不开,也无法使用软件安装,安装这篇文章的方法操作了下,至少能安装软件了 毕竟萌新,命令行安装还是麻烦 后来rocm卸载后在安装总是有依赖问题无法安装部分包,放弃了,再次重装系统,就没有software的问题了,玄学
4.安装rocm问题
安装官网文件 https://rocmdocs.amd.com/en/latest/Installation_Guide/Installation-Guide.html 一步步安装, 有发现一个问题,应该是两个
/opt/rocm/bin/rocminfo
/opt/rocm/opencl/bin/clinfo
这一部总是无法正常 显示gpu,根据百度翻译,确认两个问题 1.对/dev/kfd文件无权限, 搜索permission denied查到文章 ubuntu下使用filezilla上传文件权限问题(open for write: permission denied). 使用
sudo chmod 777 /dev/kfd
获取权限
另外需要将用户加入render组 好多安装rocm都没有提到这个问题,一般都加入video组就下一步了
加入render组后可以正常显示gpu信息了
5.安装tensorflow-rocm
至今没明白一个问题 tensorflow 是cpu版本 tensorflow-gpu是nivda版本 tensorflow-rocm是amd显卡版本是吗?
这一部依旧安装官方文档:Tensorflow安装.
现在又遇到一个问题,系统中python3 可以调用tensorflow,但pycharm无tensorflow,一会重启试一下。 测试tensorflow能否使用gpu;
import tensorflow as tf
tf.config.list_physical_devices('GPU')
结果
2021-04-10 14:10:07.680782: I tensorflow/compiler/jit/xla_cpu_device.cc:41] Not creating XLA devices, tf_xla_enable_xla_devices not set
2021-04-10 14:10:07.681037: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libamdhip64.so
2021-04-10 14:10:07.725922: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1734] Found device 0 with properties:
pciBusID: 0000:29:00.0 name: Ellesmere [Radeon RX 470/480/570/570X/580/580X/590] ROCm AMDGPU Arch: gfx803
coreClock: 1.34GHz coreCount: 36 deviceMemorySize: 8.00GiB deviceMemoryBandwidth: 119.21GiB/s
2021-04-10 14:10:07.728730: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library librocblas.so
2021-04-10 14:10:07.729808: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libMIOpen.so
2021-04-10 14:10:07.744546: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libhipfft.so
"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"
已放弃 (核心已转储)
已放弃此方法,以后再看看吧 重装系统后又遇到
后来又遇到rocm支持5600XT等显卡,RX580需安装之前的rocm版本,我就放弃了,真麻烦,早知道直接nvdia 万岁
|