| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> LMC-Memory灰度图转RGB图踩坑指南 -> 正文阅读 |
|
[人工智能]LMC-Memory灰度图转RGB图踩坑指南 |
1.首先按照github上的issue,将model.py修改一下。Line15:
Line30:
Line100:
(其实就是把输入输出的通道数修改一下) 2.修改之后会报通道数不匹配问题,于是修改读文件夹的py文件一开始修改如下 但是仍然报通道数不匹配: (报的类似错误,只是expected to have 3 channels, but got 1 channels instead,但是我非常确定我放进去的图像是三通道的,所以继续修改代码) 检查之后发现应该将imread读到的数组修改一下,修改代码如下: Print出来的frame的shape是(3,128,128) (这一步其实是有问题的,后面会介绍) 3.不会继续报通道不匹配问题了,但是新的问题出现(忘记保存问题截图,大致意思是说channel数要么是1,要么是3,要么是4,这是最难的问题) 解决问题的关键就是数据格式,我的数据是[N, T, C, H, W](作者把数组扩到了五维,实际每一帧就是后面三个维度组成),但是一张正常的图片应该是[H, W, C],于是把test.py中需要输出的数据格式进行transpose,
(其实两行代码就可以替代,但是最开始没想到) Imwrite函数也进行修改 从
修改为:
修改完之后数据格式变为了[N, T, H, W, C],这样就是正常的格式,但是输出的图片很奇怪,虽然成功变为了三通道24位深度图片,但是得到的图片是乱的,得到的图如下: 4.猜测是dataloder的问题,重新定位到读数据集的代码也就是(2)中的地方,猜测是reshape的问题,查询之后发现果然是reshape,reshape会把数据打乱再reshape,所以得到的图片是错误的,于是不用reshape,改为用transpose
也是进行[C,H,W]转换为[H,W,C],但是transpose不会打乱,而是直接进行维度上的抓换。 再进行测试,发现输出的图是正常的。 The end. |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 20:26:00- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |