IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> SPADE(GauGAN)代码运行方法 -> 正文阅读

[人工智能]SPADE(GauGAN)代码运行方法

写在前面

SPADE作为目前Label to Image的守门员,非常值得学习,前几天复现了一下他的模型现在来分享一下运行方法。

为什么Pix2PixHD和SPADE都不用RGB作为输入

可以参考这篇博客https://editor.csdn.net/md/?articleId=123459193
其实这是为了把单通道的语义图label进行one-hot编码再给生成器
在这里插入图片描述

如何运行SPADE

我这里以512 * 512 大小的图片为例子
(1)我偏要用RGB图片作为输入
SPADE不能像Pix2PixHD那样使用参数--label_nc 0直接将RGB送给网络,但是我之前试了一下把--label_nc的参数设置255然后加上--contain_dontcare_label是可以运行的。参考了https://github.com/NVlabs/SPADE/issues/137

python train.py --name 名字 --dataset_mode custom --load_size 512 --crop_size 512 --display_winsize 512 --label_nc 255 --contain_dontcare_label --label_dir 路径/train_label --image_dir 路径/train_img  --no_instance

(2)只有label作为输入

python train.py --name 名字 --dataset_mode custom --load_size 512 --crop_size 512 --display_winsize 512 --label_nc 类别数 --label_dir 路径/train_label --image_dir 路径/train_img  --no_instance

(3)label和intance作为输入
--no_instance改为--instance_dir即可

python train.py --name 名字 --dataset_mode custom --load_size 512 --crop_size 512 --display_winsize 512 --label_nc 类别数 --label_dir 路径/train_label --image_dir 路径/train_img  --instance_dir 路径/train_inst

(4)如果输入图片的宽高不相等
例如我这里图片是720 * 576
这先计算720/576 = 1.25,然后把这个1.25作为 --aspect_ratio的参数

python train.py --name 名字 --dataset_mode custom --preprocess_mode none --load_size 720  --crop_size 720 --display_winsize 720  --aspect_ratio 1.25  --label_nc 类别数 --label_dir 路径/train_label --image_dir 路径/train_img --instance_dir 路径/train_inst

可能遇到的问题

如果训练效果可以,而测试效果如下这种很模糊,就把test.py里面的model.eval()注释掉就行。参考了https://github.com/NVlabs/SPADE/issues/96

写在后面

这是我总结的GAN相关论文的解析。希望本文对大家学习SPADE有所帮助。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-09 18:22:35  更:2022-04-09 18:26:51 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 10:48:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码