IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> GAN生成对抗网络10-2 Conditional GAN -> 正文阅读

[人工智能]GAN生成对抗网络10-2 Conditional GAN

一、Conditional GAN
之前讲到的GAN是随机输入一个向量,会产生一张图片。
conditional GAN讲的是,可以输入一行文字,产生对应文字的图片,即可以控制输出的结果。
在这里插入图片描述
比如我们要train一个模型,输入文字,会输出对应图片。
用传统的方法来train,即上图,将文字输入一个神经网络,输出一副图像,使得与真实图像像素之间距离足够近。那么这样的模型可能会输入多张同类图片的平均,比如火车有很多张, 朝前的火车,朝后的火车,生成这样的图片都是正确的,但是生成它们的平均就有问题了,生成的图片是模糊的。
因此要用到GAN的技术
在这里插入图片描述
在这里插入图片描述
首先将要train的文字c和一个正态分布向量z输入G,会生成一张图片,然后将该图片和c输入D,得到一个scalar,该scalar会同时考虑条件(文字),也会考虑生成图片的质量。
如果只把x送入D,而不考虑c,比如c跟汽车有关,而G生成了一张特别清晰的猫,可能D会给x打高分,这显然是不合适的。
在这里插入图片描述
上图中下面两种情况都会给0分。
在这里插入图片描述
上图为D和G的训练过程。
在这里插入图片描述
上图中有两种常用的discriminator,但是好多文献似乎都用下面这种,这种似乎更有道理。它会输出两个值,一个代表x是生成的还是真实的,另一个代表c和x匹配的程度。
上图中第一张图似乎没有说明为什么给低分。

二、stack GAN
在这里插入图片描述
stack GAN的核心思想是先生成小张的图,再产生大张的图。
在这里插入图片描述
image-image主要用于黑白图转彩色图,或者白天转夜晚等等。
在这里插入图片描述
使用传统的监督学习方法来训练,可能出现的问题之前了解到过,可能会使得到的图片不清晰。
在这里插入图片描述
使用GAN生成的图像左上角同样有一些问题。
在这里插入图片描述
应该使得G生成的图片与真实图片足够接近,即把GAN和close结合起来,生成图片的效果是很好的。
在这里插入图片描述
实际上,在image-to-image问题中,使用的discriminator不是左图中将整张图片放进去的,而是右边,一块一块的送到discriminator中。因为直接把左图整张图片放进去,会使得参数过多,可能会过拟合或者训练困难。
所以块的大小作为一个超参数,是需要调整的。

patch GAN不仅用于image-to-image问题中
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-06 11:07:54  更:2021-09-06 11:12:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 19:40:07-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码