开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【深度学习】生成对抗网络GAN｜GAN、WGAN、WGAN-UP、CGAN、CycleGAN、DCGAN -> 正文阅读

[人工智能]【深度学习】生成对抗网络GAN｜GAN、WGAN、WGAN-UP、CGAN、CycleGAN、DCGAN

论文连接：必读的10篇关于GAN的论文

方法	通俗含义
对抗学习	找对手互怼	GAN
自监督学习	自己找标签学习	GAN、word2vec
弱监督学习	学校拧螺丝、工作造火箭	CAM（可解释性分析）
半监督学习	标签不够多、不够难、不够准
知识蒸馏	找老师教我学习
多模态学习	调动各类感官学习
迁移学习	举一反三学习	fine-tuning
集成学习	三个臭皮匠学习
联邦学习	用别人的学习资料学习	解决隐私计算问题

生成对抗网络理论基础：GAN、WGAN、Improved GAN。

非条件GAN

StyleGAN

GAN

DCGAN

PGGAN

条件GAN

LoGAN

WGAN

CGAN

ACGAN

ProjGAN

SNGAN

SAGAN

BigGAN

Image Translation

StarGAN-v1-v2

ImprovedGAN

pix2pix

CycleGAN

UGATIT

一、Typical GAN

在这里插入图片描述
框架结构：
生成对抗网络由两个部分组成：生成器（Generator）和判别器（Distriminator）

生成器：生成一个真实数据类似的数据分布（伪造数据）
判别器：判断生成器生成的图片是真的还是假的（鉴别数据），类似于一个二分类器
在生成对抗模型框架中，有两个模型一个是生成模型G，一个判别模型D。生成器G根据隐含信息来随机生成观测数据，判别器D判别生成器生成的数据是真还是假。当判别器D判断生成器G生成了假数据后给生成器G一个惩罚，这导致生成器G被迫向“不受到”判别器D惩罚的方向进化学习，二者就构成了一个动态的博弈过程，到最后生成器G会生成出一个判别器D无法判断的数据，二者达到了纳什均衡，因此得到了所需要的生成器模型G。

优化目标函数：

$\min_{G}\max_{D}V(D,G)=\mathbb{E}_{x\sim p_{data}}(x)[logD(x)]+ \mathbb{E}_{z\sim p_{z}}[log(1-D(G(z)))]$
其中，G表示生成器，D表示判别器，data,x为真实样本的眼本空间和真实样本，z表示输入的噪声。

判别器的输出为
生成器G：
生成器G是为了生成与真实数据相差较小的数据，因此其目的是最小化目标函数，在训练G时控制判别器D保持不变，优化函数为： $\min_{G}\mathbb{E}_{z\sim p_{z}}[log(1-D(G(z)))]$
若想使该函数最小， $D (G (z))) = 1$ 成立，意思为G希望判别器D将生成器生成的图片G(z)判别为真样本，骗过了判别器D。
判别器D：
在训练判别器D时，控制生成器G不变，更新D，优化函数为：
$\max_{D}V(D,G)=\mathbb{E}_{x\sim p_{data}}(x)[logD(x)]+ \mathbb{E}_{z\sim p_{z}}[log(1-D(G(z)))]$
若想使该函数最大，那么每一部分最大，由于必须保证判别器的输出在[0,1]之间。所以该函数最大， $D (x) = 1$ , $D (G (z))) = 0$ 。判别器希望判断出真实样本并且将生成的数据判别为假样本。
既然生成器的目标是最小化生成数据和真实数据之间的距离那么鉴别器就是最大化两者的距离，针对如何计算生成数据和真实数据之间的距离，引入了JS散度的概念来计算，事实上也可以看成是交叉熵乘一个负号。

二、WGAN

GAN,WGAN,WGAN-GP 通俗易懂的原理解释这个博客写的很好，规避了复杂的数学公式，简单明了地介绍了三者之间的关系，值得学习。

解决了typcial GAN因为JS度量导致生成器G无法学习的问题。
使用JS的缺点： 生成数据跟真实数据之间，使用JS散度去度量这两个数据之间的距离，但是无论这两个距离是什么情况，只要不重叠，JS散度一直都是Log2，只有当这两个数据重合的时候，JS散度才为0。很显然当这两个分布不重叠的时候，二分类正确率却一直为100%，没有办法区别一个好的程度这样一个过程，所以这样就显得没有实际意义。

使用推土距离Wasserstein distance代替JS散度： 使得生成数据和真实数据无交集的时候不会出现像JS一样处于恒等值的方向，使得生成器会一直向好的地方发展而不是之间停止。

在这里插入图片描述
其中对于判别器，WGAN作出了限制即必须满足1-lipschitz的条件，该条件的目的是为了让生成数据和真实数据之间不会相差太大使得推算出来的推土机距离不会过大否则无任何意义，而WGAN中让判别器满足1-lipschitz的条件的方法其实相对较为简单如下图所示：
在这里插入图片描述