IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 计算机视觉 Computer Vision Chaper14 图像生成 -> 正文阅读

[人工智能]计算机视觉 Computer Vision Chaper14 图像生成

概念介绍

生成模型

在这里插入图片描述
生成式模型,给一个概念,然后扩展它的细节。
判别模型例子:幼儿园老师给小朋友2张图片,让他们分辨猫和狗。
生成模型例子:老师告诉小朋友猫和狗的概念,让他们画出来。这个要求就更高了。
在这里插入图片描述
在这里插入图片描述

MLE

在这里插入图片描述
在这里插入图片描述

变分子编码器 VAE

在这里插入图片描述
绿色部分其实就是图像的压缩。保存了图像的大部分信息。
如果我们自己随便写一个向量来代替绿色训练出来的向量,那么生成的图片将没有任何语义特征。有人就想,如何给假定一个向量,然后可以输出图片呢?这就是自编吗器的由来。
在这里插入图片描述
z是高维的,每一维都符合高斯分布。也就是当我们可以生成一个符合的高斯分布,那么从高斯分布抽样出的样本,再decoder解码,就会是一张有语义特征的图片。
在这里插入图片描述
所以当我们要学习encoder时候,我们就要去学习隐变量,也就是去学习原来分布的参数(注意,这里是每一维的高斯参数,每一维是不同的高斯分布)。这就是机器学习的本质,用样本数据,去拟合原始数据的分布。
在这里插入图片描述
由上图,我们可以举个例子,在警察办案的时候,总是根据人物的特征描述,来画出嫌疑人的样貌。这里就是学习原始图片每一维度的高斯分布进行encoder,最后每一个维度都有一个框架,在这个框架里进行的VAE,最终decoder出来的图片,才是和原图差不多的。
在这里插入图片描述
这就通过VAE,增加了训练样本数据。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
相对熵是说P(X)和Q(X)差异有多大。如果他们一样,KL散度为0.
JS散度是KL的变体,是对称的。
在这里插入图片描述
在这里插入图片描述
z那里是reparameterization。就是在0~1分布抽样。

在这里插入图片描述

GAN 对抗生成网络

在这里插入图片描述
伪造的图片和真实图片分别放进去,让模型判断谁是真的,谁是假的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
判别器希望可以分清真假样本图片。但是生成器却希望它造出来的图片,判别器鉴别不出来。
在这里插入图片描述
那么如何让第2代生成器骗过第1代判别器呢?
将第2代的生成器和第1代的判别器连接到一个NN网络中,并且让第2代产生的图片在第1代判别器中,预测为1.
在这里插入图片描述
一开始第1代的判别器,可能判别第2代生成器的图片是能叛别出来的,比如0.13.但是由于我们给y设置为1,它的网络就会误认为分对了。这样,通过多次训练,第一代的判别器就无法分别出来了。这时,我们将训练好的第2代生成器生成的图片,当作第2代生成样本图片。
注意,判别器网络参数不能动,只能改变生成器网络参数。

在这里插入图片描述
这里为什么用log,是可以将0-1空间,映射到负无穷到0.这样目标函数的范围就大了,差异的凸显了。
关于纳什均衡,是博弈论的知识。所以GAN本质上就是一个零和博弈。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
最后蓝线平了,说明判别器最后已经无法判断生成的图片和真实的图片了,只能猜了。
在这里插入图片描述

常见改进GAN

DCGAN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以达到一些有趣的效果,给女士戴墨镜。GAN有很多有趣的玩法。
在这里插入图片描述
在这里插入图片描述

WGAN

在这里插入图片描述
在这里插入图片描述
不能让判别器很快的达到最优,这样训练不下去。得给生成器一个成长的空间。不然就会崩掉。
在这里插入图片描述
在这里插入图片描述
注意KL是因为不平衡,才采用的JS。所以他们两个有密切的关系。所以损失函数KL是正,JS是负,目标函数可以说是不明确,损失函数不稳定。也就没法学习了。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

SRGAN

在这里插入图片描述
LR低分辨率图像,HR高分辨率的图像。
SRGAN就是生成和原图一样的图片。
超分辨率的GAN。
在这里插入图片描述
k是kernel,n是特征图的数量。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-26 22:09:34  更:2021-12-26 22:13:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 23:36:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码