| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 计算摄影——图像增强 -> 正文阅读 |
|
[人工智能]计算摄影——图像增强 |
? ? ? ? 这一部分主要梳理下图像增强相关的内容,图像增强指对拍摄后的照片进行后期的处理操作,包括亮度、对比度、清晰度、饱和度、色调等的调整。这里主要讲对比度和色调的增强。 传统方法
深度学习方法基于典型CNN网络的方法? ? ? ? 直接使用类似U-net结构的CNN模型,也可以直接学会图像里的很多全局和局部的基本图像增强操作,类似风格迁移、去雾、上色等。 ? ? ? ? 在典型网络的基础上,我们还可以增加一个美学评估的模型来评估输出的图像美学质量,最终网络的损失函数可以使用两个模块的融合,思路比较清晰,这里不再详细说明。 基于GAN模型的改进? ? ? ? 首先介绍一种pix2pix的方法,使用成对的数据进行训练,模型结构图下图: ????????网络分为三个部分:图像增强网络,判别网络,特征保持网络,其中resnet只是代表一种经典CNN结构,其结构可以被替换。 ????????在图像增强网络中,使用增强后的图像与真值图像pix2pix计算Lcolor,这是一个重建损失,可以使用mse损失,在具体计算时,可以将增强后的图像与真值图像都进行高斯模糊,这样可以去掉部分边缘细节纹理,保持整体图像的对比度和颜色,使得颜色在局部比较平均,还拥有了一定的局部平移不变性,有利于模型稳定的学习。 ? ? ? ? 在判别网络中,输入由增强后的图像与真值图像融合生成,融合的方式有多种,可以采用逐个像素加权求和的方式,也可以采用通道拼接的方式,最终输出一个二维的概率向量,损失函数为交叉熵损失,也被称为纹理损失,再具体计算时,可以将增强后的图像与真值图像都转为灰度图像,因为图像的纹理信息主要与灰度空间分布相关,这可以降低过拟合的风险。 ? ? ? ? 在特征保持网络中,可以使用VGG网络(也可以替换为其他网络)来对增强后的图像和真值图像提取高层特征,然后计算内容损失Lcontent,可以使用标准的欧氏距离,内容损失也被称为感知损失,其意义在于如果增强后的图像和真值图像非常接近,那么通过VGG提取的特征也应该接近,它用于对高层语义信息进行约束。 使用非成对数据进行学习????????CycleGAN的一个重要应用领域是Domain Adaptation(域迁移:可以通俗的理解为画风迁移),比如可以把一张普通的风景照变化成梵高化作,或者将游戏画面变化成真实世界画面等等。以下是原论文中给出的一些应用,它只需要两种域的数据,而不需要他们有严格对应关系,这使得CycleGAN的应用更为广泛: ????????CycleGAN的主要目的是实现Domain Adaptation,这里我们以风景照片和梵高画作为例,假设现在有两个数据集?X?和?Y?分别存放风景照片和梵高画作。我们希望训练出一个生成器?G?,它吃一个风景照,吐出一个梵高画作,即?G(x)=y′,x∈X?;同时,我们还希望训练出另一个生成器?F?,它吃一个梵高画作,吐出一个风景照,即?G(y)=x′,y∈Y?。为了达到这个目的,我们还需要训练两个判别器?DX和DY?,分别判断两个生成器生成图片的好坏:如果生成器产生的图片?y′?不像数据集?Y?里的图片?y?,此时判别器DY应给它低分(规定最低分为0),反之如果图片?y′?像数据集?Y?里的图片?y,则此时判别器DY应给他高分(规定最高分为1)。此外,判别器DY应该永远给真实图片?y?高分。对于判别器DX也是同理。整个CycleGAN的模型框架如下图所示: ????????在CycleGAN中,我们不仅想要生成器产生的图片y′跟数据集Y中的图片画风一样,我们还希望生成器产生的图片y′跟他的输入图片?x?内容一样(比如我们输入一张带房子的照片,我们希望产生梵高画风的房子图片,而不是其他内容的图片,比如向日葵、星夜等等,否则意义就不是很大了,为了做到这一点,论文作者提出了Cycle Consistency Loss,即将图片y′再放入生成器?F?中,产生的新图片?x′?和最开始的图片?x?尽可能的相似:因此,CycleGAN的Loss由两部分组成, 即?Loss=LossGAN+Losscycle
关于cycleGAN的详细内容,可以看下CycleGAN详细解读 - 知乎,讲的比较清楚。 ?基于参数预测的增强方法? ? ? ? 图像增强可以对应相机中的曝光调整、对比度调整、色调调整等操作,因此我们可以使用模型直接学习这几种操作的参数幅度,对这些决策结果,可以使用美学评估模型进行打分,作为惩罚项: ? ? ? ? 具体学习过程包括两个策略网络,一个判别网络。其中两个策略网络分别讲图像映射成某一类操作的概率和幅度,这三个网络可以都采用相同的结构。(在《深度学习之摄影图像处理》这一书中,还提到了一个价值网络,但是并没有说明其用途是什么,笔者认为该网络其实可以被省略……) ? ? ? ? 在判别网络中,可以增加平均亮度、对比度、饱和度等作为特征通道与输入图像拼接。 ? ? ? ? 在策略网络中,可以增加n个二值操作值作为特征通道与输入图像拼接,这n个二值操作值代表是否使用某一类操作,比如曝光调整、伽马变换、白平衡调整等 ? ?参考资料直方图均衡化的原理及实现_knowyourself1的博客-CSDN博客_直方图均衡化 关于Retinex理论的一些理解_睿~的博客-CSDN博客_retinex理论 书籍:《深度学习之摄影图像处理》 ???????? ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 23:31:18- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |