摘要
我们提出了一种用于单图像超分辨率(SR)的深度学习方法。 我们的方法直接学习低或高分辨率图像之间的端到端映射。 映射被表示为深度卷积神经网络(CNN),其将低分辨率图像作为输入和输出高分辨率。我们进一步表明,还可以将传统的稀疏编码的SR方法视为深卷积网络。 但与传统方法不同,这些方法单独处理每个组件,我们的方法都会共同优化所有层。 我们的深层卷积神经网络具有轻量级结构,但展示了最先进的恢复质量,并实现了实际在线使用的快速速度。 我们探索不同的网络结构和参数设置,以实现性能和速度之间的权衡。 此外,我们将网络扩展到同时应对三种颜色通道,并显示出更好的整体重建质量。
Abstract
We propose a deep learning method for single image hyperresolution (SR). Our method directly learns end-to-end mapping between low- or high resolution images. The mapping is represented as a deep convolutional neural network (CNN), which uses low resolution images as input and output high resolution. We further show that traditional sparsely encoded SR methods can also be regarded as deep convolutional networks. However, unlike traditional methods, these methods deal with each component separately, and our methods will jointly optimise all layers. Our deep convolutional neural network has a lightweight structure, but it shows the most advanced recovery quality and realises the fast speed of actual online use. We explore different network structures and parameter settings to realise the trade off between performance and speed. In addition, we have expanded the network to deal with three colour channels at the same time, and show a better overall reconstruction quality.
目录 摘要 2 1.前言及研究背景 4 1.1图像的超分辨率问题 4 1.2传统方法 4 1.3 本报告提出的方法 5 1.4 优越性 5 2.实验过程 5 2.1实验方法 5 使用深卷积网络进行图像的超级分辨率(SRCNN): 5 2.2 SRCNN的结构特性: 6 2.3论证稀疏编码表示在RSCNN中的可行性 7 2.4损失函数 8 3.实验结果 8 3.1调整参数 8 3.2评价指标: 9 3.3对颜色通道的实验结果: 9 4.实验结论 11
1.前言及研究背景
1.1图像的超分辨率问题
图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸。一般情况下,图像分辨率越高,图像中包含的细节就越多,信息量也越大。图像分辨率分为空间分辨率和时间分辨率。通常,分辨率被表示成每一个方向上的像素数量,例如64*64的二维图像。但分辨率的高低其实并不等同于像素数量的多少,例如一个通过插值放大了5倍的图像并不表示它包含的细节增加了多少。图像超分辨率重建关注的是恢复图像中丢失的细节,即高频信息。 在大量的电子图像应用领域,人们经常期望得到高分辨率(简称HR)图像。但由于设备、传感器等原因,我们得到的图像往往是低分辨率图像(LR)。因此,将LR映射到HR的函数空间非常大,学习一个好的解是非常困难的。而且低分辨率图像往往缺失图像超分辨率最需要的高频信息和纹理特征,却包含大量的低频信息来阻碍超分辨率重建,导致图像超分辨率是一个极具挑战性的任务。近年来,深度学习方法在计算机视觉领域大放异彩,同时也给图像超分辨率提供了新的解决方案。【1】增加空间分辨率最直接的解决方法就是通过传感器制造技术减少像素尺寸(例如增加每单元面积的像素数量);另外一个增加空间分辨率的方法是增加芯片的尺寸,从而增加图像的容量。因为很难提高大容量的偶合转换率,所以这种方法一般不认为是有效的,因此,引出了图像超分辨率技术。 针对深度卷积神经网络对特征信息利用不足的问题和基于像素损失的网络无法克服重建图像伪影和平滑的问题进行研究,对深度卷积神经网络的特定结构、网络模块、损失函数等进行分析,通过构建信息蒸馏和密集特征融合模块加强了网络内部信息的流动效率;引入改进的生成对抗网络来改善重建图像的伪影和过于平滑的问题。【2】 超分辨率问题本质是不适定的或者说欠定逆问题,也就是图像超分辨率的解是不唯一的。对于任何给定的低分辨率像素都存在多重解,所以对于这个问题通常用强先验信息约束解空间来缓解,为了学习强先验信息,主要有两种思路: (1)利用同一图像的内部相似性; (2)从外部低分辨率和高分辨率样例图片对中学习映射函数
1.2传统方法
传统基于稀疏编码的超分辨率方法是基于外部实例方法的一种方法,该方法流程如下: (1)从输入图片中密集地进行采样形成大量的重叠的patches,并且对这些patch进行预处理(例如减去均值、标准化); (2)用一个低分辨率的字典对patches进行编码; (3)稀疏系数被传递到一个高分辨率字典中,用来重构高分辨率的patches; (4)将重叠的patches进行聚合(平均权重)产生最终的输出;
1.3 本报告提出的方法
这篇课程设计报告的实验是基于2015年由何恺明博士、汤晓鸥教授等发表于TPAMI的关于图像超分辨率的一篇论文《Image Super-resolution Using Deep Convolutional Networks (SRCNN)》,同时也是世界上较早的将深度学习应用在图像超分辨率的工作【3】,文中提出了一种用于单图像超分辨率的三层卷积网络,即SRCNN来实现图像的超分辨率的深度学习方法,相较于传统的基于稀疏表示的字典学习方法,一定程度上提升了图像重建的质量。
1.4 优越性
针对低分辨率图像在预处理时使用双三次插值导致图像丢失一些重要的高频纹理细节以及网络模型优化问题,文章提出了连分式插值结合卷积神经网络的超分辨率重建方法。在原有的轻量级基于卷积神经网络的超分辨率重建算法(super-resolution convolutional neural net work, SRCNN)网络模型基础上,首先采用Newton-Thiele型连分式插值函数将低分辨率图像插值到目标尺寸;然后利用3个卷积层进行图像特征提取、非线性映射、重建与优化;该文在网络收敛时利用Radam优化算法自适应地调整梯度,并且采用余弦衰减法逐渐降低学习率。实验结果表明,该网络模型能够在轻量级的卷积神经网络下获得更丰富的纹理细节和更清晰的图像边缘。 【4】 与稀疏编码表示的方法相比,SRCNN有诸多优点: ①SRCNN没有显式地学习用于modeling the patch space的dictionaries或manifolds,而是通过隐藏层隐式实现的。 ②patch的提取和聚合也被表示为卷积层,因此也被包含在了优化过程中。 ③完全是通过学习获得的,几乎没有预处理或后处理。 ④结构简单而且准确率还比一些基于实例的先进方法的高; ⑤有合适的卷积核数和层数,即便使用CPU,也能有很快的速度; ⑥SRCNN是完全前馈的网络,在使用中不需要解决任何优化问题,因此要快于其他基于实例的方法; ⑦当数据集更大、更多样化或者模型更大、更深时,网络的恢复质量可以进一步提高; ⑧SRCNN可以同时处理彩色图像的三通道,提高了超分辨率性能
2.实验过程
2.1实验方法
使用深卷积网络进行图像的超级分辨率(SRCNN): 简单来讲,SRCNN的原理可以概括为:直接学习低/高分辨率图像之间的端到端映射。 这一映射被表示为深度卷积神经网络(CNN),其将低分辨率图像作为输入,经映射后输出高分辨率图形,达到了很好的效果,同时证明了传统基于稀疏编码的SR方法也可以看作是一个深度卷积网络。其区别在于,传统方法是分别处理每个组件,而SRCNN则是联合优化所有层。SRCNN网络问世后,它在图像超分辨重建的应用使得深度学习在图像处理领域得到扩展。2014年,深度学习模型SRCNN一经提出,为深度学习解决图像压缩领域的像素问题开创了新纪元。【5】
2.2 SRCNN的结构特性:
SRCNN具有三层网络结构,在具有轻量结构的同时,还具有最先进的恢复质量,并实现了快速的在线使用,作者在论文中探索了不同的网络结构和参数设置,以实现性能和速度之间的权衡。从处理过程来看,SRCNN可以同时处理RGB三个颜色通道,从而表现出更好的整体重建质量。
-
第一卷积层:提取一组特征映射 W1表示为滤波器,B1表示为偏差; -
第二卷积层:映射这些特征非线性地映射到高分辨率表示 -
第三卷积层:结合了空间邻域内的预测重建,以产生最终的高分辨率图像 W3是一组线性滤波器
2.3论证稀疏编码表示在RSCNN中的可行性
①左半部分:可以看作是把f1×f1低分辨率的patch看成是从输入图片提取出来的,稀疏编码将patch投影到一个字典上,如果这个字典的大小为n1,那么相当于在输入图片上使用n1个大小f1×f1的卷积核进行卷积运算。 ②中间部分:稀疏编码会迭代的处理n1维度的向量,从而得到一个n2维度的向量,一般来说n1、n2是相等的,这个时候稀疏编码求解程序起的作用就是一个大小为1×1的非线性映射运算符。 ③右半部分:最后再对n2维度的向量投影到另一个字典空间目的是产生高分辨率的patch,重叠部分的patch会进行平均操作。
2.4损失函数
SRCNN模型的参数有:W1, W2, W3, B1, B2, B3。给定一组高分辨率图片Xi以及对应低分辨率图片Yi,我们使用均方误差MSE(mean squared error)作为损失函数。设为: 其中n是训练样本的数量。 损失函数使用随机梯度下降进行优化 其中的l∈{1,2,3},i是层和迭代的索引,每层的卷积核权重都由均值为0标准差为0.001的高斯分布进行初始化,每层偏置都初始化为0,η是学习率,前两层的学习率为10^-4 ,最后一层的学习率为10^-5,尤其最后一层使用小的学习率对SRCNN的收敛性能影响较大。
可见,四层网络收敛的比三层的慢,但若有足够的训练时间,四层网络最终也能赶上三层的网络。论文中实验表明网络并不是越深越好,当使用越深的网络(例如四层或五层的网络),我们发现很难去设置一个合适的学习率来确保网络收敛,即使模型收敛了,也可能陷入一个不好的局部最小值,并且经过足够的训练时间,已学习的卷积核的多样性会变少。而且在图像分类领域,不适当的增加模型深度也会使得准确率的下降或退化。
3.实验结果
3.1调整参数
为了平衡性能和速度,我们的方法选用了f1=9, f2=5, f3=5, n1=64, n2=32,并且在ImageNet上进行训练。并且对每个放大系数∈{2, 3, 4},都分别训练了一个相应的网络。
3.2评价指标:
①PSNR(Peak Signal to Noise Ratio)峰值信噪比:PSNR是最普遍,最广泛使用的评鉴画质的客观量测法。但这个指标只是速度快,评价效果一般; ②SSIM(Structural SIMilarity)结构相似性:是一种衡量两幅图像相似度的指标,用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。 ③IFC(information fidelity criterion)信息保真度准则:通过计算待评图像与参考图像之间的互信息来衡量待评图像的质量优劣。 ④NQM(noise quality measure)噪声质量测量 ⑤WPSNR(Weighted Peak Signal to Noise Ratio)加权峰值信噪比 ⑥MSSSIM(Multi Scale Structural SIMilarity )多尺度结构相似性
3.3对颜色通道的实验结果:
说明:
①Y only:基线方法,是一个单通道网络(c=1),只在亮度上进行了训练。对Cb、Cr通道采用双三次插值进行了扩展。 ②YCbCr:在YCbCr空间的三个通道上进行训练 ③Y pre-train :使用Y通道的MSE作为损失来对网络进行预训练。然后利用各通道的MSE对参数进行微调 ④CbCr pre-train:使用Cb,Cr通道的MSE作为损失来对网络进行预训练,然后对所有通道的参数进行微调 ⑤RGB:在RGB空间的三个通道上进行训练
4.实验结论
通过这篇论文,学习了SRCNN这种对于单图像进行超分辨率的深度学习方,通过公式演算,一步步探寻到了传统的基于稀疏编码的SR方法可以重构为一个深度卷积神经网络。我们表明,传统的基于稀疏编码的SR方法可以被重新表述为一个深度卷积神经网络。所提出的方法,即SRCNN,可以学习低分辨率和高分辨率图像之间的端到端映射,除了优化之外几乎没有额外的前/后处理。凭借轻量级的结构,SRCNN已经取得了比最先进的方法更出色的性能。我们猜想,通过探索更多的滤波器和不同的训练策略,可以进一步获得额外的性能。此外,所提出的结构具有简单和稳健的优点,可以应用于其他低层次的视觉问题,如图像去模糊化或同步SR+去噪。我们还可以研究一个网络来应对不同的放大系数。 SRCNN学习低分辨率和高分辨率图像之间的端到端映射,除了优化之外几乎没有额外的预处理/后处理,由于采用了轻型结构,SRCNN的性能优于目前基于实例的的方法。并进一步探索可以知道更多的卷积核和不同的训练策略,可以获得更好的性能。对于一些低质图片,可以有很大的发挥作用的空间,在人脸识别等领域大展身手。
参考文献:
[1]张俊韬. 基于注意力卷积神经网络的图像超分辨率研究[D].哈尔滨工程大学,2021.DOI:10.27060/d.cnki.ghbcu.2021.001483. [2]查体博. 基于深度卷积神经网络的列车检测图像超分辨方法研究[D].西南交通大学,2021.DOI:10.27414/d.cnki.gxnju.2021.002909. [3]Chao Dong,Chen Change Loy,Kaiming He,Xiaoou Tang. Image Super-Resolution Using Deep Convolutional Networks.[J]. CoRR,2015,abs/1501.00092. [4]杨悦,谢辛,何蕾,胡敏.连分式插值结合卷积神经网络的超分辨率重建[J].合肥工业大学学报(自然科学版),2021,44(08):1146-1152. [5]曾诗悦.基于SRCNN模型的图像压缩方法研究[J].信息技术与信息化,2020(09):98-100.
|