| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 单图像超分辨率重建总结 -> 正文阅读 |
|
[人工智能]单图像超分辨率重建总结 |
单图像超分辨率重建总结定义单图像超分辨率重建(Single Image Super-resolution Reconstruction,SISR)旨在从给定的低分辨率(LR)图像中,重建含有清晰细节特征的高分辨率(HR)图像,是计算机视觉中较为底层的任务。 方法分类
基于插值的超分辨率重建方法线性插值算法最近邻插值法最近邻插值法指插值点直接以与其欧式距离最短的像素点的灰度值为自身插值后的灰度值。
双线性插值法双线性插值法主要从垂直、水平两个方向对相邻的四个像素点进行线性插值实现图像插值问题。
双三次插值法双三次插值法是在双线性插值法的基础上提出的,将邻近区域内四个相邻像素点扩充到十六个相邻像素点,对其使用三次插值多项式后进行加权平均计算完成图像插值重建。
非线性插值算法边缘导向插值法边缘导向插值法主要是对RGB三色图像的边缘信息进行约束、放大,以便解决人眼视觉特性对图像边缘信息的捕捉造成的影响。 梯度引导插值法梯度引导插值法是利用邻域内一阶梯度、二阶梯度的信息调整梯度分布和像素分布,再结合边缘导向插值法和双线性插值法实现图像重建。 小波变换插值法小波变换插值法充分利用小波变换所具有的局部细化特点,将图像特征信息分解到不同尺度上独立研究与分析后,将提取的特征信息叠加融合后再用小波逆变换提高图像分辨率。 基于重构的图像重建方法频域法Patti 等人最早提出在傅里叶变换频域内消除LR图像的频谱混叠,对多幅LR图像进行傅里叶变换实现超分辨率图像重建。
空域法非均匀内插法非均匀内插法对抽象出的非均匀分布的LR图像特征信息进行拟合或者插值得到分布均匀的HR图像特征信息来实现超分辨率图像重建。
迭代反向投影法Irani 等人提出迭代反向投影法解决超分辨率图像重建算法对图像先验信息的高依赖性问题,有效改善重建图像质量问题和对图像先验信息依赖问题,但也使得重建图像的唯一性不能得到保证。 凸集投影法凸集投影法利用HR图像的正定性、有界性、光滑性等限制条件对重建图像的边缘信息和结构信息进行保留,但该算法运算复杂度高,收敛速度慢,且每次迭代对先验信息都存在较强的依赖性。 最大后验概率法最大后验概率法(MAP)是指在已知LR图像序列信息和HR图像后验概率达到最大的前提下,对HR图像进行图像特征信息估计,保证图像解唯一性的同时提高图像清晰度,但图像边缘信息提取有待加强。 MAP/POCS 法陈光盛等人将POCS 和MAP 结合,在MAP 迭代优化过程中加入POCS 约束凸集中的先验条件,充分发挥出两者的优势,利用POCS 弥补MAP 收敛稳定性和降噪能力弱的缺点,MAP 弥补POCS 边缘和细节保持差的缺点。 基于学习的图像重建方法深度学习前的图像重建算法基于样例学习法基于样例学习法起源于Freeman等人根据马尔可夫网络提出的单幅图像重建算法,主要是通过对原始HR图像实施退化操作,建立训练图像特征信息库来学习HR图像的先验信息,以此来恢复图像的高频细节特征信息。 邻域嵌入法邻域嵌入法以图像块为单位对图像特征信息进行提取,构建特征信息库对LR图像块和HR图像块进行加权求和以实现HR图像重建。
稀疏表示法稀疏表示法重点以字典学习和稀疏编码为核心来实现图像图像重建效率与重建质量的有效提升。用稀疏编码对图像块进行表示,再从样本图像中抓取HR图像块和LR图像块,形成超完备字典,并根据字典得到样本图像的系数线性表示,最后根据稀疏系数重建HR图像。 深度学习后的图像重建算法基于卷积神经网络
基于生成对抗网络在Goodfellow等人提出生成对抗网络(GAN)之后,出现了许多基于GAN 的超分辨率图像重建算法,其在图像重建效果、网络运算量、运算速度等方面都有很好的结果。
基于深度强化学习在图像超分领域早期,利用深度学习算法学习LR 图像到HR 图像所有块之间的映射时,没有考虑到块与块之间的相关性。2017 年Qingxing Cao 等人受人类感知过程的启发,从整体图像开始,对不同区域的相关关系进行建模,并按照各个区域的关联线索进行融合,探索具有注意力转移机制的区域序列,结合深度学习强大的学习能力,提出了基于深度强化学习的注意感知人脸超分。 基于Transformer2020 年Fuzhi Yang 等人最早将Transformer 引入图像超分领域,提出了基于Transformer 网络结构的TTSR 超分算法。为了充分利用参考图像的纹理信息,FuzhiYang 等人在TTSR 中提出了特征融合机制,利用上采样方式实现不同层级间的特征互相融合。大量的实验表明,TTSR 在客观和主观评价方面都取得了显著的进步。 常用数据集用于深度学习的超分辨率图像重建的图像数据集所涉及的领域较多,涵盖人物、动植物、建筑、自然景观等,且许多开源的数据集在图像外部条件(分辨率大小、张数、格式等)和内部条件(内容、风格、纹理等)上存在着较大差异,具体情况如下表所示。 benchmark 数据集是同一领域内的对比标准,本节主要列举了该领域的benchmark测试数据集,即Set5、Set14、BSD100、Urban100 以及DIV2K 数据集。除此之外,Flickr2K 也是超分领域主流的训练数据集,以及后续提出的具有LR-HR 图像对的真实数据集City100、RealSR、DRealSR。 图像质量评估图像质量评价(image quality assessment,IQA)的方式主要分为人眼视觉系统感知方面的主观评价和实验数值计算方面的客观评价。 主观评价主观评价是指观察者通过眼睛观察重建的HR 图像,主要依据观察者在色彩、清晰度、噪音、质感等方面对图像的综合评价。
客观评价客观评估是对超分重建结果的定量评价,直接定量地反映图像质量,从数据上可以直接得出结果的好坏。
P S N R = 10 l g ( M A X I 2 M S E ) PSNR = 10 lg(\frac{MAX_I^2}{MSE}) PSNR=10lg(MSEMAXI2??) ? 其中, M S E MSE MSE为均方误差, M A X I MAX_I MAXI?指表示图像点颜色的最大数值,图像的最大像素值由二进制位数决定,如8位二进制表示的图像的 最大像素值就是255。
S S I M ( x , y ) = [ l ( x , y ) ] α [ c ( x , y ) ] β [ s ( x , y ) ] γ SSIM(x,y)=[l(x,y)]^ \alpha [c(x,y)]^ \beta [s(x,y)]^ \gamma SSIM(x,y)=[l(x,y)]α[c(x,y)]β[s(x,y)]γ ? 其中: c ( x , y ) = 2 σ x y + c 2 σ x 2 + σ y 2 + c 2 c(x,y)= \frac{2 \sigma_{xy}+c_2}{\sigma_x^2+\sigma_y^2+c_2} c(x,y)=σx2?+σy2?+c2?2σxy?+c2?? s ( x , y ) = σ x y μ y + c 3 σ x σ y + c 3 s(x,y)= \frac{\sigma_{xy} \mu_y+c_3}{\sigma_x \sigma_y+c_3} s(x,y)=σx?σy?+c3?σxy?μy?+c3?? ? l ( x , y ) l(x,y) l(x,y)表示图像的亮度比较, c ( x , y ) c(x,y) c(x,y)表示图像的对比度比较, s ( x , y ) s(x,y) s(x,y)表示图像的结构比较, μ \mu μ代表均值, σ \sigma σ表示标准差, σ x y \sigma_{xy} σxy?表示协方差, c c c为常数,避免出现分母为0导致系统错误。 补充知识上采样方法在神经网络占据主导地位的情况下,部分传统的上采样方式因其可解释性以及容易实现,在深度学习的超分模型中经常见到,并且取得让人满意的效果。这里主要介绍基于插值的传统上采样方法和端到端可学习的上采样方法。
参考文献[1]杨才东,李承阳,李忠博,谢永强,孙方伟,齐锦.深度学习的图像超分辨率重建技术综述[J].计算机科学与探索,2022,16(09):1990-2010. [2]钟梦圆,姜麟.超分辨率图像重建算法综述[J].计算机科学与探索,2022,16(05):972-990. 最后感谢小伙伴们的学习噢~ |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/28 18:51:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |