IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> HDR图像评价指标:HDR-VDP-2.2(Q-Score) -> 正文阅读

[人工智能]HDR图像评价指标:HDR-VDP-2.2(Q-Score)

本文仅用于记录自己学习HDR-VDP-2.2过程中的一些总结。

HDR-VDP-2.2是HDR图像评价的一个常用指标。说到图像评价,常见的有MSE, PSRN, SSIM等,这些网上资料很多。但HDR-VDP-2.2(Q-Score)相关内容却极少。为此,查阅了相关资料整理如下。

HDR-VDP官方网页:http://hdrvdp.sourceforge.net/wiki/

HDR-VDP

显然最后的2.2是指2.2版本,那必然有v1和v2,为此查到了HDR-VDP的第一篇论文[1]。论文[1]是对当时已有的VDP(Visual Difference Predictor)做了扩展,使其能够适用于HDR图像。文中指出,常见的两种描述人眼感受差异的指标为:Daly’s Visual Difference Predicator (VDP) 和Sarnoff Visual Discrimination Model,作者选择改进了前者。

在这里插入图片描述
上图是Daly的VDP框架,简单来是输入mask image(参考图像)和target image(目标图像,即需比较差异的图像),经过一些预处理(CSF),之后在经过仿人眼感知的一些变换(Cortex Transform…),得到在orientation和spatial上一系列图像,然后做差,选择(pooling)一些维度最终得到相似性。

Daly的Amplitude Compression和CSF(Contrast Sensitivity Function)不适用HDR场景,所以作者主要对这两个模块重新进行了建模。具体涉及内容不展开。

经过改进,最终输出结果是target和mask图不同区域的相似程度,如下图。从左到右依次是:原图,加竖线噪声,Daly评价,HDR-VDP评价。看起来貌似没有太大差距,但仔细看HDR-VDP版本更精细一点吧。

HDR-VDP-2.0

在这里插入图片描述

其实从提出HDR-VDP后,有不少作者进行了赶紧,什么1.7版本balabala。同一个作者后来提出了2.0版本[2]。作者指出,2.0并不是对1.0版本的小修,而是一个overhaul。因此可以完全不顾1.0的框架。新的框架如下:

在这里插入图片描述

但其实还没有跳出VDP的大框架,首先经过了一个Optical and retinal pathway模块,再经过Multi-scale decomposition,做差后经过neural noise处理,产生了两个测度:visibility metric和quality metric。

Optical and retinal pathway还是仿人眼对原始图像做了一系列的处理,具体环节在右上角绿色中。decomposition还是将图像分解到orientation和spatial多个维度,然后做差。一个显著的不同就是,不仅有类似1.0版本的可视化结果,还有一个归一化的评价指标,即Quality metric。这个在后面的论文中被称为Q-Score。

这里不展开介绍各个模块的原理和过程。只介绍一点,这里的Q-score是通过从不同的维度图像中通过pooling和加权得到的一个归一化指标,计算公式见下图。
在这里插入图片描述
其中D的计算式如下,其中B_T表示"f-th spatial frequency band and o-th orientation of the steerable pyramid is given as B_T/R [f,o] for the test and reference images respectively"即不同频率、orientation下的一些误差,归一化之后得到D。eps为1e-5避免奇异,wf为不同频率的权重。即理解为作者选择了某些层面的数据加权求和,得到了一个数值结果。在这里插入图片描述

HDR-VDP-2.2

上面提到,Q-Score的计算方式利用的是式(24),这个式子是经验公式,通过一些数据集结果拟合出来的参数。作者对这个拟合过程进行了改进,避免了过拟合等,改进得到了2.2版本[3]。其实没啥意思。

小结

HDR-VDP是对VDP在HDR图像上的一个扩展,从提出到改进经过了十多年。其中2.0版本奠定了现在的基础,2.2是目前最新的改进。

参考文献

  1. R. Mantiuk, K. Myszkowski and H. -. Seidel, “Visible difference predicator for high dynamic range images,” 2004 IEEE International Conference on Systems, Man and Cybernetics (IEEE Cat. No.04CH37583), 2004, pp. 2763-2769 vol.3, doi: 10.1109/ICSMC.2004.1400750.
  2. Rafa? Mantiuk, Kil Joong Kim, Allan G. Rempel, and Wolfgang Heidrich. 2011. HDR-VDP-2: a calibrated visual metric for visibility and quality predictions in all luminance conditions. ACM Trans. Graph. 30, 4, Article 40 (July 2011), 14 pages. DOI:https://doi.org/10.1145/2010324.1964935
  3. Narwaria, M., Mantiuk, R., Silva, M. D. & Callet, P. L. (2015). HDR-VDP-2.2: A calibrated method for objective quality prediction of high-dynamic range and standard images. Journal of Electronic Imaging, 24(1). doi: 10.1117/1.JEI.24.1.010501
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 23:22:47  更:2022-04-01 23:24:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 12:46:11-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码