| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 超分之RLSP -> 正文阅读 |
|
[人工智能]超分之RLSP |
这篇文章是2019年的ICCVW,其为了视频超分的实时性而只追求速度,放弃了表现力。作者提出了一种高效的VSR模型—— 参考文档: Efficient Video Super-Resolution through Recurrent Latent Space PropagationAbstractRLSP是一种无对齐的VSR方法:无对齐最大的好处就是高效,速度快;缺陷就是表现了不足——PSNR相对于对齐的VSR模型会差一些。
故作者推出了一种基于RNN的VSR模型——RLSP,其将视频超分建模成序列问题(Sequence-to-Sequence),其有如下特点:
1. Introduction复杂的运动补偿往往需要昂贵的计算资源,因此这样的模型并不具备实时性场合,比如游戏超分领域。 下图是RLSP、FRVSR、DUF在PSNR-Runtime上的实验结果:
2. Related Work略 3. Method对于每一次迭代,RLSP的目标就是将当前帧
x
t
∈
R
H
×
W
×
C
x_t\in\mathbb{R}^{H\times W\times C}
xt?∈RH×W×C超分到
y
t
∈
R
r
H
×
r
W
×
C
y_t\in\mathbb{R}^{rH\times rW\times C}
yt?∈RrH×rW×C。关于RLSP的pipeline如下图所示,由于RLSP基于RNN结构,故其最重要的部分就是下图紫色框——
Note:
3.1 ShufflingShuffling主要包括shuffle-up来上采样和shuffle-down来降采样。
Shuffle-up
\colorbox{springgreen}{Shuffle-up}
Shuffle-up?
Shuffle-down
\colorbox{orange}{Shuffle-down}
Shuffle-down?
3.2 Residual Learning就是在Cell中将 x t ? x_t^* xt??和CNN的输出相结合,使得网络去学习残差部分;残差连接除了缓解梯度消失问题以外可以增加一定的稳定性,让残差的学习范围缩小从而减小方差;此外由于CNN会将输入信息进行不可避免地衰减,故将输入直接加进来也有助于保存下来原始输入信息。 3.3 FeedbackFeedback就是将 y t ? 1 y_{t-1} yt?1?进行shuffle-down地过程,由于相邻帧高度相关,因此将这部分信息融合进来也有助于当前帧 x t x_t xt?的超分。 3.4 Hidden State和RNN一样,隐藏状态 h t ? 1 h_{t-1} ht?1?记忆了过去的特征信息,它通过和当前帧信息进行合并来利用过去的特征信息来帮助当前帧的超分过程。在RLSP中,作者使用了7层卷积层来学习hidden-state,最终的输出格式为: R b × f × 64 × 64 , f = 128 \mathbb{R}^{b\times f\times 64\times 64},f=128 Rb×f×64×64,f=128。 3.5 LossRLSP的损失函数采用MSE: 4. Experimental Setup我在复现的时候相关实验配置如下:
由于源码部分对数据集没有写清楚,并且源码中对于数据集读取的内容是有问题的,因此我做了2处改动:
5. Results and Discussion5.1 Ablation除了残差连接以外,RLSP还使用了3处tips:
为了研究上述3个点对RLSP的影响,ablation实验结果如下:
5.2 Temporal Consistency略 5.3 Information Flow over Time略 5.4 Initialization略 5.5 Accuracy and Runtimes
实验结果如下:
可视化结果如下: 6. Conclusion
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 2:20:22- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |