IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 论文阅读《Hierarchical Deep Stereo Matching on High-Resolution Images》 -> 正文阅读

[人工智能]论文阅读《Hierarchical Deep Stereo Matching on High-Resolution Images》

论文地址：https://arxiv.org/abs/1912.06704
源码地址：https://github.com/gengshan-y/high-res-stereo

背景

??针对许多SOTA的方法因为显存或运行速度的限制而难以处理高分辨率图像的立体匹配问题，本文提出一个由端对端训练的结构，由粗到细逐层进行立体匹配；

模型结构

在这里插入图片描述

分层立体匹配架构

U-Net特征提取

??使用UNet结构构建特征金字塔：在encoder最后一层使用（空间金字塔池化）PPS层对特征进行融合，增大像素的感受野；然后进行上采样得到各个level的特征图；

代价体构建

??对于每个level的图像特征，在水平方向扫描，基于特征的绝对值差构建匹配代价体；

代价体decoder

在这里插入图片描述
??得到多个尺度的代价体后，使用代价体decoder将代价体由低分辨率恢复到高分辨率，并与上一层的代价体融合：

对维度为 $(C, D, H, W)$ 的代价体使用6个Conv3d Block处理（代价聚合），得到聚合后的代价体。
对聚合后的代价体使用 SSP 模块进行处理，融合局部与全局代价信息；
对处理后的代价体使用不同的3D卷积处理，一边得到更大尺寸的代价体（为了与上一层的代价体进行融合），一边得到一个低分辨率的视差体，经过softmax后得到该level的概率体，再基于期望形式求得该level的视差图；

多尺度损失函数

??使用 $L_1$ 损失，在多个尺度上求损失：
$L=L_{1}+\frac{1}{2^{2}} L_{2}+\frac{1}{2^{4}} L_{3}+\frac{1}{2^{6}} L_{4}\tag1$

非对称数据增强

??大多数立体匹配模型都基于以下的假设：左右视图的成像条件相同；相机标定结果很准确；不存在遮挡区域且每个点都能找到一个最佳的匹配点；然而在实际环境中，这样的假设可能不成立，为此需要进行一些数据增强操作，提高模型的鲁棒性；

y轴视差增强

??对于立体匹配任务，很多模型的输入为经过极线校正后的图像，由于相机参数的准确度的限制，极线校正后的图像存在一定的误差（同名点不一定处于同一个水平线）。分层多尺度匹配可以缓解这个问题，为了模拟真实世界的标定误差，根据标定误差矩阵对目标视图图像进行变形，以此强迫模型对这种误差的鲁棒性；

不对称颜色增强

??立体相机在成像时，两个视图之间的光照条件和相机的曝光参数不一定一致，因此对左右视图分别进行不同的颜色增强，迫使模型提高对光照不一致的鲁棒性；

不对称掩码

??多数立体匹配算法假设同名点总是在目标视图中存在（不存在遮挡区域），这种假设是不合理的。为了迫使模型去学习更多的上下文信息，本文应用了非对称掩蔽，使用整个图像的平均RGB值随机替换目标视图中的矩形区域。

实验结果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2022-04-04 12:11:32 更:2022-04-04 12:16:22

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/29 3:19:57-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码