| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 论文阅读《Hierarchical Deep Stereo Matching on High-Resolution Images》 -> 正文阅读 |
|
|
[人工智能]论文阅读《Hierarchical Deep Stereo Matching on High-Resolution Images》 |
|
论文地址:https://arxiv.org/abs/1912.06704 背景??针对许多SOTA的方法因为显存或运行速度的限制而难以处理高分辨率图像的立体匹配问题,本文提出一个由端对端训练的结构,由粗到细逐层进行立体匹配; 模型结构
分层立体匹配架构U-Net特征提取??使用UNet结构构建特征金字塔:在encoder最后一层使用(空间金字塔池化)PPS层对特征进行融合,增大像素的感受野;然后进行上采样得到各个level的特征图; 代价体构建??对于每个level的图像特征,在水平方向扫描,基于特征的绝对值差构建匹配代价体; 代价体decoder
多尺度损失函数??使用
L
1
L_1
L1?损失,在多个尺度上求损失: 非对称数据增强??大多数立体匹配模型都基于以下的假设:左右视图的成像条件相同;相机标定结果很准确;不存在遮挡区域且每个点都能找到一个最佳的匹配点;然而在实际环境中,这样的假设可能不成立,为此需要进行一些数据增强操作,提高模型的鲁棒性; y轴视差增强??对于立体匹配任务,很多模型的输入为经过极线校正后的图像,由于相机参数的准确度的限制,极线校正后的图像存在一定的误差(同名点不一定处于同一个水平线)。分层多尺度匹配可以缓解这个问题,为了模拟真实世界的标定误差,根据标定误差矩阵对目标视图图像进行变形,以此强迫模型对这种误差的鲁棒性; 不对称颜色增强??立体相机在成像时,两个视图之间的光照条件和相机的曝光参数不一定一致,因此对左右视图分别进行不同的颜色增强,迫使模型提高对光照不一致的鲁棒性; 不对称掩码??多数立体匹配算法假设同名点总是在目标视图中存在(不存在遮挡区域),这种假设是不合理的。为了迫使模型去学习更多的上下文信息,本文应用了非对称掩蔽,使用整个图像的平均RGB值随机替换目标视图中的矩形区域。 实验结果
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/29 3:11:52- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |