IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度估计-03-MonoIndoor: Towards Good Practice of Self-SupervisedMonocular Depth Estimation for Indoor En -> 正文阅读

[人工智能]深度估计-03-MonoIndoor: Towards Good Practice of Self-SupervisedMonocular Depth Estimation for Indoor En

MonoIndoor: Towards Good Practice of Self-Supervised Monocular Depth Estimation for Indoor Environments?

ICCV 2021

Paper:?https://arxiv.org/pdf/2107.12429.pdf

提出室内深度估计的问题

1)序列帧之间深度变化范围大,导致DepthNet难以获得一致的深度线索。在室外场景中,最远处通常是天空;而在室内场景中,客厅和浴室的最远距离显然有很大差异

2)室内相机旋转镜头多(rotational),而室外,例如驾驶数据集KITTI,相机移动通常是平移。导致PoseNet对位姿估计难。

提出对应解决方法

1)深度因子化模块(Depth Factorization)解决深度变化范围大难以估计深度的问题;

2)残差姿态估计模块(Residual Pose Estimation)改善PoseNet对于旋转姿态的估计。

在三个室内数据集上做了实验:EuRoC, NYUv2 and 7-Scenes。

Baseline

Loss? = 光度重构误差+ edge-ware smoothness loss + auto-mask static pixel [12] +?depth consistency loss[1]

Depth Factorization

????????深度归一化模块通过预测一个输入图片场景的scale系数,约束预测深度图的深度最近和最远距离。?

?

?

1)Self-attention module,加入attention模块去得到更informative的Encoder输出特征,属于常规加入注意力优化特征操作,蹭一波transformer的热度。

2)probabilistic classification-based strategy

?

?????????为Depth Factorization 网络预测的scale value,通过对各个scale s进行加权求和后得到global scale S。这样可以得到平滑的global scale。

Residual Pose Estimation

????????通过估计中间状态视角,将一次姿态估计分解为多次姿态估计。

????????先输入通过I_t和I_t' 输入PoseNet,然后预测I*_t'->t,认为此时是输出了一个中间视角,然后再和Target View一起输入ResidualPoseNet预测一个相对位姿,再进行重投影,通过多次位姿估计和重投影,简化室内场景的相机位姿变化大的问题。

????????此外,注意PoseNet和ResidualPoseNet是共享backbone,而posehead是不共享的。

(The residual pose network shares parameters in the encoder with the pose network but learns independent parameters in its pose prediction head.)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-20 12:29:39  更:2021-10-20 12:30:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 11:09:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码