| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> MVSNet、R-MvsNet的一些理解 -> 正文阅读 |
|
|
[人工智能]MVSNet、R-MvsNet的一些理解 |
一、MVSNet一些操作1、MVSNet 构建特征体参考图像的一个pixel(记作x)(r image),在其拍摄方向给定的深度(d_i)对应着一个三维点(x_i)即世界坐标值,它投影到matching image会打在某个pixel(x_i)(相机坐标系–>归一化得到像素坐标)的位置。x与x_i的匹配代价或者说是相似程度,就是cost volume记录的内容。这个cost volume通过多个3D卷积得到一个初始的深度图。最后这个初始深度图(initial depth map)和reference image共同作用,去改善边界范围的准确率。
2、构建代价体将N+1个特征体聚合为一个统一的代价空间,将N+1摞书转换为一摞书 3、构建概率体一摞书变成一本书,三维卷积的最后将通道降为1,也就是把每本书都变成一页纸,一张纸代表一个深度,对于书页((W,H)平面)上的每一个点,若它在第三页的值最大,那么这个点的深度就为第三页的取值。使用一个3D U-Net结构来将代价 cost 转化为概率,即对于(W,H)平面上的每个点,沿D方向的概率合为1.,这便得到最终的概率空间P。视角图像中的每一个像素在参考相机坐标系下的深度的概率 这里参考了一些文章 二、R-MVSNet基本流程是和MVSNet基本类似,平面扫面转换视角构建代价体,正则化的时候使用循环神经网络RNN进行序列化处理,用2D的卷积加上GNU(门控循环单元)来处理每一张特征图。 1、循环神经网络有些任务需要更好的处理序列信息,前面的输入和后面的输入有关系。每次会得到当前隐藏层的输出以及传递给下一节点的隐藏状态
tanh : tanh函数,将数据映射到[-1,1]范围内。
2、代价体正则化
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年10日历 | -2025/10/29 2:30:45- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |