| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 30、三维表面重建-Convolutional Occupancy Network -> 正文阅读 |
|
[人工智能]30、三维表面重建-Convolutional Occupancy Network |
简介论文:https://arxiv.org/pdf/2003.04618.pdf 隐式方法的关键限制因素是其简单的全连接网络结构,不允许在观测中集成局部信息或纳入归纳偏差,如平移等方差 论文通过将卷积编码器与隐式占用解码器相结合,模型纳入了归纳偏差,使三维空间中的结构化推理成为可能 论文关键思想是建立丰富的输入特征,结合归纳偏差,整合局部和全局信息,利用卷积运算来获得平移等方差,并利用三维结构的局部自相似性
贡献点
实现流程
EncoderPlane Encoder 平面编码器对于每个输入点,我们在标准平面(即与坐标系轴线对齐的平面)上进行正交投影,以H × W像素单元的分辨率离散该标准平面 对于体素输入,将体素中心视为一个点,并将其投射到平面上,使用平均池化的方法将投影到同一个像素上的特征进行聚集,得到的平面特征维数为H × W × d,其中d为特征维数 模型的两种变体,一是将特征投影到地平面上,二是特征被投影到所有三个正则平面上,前者的计算效率更高,而后者允许在z维中恢复更丰富的几何结构 Volume Encoder 体积编码器平面特征表示允许在大空间分辨率(128^2 像素以上)进行编码,但是仅限于二维,为此提出体积编码器,可以更好地表示3D信息,但仅限于更小的分辨率(在我们的实验中通常为32^3体素),与平面编码器一样,使用平均池化,但这次是对所有属于同一体素细胞的特征进行池化,从而产生一个维数为H × W × D × D的特征体积。 Decoder使用2D和3D卷积沙漏(U-Net)网络处理编码器中的特征平面和特征体积,使模型具有平移等方差,U-Net网络由一系列带跳跃连接的下采样和上采样卷积组成,以整合局部和全局信息。选择U-Net的深度,使接收域等于各自的特征平面或体积的大小 单平面解码器(图2c)使用2D U-Net处理地平面特征 多平面解码器(图2d)使用权重共享的2d U-Nets对每个特征平面进行单独处理 由于卷积运算是平移等变的,所以输出特征也是平移等变的,从而使结构化推理成为可能。此外,卷积操作能够在保留全局信息的同时“inpaint”特征,从而支持从稀疏输入进行重构。 Occupancy Prediction给定聚合的特征图,估计任意点p在三维空间中的占用概率 对于单平面解码器,将每个点p投影到地平面上,通过双线性插值查询特征值(图2c)。 对于多平面解码器(图2d),通过对所有3个平面的特征求和来聚合来自3个正则平面的信息。 对于体积解码器,使用三线性插值(图2e)。输入x在p点处的特征向量为ψ(p, x),我们用一个小的全连通占用网络来预测p的占用情况: Training and Inference在感兴趣的体积内均匀采样查询点p∈R3,并预测其占用值。应用二元交叉熵损失之间的预测?op和真实占用值op 效果
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 22:54:57- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |