VoteNet
Abstract
3D 对象质心可能远离表面点,难以一步准确回归。基于deep point set networks 和Hough 投票,使用纯几何特征。
Introduction
Deep sliding shapes for amodal 3d object detection in rgb-d images、3D-SIS将2D检测方法拓展到3D。
Voxel无法利用数据的稀疏性,3D卷积慢。映射到BEV后,然后用2D检测方法,牺牲了细节。
本工作以点云为输入,不依赖2D检测方法,受对象检测的通用 Hough 投票过程的启发。(Com- bined object categorization and segmentation with an implicit shape model)
点云和图像不同,在物体中心会存在一个像素,因此,基于点的网络难以在对象中心附近聚合场景上下文。简单地增加感受野并不能解决问题,因为随着网络捕获更大的上下文,它也会导致更多的附近物体和混乱。
通过Houngh投票,生成靠近中心的点集,这些点可以被分组或聚合生成box proposals。
**输入点云,对一组种子点进行采样,并从它们的特征中生成投票。投票的目标是到达对象中心。**结果,投票集群出现在对象中心附近,进而可以通过学习模块进行聚合以生成框提案。
投票也是聚合上下文信息。
总之,贡献如下:
- 端到端可微架构,在
|