IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> PV-RCNN:Point-based与Voexl-based共同成就的高性能3D目标检测网络 -> 正文阅读

[人工智能]PV-RCNN:Point-based与Voexl-based共同成就的高性能3D目标检测网络

论文及代码链接

??论文地址:论文地址
??代码链接:代码链接

作者的思考及论文动机

??现阶段的3D目标检测方法主要可以分为两大类,一个是采用pointnet及其变种直接对点云进行处理,即point-based。一种是将点云数据转化成规则的体素,通过三维卷积进行特征提取,即voxel-based。两种方法没有绝对意义上的孰优孰劣,各有各自不同的特点。得益于稀疏卷积,voxel-based方法的显存占用与计算量大大减少,但是体素化带来的信息损失仍然不可避免。而point-based方法虽然利用了完整的,也是最原始的点云信息,但是这类方法都会通过SA操作来提取局部空间信息,SA操作中的近邻搜索过于耗时,大大影响了算法的效率。
??文章中,作者认为基于体素的方法计算上更加高效,但是会有不可避免的信息损失,基于点的具有灵活的感受野也没有信息损失,但是计算量较大。因此,作者提出了PV-RCNN,该方法融合了point-based与voxel-based方法各自的优点,曾在Kitii3D目标检测霸榜半年之久。
??PV-RCNN的主要亮点在于,作者提出了VSA结构。我们先复习一下SA,SA是pointnet++的结构,用于提取多尺度的局部空间特征。如下图,在点云中随机采样关键点,然后以距关键点距离小于r的所有点的集合为输入,聚合特征得到关键点的特征。VSA与SA的区别在于,SA是把关键点周围的点的特征聚合到关键点上,而VSA是把关键点周围的体素的特征聚合到关键点上。而我们知道,体素是有序的,所以对于每个关键点,我们都可以很方便寻找到其周围的体素而不必要去遍历整个集合。VSA也是PV-RCNN的关键,是Voxel与Point联系的桥梁
在这里插入图片描述

网络结构模型以及主要模块分析

??接下来,我们主要来分析一下PV-RCNN的网络结构,其网络结构如下图所示:
在这里插入图片描述
??我们可以看到,PV-RCNN是一个二阶段的,与其他二阶段网络一样,都是第一阶段先提取出ROI,然后第二阶段对ROI进行精调获取更为准确的Bounding Box。
??PV-RCNN的第一阶段没有什么特别的,与SECOND以及Voxel-RCNN几乎一致。具体来说就是先将点云体素化,然后通过稀疏卷积对体素进行8倍下采样,然后在z向进行压缩得到BEV视图,再用2D卷积对特征进行进一步的提取,最后通过RPN网络以及极大值抑制得到一定数量的ROI输入到第二阶段中去。
??PV-RCNN最主要的贡献在于第二阶段中的ROI特征的提取。在讲述ROI特征提取之间,必须先介绍两个模块,一个就是前面提到的VSA模块,另一个是ROI-grid Pooling模块。VSA模块是聚合体素特征到关键点,而ROI-grid Pooling是聚合关键点特征到ROI以进行第二阶段的Proposal Refinement。下面将分别对这两个模块进行分析。
VSA模块
??VSA模块就是把体素特征聚合到关键点上,具体如何实现的呢。
??首先,我们需要得到这些关键点,提取关键点还是用最远点采样(FPS),这样可以使采样点更好地覆盖全部的点云范围。接下来就是如何将体素特征聚合到这些关键点上了。
??在第一阶段,我们对3D体素进行了3次一共8下采样,这样我们就可以得到四个不同尺度地的体素特征,如下图所示:
在这里插入图片描述
在每个尺度,我们都对体素特征进行一次聚合。具体来说,就是寻找距关键点在r内的所有体素,通过pointnet的方法进行特征聚合然后将结果作为该关键点的特征,最后四个不同尺度的特征直接concat(连接)成为多尺度特征,具体如下图红框内所示:
在这里插入图片描述
??在VSA的基础上,作者又提出了Extend VSA,就是加上了上图红框之外的两个特征,这两个特征一个是原始点云特征,一个是BEV视图特征,作者认为原始点云特征可以一定程度上地弥补体素化带来地位置信息损失,而BEV特征在Z向具有很大的感受野(Z向感受野是整个Z范围)。原始点云特征很好得到,就是采用pointnet++那一套对关键点采用SA就可以得到关键点的原始点云特征。而BEV特征的话是不考虑关键点的z坐标,然后通过双线性插值得到的。这两个特征也是直接concat到关键点特征上就行。作者通过实验,证明了这种叠BUFF操作的有效性。
在这里插入图片描述
ROI-grid Pooling
??ROI-grid Pooling模块的作用就是利用前面提取到的多尺度关键点特征聚合得到ROI特征,进而进行进一步的Proposal Refinement。具体操作如下:第一阶段已经给我提供了一定数量的ROI区域,对于每个ROI区域,我们将其划分成6x6x6的网格,然后对每一个网格寻找距其中心点距离小于r的关键点,采用pointnet结构聚合这些关键点特征作为该网格的特征。其他网格采用同样的操作。最后对所有网格特征再次采用pointnet结构,这样就能得到了ROI的特征。采用这个特征就可以进行Proposal Refinement了。作者认为,这样子相比于Voxel中的直接进行ROI pooling言,具有更大的感受野,这很好理解,毕竟在前面提取的关键点特征的时候,感受野就比较大。
在聚合特征的时候,还有一个注意点。由于关键点是我们随机采样得到的,所以有些关键点是前景,而有些关键点是背景。作者认为前景点应该得到更多的考虑,所以设计了一个网络来判断前背景,并将网络输出直接乘到关键点特征上以使前背景特征有不同的权重。注意这个网络是单独训练的,其采用关键点特征作为输入,依据关键点坐标是否在某个GT作为标签。
在这里插入图片描述
在这里插入图片描述
??PV-RCNN的LOSS就不分析了,和其他二阶段网络的LOSS一样,都分成了RPN_LOSS与RCNN_LOSS两个部分,然后两个LOSS相加进行端到端的训练。下面是论文中的LOSS组成:
在这里插入图片描述

网络性能分析及总结

??通过结合voxel与point的各自的长处,PV-RCNN确实得到了不错的效果。曾经也在KITTI上霸榜半年之久,论文中给出的性能比较如下:
在这里插入图片描述
??当然,现在肯定有了更多性能更好的算法,毕竟现在卷是常态…
??个人的一些思考:PV-RCNN虽然检测效果比较好,但感觉其就是通过不断叠BUFF,得到了尽可能详细的特征。这就带来了一个问题,处理速度,也就是实时性可能不太好。但是我感觉,我们的算法最终还是要用于实际场景的,这就对算法的轻量化与实时性提出了一定的要求。所以感觉轻量化实时性也是一个很重要的点,有时候甚至可以为了这两个指标牺牲一部分准确度。在第一阶段得到BEV视图时,我们是直接在Z向压缩,也就是把直接把xy相同的体素的特征进行了拼接。这样肯定会有空间结构信息的损失,这个应该也是可以考虑的,PV-RCNN也主要就是对第二阶段进行了优化,第一阶段并没有进行优化。

文章属于对阅读过的论文进行复盘,如有问题请指出,如果有研究方向相似的朋友想进行交流欢迎联系:qq1981425845

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-24 09:26:48  更:2022-04-24 09:30:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 9:42:29-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码