CVPR2022:Not All Points Are Equal: Learning Highly Efficient Point-based Detectors for 3D LiDAR Point Clouds
本文基于point_base的方法实现了高效的3D检测器IA-SSD,作者认为,使用传统的FPS方法会丢失大量前景点,导致检测recall下降,因此更加关注前景点。
网络主体结构如上图所示,该网络首先使用了类似PointNet++中SA模块来进行下采样,并分析了RS,D-FPS,Feat-FPS之间的性能和效率。结果显示,RS丢失了大量前景点,导致recall明显降低,而D-FPS和Feat-FPS在前几层中保持了较高的recall,但在最后的Centroid Aggregation中性能不佳。因此作者提出了Cls-aware和Ctr-aware这两种采样策略。 Cls-aware利用原始标注框生成语义标签进行监督,并使用普通的Cross-Entropy计算损失。其式如下:
Ctr-aware计算了各点到检测框六个面的距离,用来表示该点和框实例中心的距离,距离越小,权重越高。 其中f*、b*、l*、r*、u*、d*分别表示该点到检测框前、后、左、右、上、下的距离。在训练过程中,掩码根据空间位置不同,为每个点分配不同权值,从而将几何先验隐式地纳入到网络训练中。特别地,加权交叉熵损失计算如下: 掩模与前景点的损失项相乘,使靠近中心的点具有更高的概率。推理过程保留得分最高的K个点。
四种方法实际效果对比如下图所示,可以看到所提出方法在高效的同时保持了良好的recall。
模型在2080TI上的FPS达到了83,速度非常快,却内存占比很小。 在车辆和非机动车的检测中取得了不错的效果,行人的效果不理想。 文章现在前两层使用了D-FPS,后两层使用了Ctr-aware。
|