IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 三维目标检测----Attentional PointNet for 3D-Object Detection in Point Clouds论文解读 -> 正文阅读

[人工智能]三维目标检测----Attentional PointNet for 3D-Object Detection in Point Clouds论文解读

image-20211215213449664
代码链接

paper链接

个人博客

论文总结

这是2019年CVPR的一篇文章,本文提出了一种新的利用循环神经网络来做三维目标检测的方法。并且使用了类似于BERT中讲图像分割成patch的方法来处理大型的点云场景。本文的实验效果一般,速度在kitti排行榜上也很一般,不知道为什么能发CVPR. 下面简单介绍一下本文的主要思想。

image-20211215213956713

作者首先讲点云场景划分为 12 × 12 12 \times 12 12×12大小的patch,并将其在 z z z轴上投影得到一个深度图。使用PointNet来处理点云,使用卷积神经网络来处理深度图,然后讲这两个特征进行相加,这样的话就可以得到关于这个patch的上下文信息。然后就来到了循环定位网络(Recurrent Localization Net)。这个网络的输入包含两个部分,一个是Context Vector,上一个循环神经网络的隐含向量的输出。每个GRU一个分支是输出目标的置信度,另一个一个分支是输出一个目标可能所处的位置以及方向。然后在对应的patch中,仅从坐标变化以及重采样。在经过变化得到的感兴趣区域上计算目标边界框的大小以及位置。

关于GRU迭代的次数,作者在文中是这么解释的,根据kitti数据集上的统计,将kitti点云场景中划分为 12 × 12 12 \times 12 12×12大小的patch时,每个patch中最多含有三个目标,因此,GRU迭代的次数就设置为3.每次迭代计算一个目标边界框。当patch中包含的目标数小于3时,网络会倾向于预测一个位于patch之外的目标边界框。(这句话可以理解为: 当patch中不足3个目标是,会使用一个位于patch之外的边界框来和网络预测的三维边界框来绑定预测)。

image-20211215215228895

此外,作者还提出了一个更加轻量的模型,就是省略一个坐标变化,直接使用GRU的输出来做预测。

流程讲完之后来看一下作者的实验效果.

image-20211215215053764

上表中的实验结果可以看出,这个结果并不怎么样,而且作者给出的结果还是在kitti验证集上的结果。拿自己验证集上的结果于别人测试集比较都比不过。。。。。。。

相比于其他文章,可能作者在速度和精度上达到了一个平衡吧。在时使用Lidar的方法中,速度比本文快的可能精度比不上作者,精度比本文高度速度又慢。但是本文的精度时建立在验证集的基础上,如果放在测试集撒谎给你的话,应该是比不过Complex-YOLO的。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-16 17:40:43  更:2021-12-16 17:42:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年9日历 -2024/9/28 19:23:40-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码