| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【2D/3D目标检测】PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud阅读笔记(2019) -> 正文阅读 |
|
[人工智能]【2D/3D目标检测】PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud阅读笔记(2019) |
1、为什么要做这个研究(理论走向和目前缺陷) ? 摘要 1、引言 2、相关研究 3、PointRCNN 第一阶段利用pointnet++为每个3D点生成特征向量,基于此特征向量做前背景点分割(focal loss),同时每个3D点都预测一个3D候选框。为每个3D点预测3D候选框时,只对前景点预测的3D候选框计算回归损失。为了限制每个前景点预测3D候选框的范围,首先将每个前景3D点的二维(x-z)临近范围分成不同的网格(bin),预测的3D框有两类不同的损失函数,第一类损失函数用于判断目标中心点处于这些bin中的哪一个以及朝向属于哪个bin(交叉熵损失),第二类损失函数判断用于计算相对这个预测的目标中心点所在的bin的目标的中心偏移和尺寸、中心点高度和相对bin内中心线朝向的偏移(l1损失)。下式为一个点预测目标中心(x,y,z)的预测targets: 一个前景3D点预测3D框的朝向theta也用了基于bin的损失,即先把朝向范围分成多个bin,先大致确定朝向属于哪个bin,再细致确定朝向相对这个bin中心朝向的偏移。预测3D框的长宽和高,以及中心点的高度时的targets是一个相对预定义的长宽和高,以及中心点的高度的偏差,用的也是L1损失。 总的损失表达式如下: 由于一个目标有多个前景点,每个前景点都预测一个3D框,太多了,故要基于BEV视角下有向的IOU做NMS,训练时保留前300个候选框,测试时保留100个候选框。 3.2 点云区域池化(Point cloud region pooling) 3.3 标准3D框回归细化 之后把这些经过标准化的一个3D候选框的点坐标输入到一个MLP生成针对每个点的局部特征,然后生成的每个点的局部特征和第一阶段生成的每个点的特征连接在一块。 4 实验 4.3 消融研究 下图消融实验结果比较了在第一阶段使用所提出的基于bin的3D框回归损失(BB-loss)的作用 一些可视化结果: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 22:41:09- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |