IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> Automatic Mapping of Tailored Landmark Representations for Automated Driving and Map Learning 论文阅读 -> 正文阅读

[数据结构与算法]Automatic Mapping of Tailored Landmark Representations for Automated Driving and Map Learning 论文阅读

ICRA 2021 论文链接
源代码 无

1 速读

1.1 论文试图解决什么问题?这是否是一个新的问题?

高精度地图的高维语义信息(mask)的自动构建问题;是个较新的问题,没有被广泛的解决,问题在于高维度的表示和高成本中间的矛盾;
用途为对交通语义信息自动构建,从人力操作转化为程序自动构建+人工修正误检测;

1.2 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?

各种语义目标的构建方法;object SLAM中的表示;

1.3 文章的贡献是什么?

利用雷达给出的深度和朝向+语义信息,解决了单目情况下的地图语义元素的检测+追踪+建图这一整套流程;
对交通标识+交通灯+杆子建模,定位精度<10cm,大小精度<5cm,朝向MAE<6°;
①对语义用精简的方式建模;
②语义信息+雷达数据从单帧中恢复语义目标的而深度和朝向;
③data association方法;
④多视角landmark估计方法;

1.4 文章解决方案的关键是什么

1.5 实验如何设计?实验结果足够论证其效果吗?

没有合适的benchmark,无法推广到KITTI数据集,所以用自己的车测量了三个具有挑战性的数据;
采集车配置:4096 × 1536 pixels that is triggered with 10 Hz when the Velodyne VLS-128 Alpha Prime lidar;
Single Measurement Precision:单帧测量准确度,应该是只用雷达信息+一帧信息恢复,为了说明单帧测量的精度很高满足使用需求;
Map Optimization Results:

1.6 数据集是什么?

1.7 还会存在什么问题

作者conclution:
1.将语义信息和位姿一同优化
我觉得:
2.其他道路信息怎么办?
3.没有合适的benchmark

2 主要内容

请添加图片描述

2.1 系统框架

整个思路有点像SfM,通过点云流和视频流恢复场景中的路标,路灯,路杆等信息;
①预处理得到需要的信息;
②滤除不好的数据并利用雷达测量做深度估计;
③恢复出语义的参数化表示;
④进行帧间关联,并优化地图信息;

2.2 参数化

2.2.1 预处理

语义网络得到mask和bounding box+视觉SLAM系统得到准确位姿;
得到:语义测量 D k \mathcal{D}_k Dk?,类别标签 c m c_m cm?,bounding box左上和右下的图像坐标 d T L / B R m d_{TL/BR}^m dTL/BRm?,雷达点云 L k \mathcal{L}_k Lk?,每帧的位姿 T k T_k Tk?;

2.2.2 pre-filtering

①过滤掉重复检测到的landmarks,bounding box的IoU>10%就是重复(这阈值也太低了吧?);
②bounding box需要足够优秀,mask占据bounding box的比例>30%;

2.2.3 深度估计

雷达点云投影到像素平面并结合mask得到深度;
由于雷达和相机的安装位置不完全相同,所以两者观测到的东西不会完全相同,如下图所示:路牌上有来自后方汽车的点云信息,是因为在雷达的位置可以绕过路牌探测到后方车辆,但是投影到像素平面被认为是路牌的深度了;

在这里插入图片描述
解决方法为利用DBSCAN algorithm对雷达点云进行聚类,在投影时只关注具有最近距离的那个聚类点云的数据;

2.2.4 参数表示

路杆、路灯:直立部分用圆柱体表示:位置xyz,宽w,高h;
标志:用方框表示:位置xyz,宽w,高h,多了一个z方向的朝向角 φ \varphi φ;
在这里插入图片描述
①求解点云中心 x L x_{\mathcal{L}} xL?
x L , θ = a r g m i n x L , θ ∑ l i ∈ L k m ρ ( ∣ ∣ l i , θ ? x L , θ ∣ ∣ 2 ) x_{\mathcal{L},\theta}=\underset{x_{\mathcal{L},\theta}}{argmin}\sum_{l_i\in \mathcal{L}_k^m}\rho(||l_{i,\theta}-x_{\mathcal{L},\theta}||^2) xL,θ?=xL,θ?argmin?li?Lkm??ρ(li,θ??xL,θ?2)②将点云中心 x L x_{\mathcal{L}} xL?投影到观测方向 d C d_C dC?上得到真正的中心 x x x(这个思想对构建object很有帮助!!):
这样做是因为:
首先,观测到的点云肯定是真实物体的一个侧面,无法正确描述物有轮廓物体的空间位置;
其次,物体的真实中心很可能在2d bounding box的中心所在的投影方向上;
这样即可通过投影方向+点云中心两个条件大致确定物体的中心了,如下图:
在这里插入图片描述
图中的平面表示垂直于地面,过 x L x_{\mathcal{L}} xL?的平面,法向量可以通过观测方向的投影确定:
n = d G = 1 d C , 1 2 + d C , 2 2 [ d C , 1 d C , 2 0 ] n = d_G = \frac{1}{\sqrt{d_{C,1}^2+d_{C,2}^2}} \begin{bmatrix}d_{C,1} \\ d_{C,2} \\ 0 \end{bmatrix} n=dG?=dC,12?+dC,22? ?1????dC,1?dC,2?0????
根据法向量可以确定中心 x x x
x = x L T ? n d C T ? n d C = x L T ? d G d C T ? d G d C x = \frac{x_{{\mathcal{L}}^T}\cdot n}{{d_C}^T\cdot n}d_C = \frac{x_{{\mathcal{L}}^T}\cdot d_G}{{d_C}^T\cdot d_G}d_C x=dC?T?nxLT??n?dC?=dC?T?dG?xLT??dG??dC?
③长宽wh确定,根据bounding box和平面的交点坐标确定;
交通灯和路杆:
x T L / B R = x T ? d G d T L / B R T ? d G = d T L / B R x_{TL/BR} = \frac{x^T\cdot d_G}{d_{TL/BR}^T\cdot d_G} = d_{TL/BR} xTL/BR?=dTL/BRT??dG?xT?dG??=dTL/BR?
标志:其中 n L n_{\mathcal{L}} nL?是由点云拟合的平面向量
x T L / B R = x T ? n L d T L / B R T ? n L = d T L / B R x_{TL/BR} = \frac{x^T\cdot n_{\mathcal{L}}}{d_{TL/BR}^T\cdot n_{\mathcal{L}}} = d_{TL/BR} xTL/BR?=dTL/BRT??nL?xT?nL??=dTL/BR?
标志还多一个朝向角,通过地面法向量计算:
φ = a r c c o s ( ? d D T ? n L ) \varphi = arccos(-d_D^T\cdot n_{\mathcal{L}}) φ=arccos(?dDT??nL?)
得到bounding box在空间中的坐标后可用这些坐标来计算wh;

2.2.5 bounding box测量

较远处的object由于雷达测量点稀疏,对bounding box中少于5个雷达投影的情况,只用该bounding box去优化中心 x x x
2.3 数据关联
由于雷达在近处表现更好,所以选择时间上倒序的方式(倒退行驶),匹配策略采用匈牙利算法;
2.4 地图优化
从所有恢复的landmark中计算出最有的结果,做法是每有一个新关键就优化一次地图(为了更好地实现匹配)
所谓地图优化即从所有结果中算一个代价最小的:参数为 θ ∈ { x , y , z , w , , h , φ } \theta\in\{x,y,z,w,,h,\varphi\} θ{x,y,z,w,,h,φ};
? ^ i , θ = a r g m i n ? i , θ ∑ p i ∈ A ? ^ i ρ ( ∣ ∣ ? i , θ ? p j , θ ∣ ∣ 2 ) \hat{\ell}_{i, \theta} = \underset{\ell_{i,\theta}}{argmin}\sum_{p_i\in\mathcal{A}_{\hat{\ell}_{i}}}\rho(||\ell_{i, \theta}-p_{j,\theta}||^2) ?^i,θ?=?i,θ?argmin?pi?A?^i???ρ(?i,θ??pj,θ?2)

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-06-14 22:53:04  更:2022-06-14 22:54:10 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 2:00:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码