| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection -> 正文阅读 |
|
[人工智能]Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection |
目录 3.1. Lane and anchor representation 3.8. Anchor fifiltering for speed effificiency 1.Introduction作者提出了一个实时、高性能的车道线检测算法,将其命名为LaneATT。 该方法基于anchor实现,且应用了注意力机制,轻量级版本的推理速度达到250FPS 全局信息可能对推断其位置至关重要,特别是在遮挡、缺失车道标记等情况下。因此,这项工作提出了一种新的基于锚定的注意机制来聚合全局信息 2. Related workSegmentation-based methods. Row-wise classifification methods. 前人不足:牺牲精度换取速度,还有的代码不公开 我们提出了一种比现有的最先进的方法更快、更准确的方法。此外还公布完整代码 3. Proposed methodLaneATT:单阶段的model 从上图中可以看出,该算法将backbone的输出结果进行池化操作,以提取每个anchor的特征;将提取到的特征与注意力模块产生的全局特征进行融合,以解决遮挡、光照等原因导致车道线检测不到的问题;融合后的特征 作为全连接层的输入,全连接层输出车道线的置信度和相关参数。 3.1. Lane and anchor representationLane的anchor表征方式与Line-CNN的方式一致。如上图所示,首先将特征图均分为一定大小的网格。然后,一条lane由起始点s和结束点e,以及方向a组成。也就是一条lane由起始点按照一定方向到结束点的所有2d坐标组成。 ? 3.2. Backbone ?式子中,x_orig,y_orig是起始点的坐标,θ 、是线的角度方向。这个公式的意思也比较好理解,就是按照网格y坐标找出line上的对应x坐标,这样就可以 挑出固定长度的特征出来,长度为特征图F的高度。如果出现了y对应的x点坐标在特征图外,就采用0 padding的方式补齐。 3.4. Attention mechanism然后,将这些权重与局部特征相乘后相加,以产生相同维数的全局特征向量: 3.5. Proposal prediction3.7. Model trainingx坐标的共同指标(s‘和e’之间)的选择方式与车道距离(方程(5))相似,但使用e‘=egt而不是e’=min(eprop,egt),其中eprop和egt分别是建议及其相关的地面真相的最终指标。如果使用建议的 eprop中预测的结束索引,训练可能会通过收敛到退化解而变得不稳定(例如,eprop可能收敛到零)。 3.8. Anchor fifiltering for speed effificiency4. Experiments在[20]中提出的方法是唯一能与我们的速度相媲美的方法。由于FDR和FNR的指标在他们的工作中没有被报告,所以我们使用已发布的代码来计算它们,并报告了这些指标。虽然他们达到了很高的准确性,但FDR明显地很 高。例如,我们最高的FDR是5.64%(ResNet-122),而最低的是18.91%,几乎是它的4倍。 4.2. CULane? 与[20]相比,我们最轻量级的型号(ResNet-18)比它们最大的(ResNet-34)多出F1的3%,同时要快得多(在同一台机器上250vs175FPS) 4.3. LLAMAS4.4. Effificiency trade-offs锚的数量可以减少为一个轻微的提高的效率,而没有一个大的F1下降。然而,如果减少的幅度太大,F1就会开始大幅下降。此外,如果使用了太多的锚,效果也会降低,这可能是不必要的锚干扰训练的结果。输入大小的结果相似,尽管mac下降幅度更大。锚的数量和输入大小的最大影响是对训练时间。 4.5. Ablation study第一行包含了标准LaneATT的结果,而下面的行显示了略微修改的版本的结果。 在第二行中,删除基于锚的pooling,使用选择Line-CNN[13]特征的相同过程(即每个锚只使用特征图中单个点的特征)。 在第三种方法中,不是使用一对全连接层(Lreg和Lcls)进行最终预测,而是使用了三对(六层),每个边界使用一对(左、下或右)。 第四个是用交叉熵代替焦点损失,最后一个是去除注意机制。 当删除基于锚点的池化过程时,性能的大量下降显示了它的重要性。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 0:48:55- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |