| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文阅读】Causal Imitative Model for Autonomous Driving -> 正文阅读 |
|
[人工智能]【论文阅读】Causal Imitative Model for Autonomous Driving |
Sensor/组织: EPFL Sharif University of Technology
1. Motivation模仿学习是一种通过利用来自专家驾驶员演示的数据来学习自动驾驶策略的强大方法。然而,通过模仿学习训练的驾驶策略忽略了专家演示的因果结构会产生两种不良行为:inertia and collision 问题场景参考文献[9] 提出:
而这篇文章主要解决的就是第三点 → 提出 causal model,接下来是更为明确的问题场景 inertia problem在这篇 [9] 提出的问题并没有针对性解决 ICCV2019: Exploring the Limitations of Behavior Cloning for Autonomous Driving 这篇文章主要把inertia problem看做是因果混淆问题 causality 在[10] 中提出了这点但是因为算法复杂度与latent variable是指数级别增长,所以对于自动驾驶来说 [10] 解法可能还是太贵了
collision problem主要是训练好的agent 并没有躲避其他车辆,就是和其他车辆撞上了 总结起来,论文指出应该要同时考虑这两个东西,因为如果分开考虑的话,就很有可能为了避免一方而牺牲一方,例如:为了解决inertia问题,一种trick是可以在某些情况下加速 开油门; 然而,这样很有可能导致撞车 Contribution简单图 主要contribution 在高亮 cause discovery 处 在本文中,我们提出了因果模仿模型(CIM)来解决 inertia 和 collision problem。 CIM 显式发现因果模型并利用它来训练策略。 具体来说,CIM 将输入分解为一组 latent variables ,选择因果变量,并通过利用所选变量确定下一个位置。 我们的实验表明,我们的方法在惯性和碰撞率方面优于以前的工作。 此外,由于利用了因果结构,CIM 将输入维度缩小到只有两个,因此可以在几次设置中适应新环境。 2. Methodnotation:
模仿学习最简单的形式就是行为克隆 behavior cloning,也把policy learning问题变成了一个监督学习,在这个过程中 是 π \pi π 直接将 O O O 映射得到 T \mathcal T T,然后再通过一个low-level controller来进行跟踪轨迹即可 根据[10] 的启发,首先把专家的demonstrations 看做一个 sequential decision-making process,所以每一个观测 O t O^t Ot 都可以分解 disentangled into some generative factors Z t = [ Z 1 t , Z 2 t , … , Z k t ] Z^t=[Z^t_1,Z^t_2,\dots,Z^t_k] Zt=[Z1t?,Z2t?,…,Zkt?] 其中 k k k 就是生成出来的因子个数,每一步时间t 都有这样的factor对应。为了规划未来的轨迹:
2.1 输入上帝视角的鸟瞰图和提取其他agent后的渲染图,简述即两幅图 2.2 框架主要分为两个部分:
2.3 输出各自的两部分输出由框架图可知
3. 实验指标:
用DIM [32],RIP [12] 做对比实验 外加两组消融实验,把CIM里面的cause selector直接换成 MLP进行再输出速度的 CIM-MLP;还有感知模型,直接使用原有的VAE而不是 β \beta β-VAE的 CIM-entangled 温馨提示RIP: ICML2020: Can Autonomous Vehicles Identify, Recover From, and Adapt to Distribution Shifts?
4. Conclusion贡献如上,主要是做了一层分解的latent variables 选择因果变量,limitation也指出:
碎碎念自己提出一个问题 and 解决一个问题,另外标准也由自己定,比较特别的是关于causal selector的选择和使用,就是没对着代码看 还没特别理解这个步骤,但是大概知道了 噢,原来可以这么玩。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 17:00:00- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |