[人工智能] 【AI视野·今日Robot 机器人论文速览第三十三期】Thu 21 Apr 2022

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【AI视野·今日Robot 机器人论文速览第三十三期】Thu 21 Apr 2022 -> 正文阅读

[人工智能]【AI视野·今日Robot 机器人论文速览第三十三期】Thu 21 Apr 2022

AI视野·今日CS.Robotics 机器人学论文速览
Thu, 21 Apr 2022
Totally 13 papers
👉上期速览?更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

CALI: Coarse-to-Fine ALIgnments Based Unsupervised Domain Adaptation of Traversability Prediction for Deployable Autonomous Navigation
Authors Zheng Chen, Durgakant Pushp, Lantao Liu
可遍历性预测是自主导航的基本感知能力。不同领域数据的多样性给感知模型的预测性能带来了巨大的差距。在这项工作中，我们通过提出一种新的从粗到细的无监督域适应 UDA 模型 CALI 来努力减少差距。我们的目标是以高数据效率迁移感知模型，消除昂贵的数据标记，并提高从容易获得的源域到各种具有挑战性的目标域的适应过程中的泛化能力。我们证明了粗对准和细对准的组合可以相互有益，并进一步设计了先粗再细对准的过程。这项提议的工作将理论分析和算法设计联系起来，从而产生了一个高效的 UDA 模型，并且训练简单而稳定。我们在几个具有挑战性的领域适应设置中展示了我们提出的模型相对于多个基线的优势。

Assembly Planning from Observations under Physical Constraints
Authors Thomas Chabal, Robin Strudel, Etienne Arlaud, Jean Ponce, Cordelia Schmid
本文解决了使用从单张照片中提取的信息来复制具有已知形状和外观的未知图元组合的问题，该信息通过现成的目标检测和姿势估计程序进行。所提出的算法使用物理稳定性约束、凸优化和蒙特卡洛树搜索的简单组合来将装配计划为由 STRIPS 运算符表示的拾取和放置操作序列。它是有效的，最重要的是，对于任何真实机器人系统中不可避免的目标检测和姿态估计误差具有鲁棒性。

Differentiable Collision Avoidance Using Collision Primitives
Authors Simon Zimmermann, Matthias Busenhart, Simon Huber, Roi Poranne, Stelian Coros
机器人运动规划的一个核心方面是避免碰撞，目前正在使用多种不同的方法。基于优化的运动规划是一种方法，通常严重依赖于机器人和障碍物之间的距离计算。这些计算很容易成为瓶颈，因为它们不能很好地适应机器人或环境的复杂性。为了提高性能，许多不同的方法建议使用碰撞图元，即近似更复杂刚体的简单形状，并且更容易计算往返距离。但是，每对原语都需要自己的专用代码，并且已知某些对存在数字问题。在本文中，我们提出了一种易于使用、统一处理各种原语的方法。我们将距离计算公式化为一个最小化问题，我们迭代地解决这个问题。我们展示了如何对这个最小化问题进行导数，使其能够无缝集成到轨迹优化方法中。我们的实验表明，我们的方法在时间和轨迹质量方面表现良好。

Dynamic Free-Space Roadmap for Safe Quadrotor Motion Planning
Authors Junlong Guo, Zhiren Xun, Shuang Geng, Yi Lin, Chao Xu, Fei Gao
面向自由空间的路线图通常会生成一系列凸几何图元，它们构成了运动规划的安全区域。但是，这种路线图假定为静态环境。这种假设使其无法处理动态障碍并限制其应用。在本文中，我们提出了一个动态自由空间路线图，它为安全的四旋翼运动规划提供了可行的空间和导航图。我们的路线图是通过不断播种和提取环境中的自由区域来构建的。为了使我们的地图适应具有动态障碍物的环境，我们将与障碍物相交的多面体逐步分解为无障碍区域，同时图形也通过我们精心设计的机制进行更新。

Learned Monocular Depth Priors in Visual-Inertial Initialization
Authors Yunwen Zhou, Abhishek Kar, Eric Turner, Adarsh Kowdle, Chao X. Guo, Ryan C. DuToit, Konstantine Tsotsos
视觉惯性里程计 VIO 是当今学术界和工业界大多数 AR VR 和自主机器人系统的姿态估计主干。然而，这些系统对传感器偏差、重力方向和公制比例等关键参数的初始化非常敏感。在很少满足高视差或可变加速度假设的实际场景中，例如悬停的空中机器人，智能手机 AR 用户没有用手机做手势，经典的视觉惯性初始化公式经常变得不适或无法有意义地收敛。在本文中，我们专门针对这些在野外使用中至关重要的低激发场景的视觉惯性初始化。我们建议通过结合新的基于学习的测量作为更高级别的输入来规避运动 SfM 初始化中经典视觉惯性结构的限制。我们利用学习到的单目深度图像单深度来约束特征的相对深度，并通过联合优化其尺度和移位将单深度升级到公制尺度。我们的实验表明，与视觉惯性初始化的经典公式相比，问题条件得到了显着改进，并且在公共基准测试中，特别是在运动受限场景下，相对于现有技术，我们的实验显示了显着的准确性和鲁棒性改进。

Importance is in your attention: agent importance prediction for autonomous driving
Authors Christopher Hazard, Akshay Bhagat, Balarama Raju Buddharaju, Zhongtao Liu, Yunming Shao, Lu Lu, Sammy Omari, Henggang Cui
轨迹预测是自动驾驶中的一项重要任务。最先进的轨迹预测模型通常使用注意力机制来模拟代理之间的交互。在本文中，我们展示了来自此类模型的注意力信息也可用于衡量每个代理相对于自我车辆未来计划轨迹的重要性。

Sim-2-Sim Transfer for Vision-and-Language Navigation in Continuous Environments
Authors Jacob Krantz, Stefan Lee
视觉和语言导航 VLN 的最新工作提出了两种具有不同现实主义的环境范式，标准 VLN 设置建立在导航被抽象化的拓扑环境上，以及代理必须使用低级动作导航连续 3D 环境的 VLN CE 设置。尽管共享高级任务甚至底层指令路径数据，但 VLN CE 的性能明显落后于 VLN。在这项工作中，我们通过将代理从 VLN 的抽象环境转移到 VLN CE 的连续环境来探索这一差距。我们发现这种 sim 2 sim 传输非常有效，比 VLN CE 中的现有技术提高了 12 成功率。虽然这证明了这个方向的潜力，但转移并没有完全保留代理在抽象设置中的原始性能。

Risk-Averse Receding Horizon Motion Planning
Authors Anushri Dixit, Mohamadreza Ahmadi, Joel W. Burdick
本文研究了在存在随机、动态障碍的情况下，具有不确定动态的智能体的风险规避后退水平运动规划问题。我们提出了一种模型预测控制 MPC 方案，该方案使用连贯的风险度量来制定避障约束。为了处理状态动态中的干扰或过程噪声，状态约束以风险意识的方式收紧，以提供干扰反馈策略。我们还提出了一种航路点跟踪算法，该算法使用所提出的 MPC 方案进行离散分布，并证明其风险敏感的递归可行性，同时保证有限时间的任务完成。我们进一步研究了一些常用的连贯风险度量，即条件风险价值 CVaR、熵风险价值 EVaR 和 g 熵风险度量，并提出了在 MPC 中易于处理的合并。

HRPose: Real-Time High-Resolution 6D Pose Estimation Network Using Knowledge Distillation
Authors Qi Guan, Zihao Sheng, Shibei Xue
实时 6D 对象姿态估计对于许多现实世界的应用至关重要，例如机器人抓取和增强现实。为了实时从 RGB 图像中实现准确的对象姿态估计，我们提出了一种有效且轻量级的模型，即高分辨率 6D 姿态估计网络 HRPose。我们采用高效且小型的 HRNetV2 W18 作为特征提取器，以减少计算负担，同时生成准确的 6D 姿势。与最先进的模型相比，我们的 HRPose 只有 33 倍的模型大小和更低的计算成本，实现了可比的性能。此外，通过输出和特征相似性蒸馏将知识从大型模型转移到我们提出的 HRPose，我们的 HRPose 的性能在有效性和效率上得到了提高。

Vision System of Curling Robots: Thrower and Skip
Authors Seongwook Yoon, Gayoung Kim, Myungpyo Hong, Sanghoon Sull
我们建立了一个冰壶机器人的视觉系统，可以预期与人类冰壶运动员一起玩。基本上，我们分别为投掷机器人和跳跃机器人构建了两种类型的视觉系统。首先，投掷机器人驶向冰壶片的给定点以释放石头。我们在投掷机器人中的视觉系统在二维冰壶片上初始化 3DoF 位姿并更新位姿以决定投掷石块的决定。其次，跳跃机器人站在投掷机器人的对面，监控比赛状态以做出战略决策。我们在跳跃机器人中的视觉系统可以精确识别卷发纸上的每一块石头。由于视点非常透视，许多石头相互遮挡，因此很难估计石头的准确位置。因此，我们使用透视霍夫变换识别石头手柄轮廓的椭圆以找到石头的确切中点。此外，我们对抛掷的石头进行跟踪，以生成用于冰况分析的轨迹。最后，我们在两个移动机器人上实现了我们的视觉系统，并成功地执行了单回合甚至是谨慎的游戏。

Lie Algebraic Cost Function Design for Control on Lie Groups
Authors Sangli Teng, William Clark, Anthony Bloch, Ram Vasudevan, Maani Ghaffari
本文通过在李代数中设计控制目标，提出了李群的控制框架。由于其非线性性质和系统参数化的困难，对李群的控制具有挑战性。现有的在李群上设计控制目标然后为控制器设计推导梯度的方法并不简单，并且会导致跟踪控制的收敛缓慢。我们表明，使用适当的左不变度量，将成本函数的梯度设置为李代数中的跟踪误差会导致二次 Lyapunov 函数，该函数能够实现全局指数收敛。在 PD 控制案例中，我们展示了即使在 SO 3 中初始误差接近 pi 时，我们的控制器也可以保持指数收敛速度。我们还展示了这个提出的框架在轨迹优化中的优点。

From Spoken Thoughts to Automated Driving Commentary: Predicting and Explaining Intelligent Vehicles' Actions
Authors Daniel Omeiza, Sule Anjomshoae, Helena Webb, Marina Jirotka, Lars Kunze
评论驾驶是一种技术，驾驶员可以用语言表达他们的观察、评估和意图。通过说出自己的想法，学习型和专业型驾驶员都能够更好地了解和了解周围环境。在智能车辆环境中，自动驾驶评论可以提供有关驾驶行为的可理解解释，从而在具有挑战性和安全关键场景的驾驶操作中为驾驶员或最终用户提供帮助。在本文中，我们进行了一项实地研究，其中我们在城市环境中部署了一辆研究车辆来获取数据。在收集车辆周围环境的传感器数据时，我们使用大声思考协议从驾驶教练那里获得驾驶评论。我们对驾驶评论进行了分析，发现了一种解释方式，即司机先发表观察，宣布计划，然后发表一般性评论。他还发表了反事实的评论。我们成功地演示了如何使用简单的基于树的方法自动生成遵循这种风格的事实和反事实自然语言解释。与横向动作（例如变道）相比，人类法官认为对纵向动作（例如停止和移动）的生成解释更容易理解和合理。

Embodied Navigation at the Art Gallery
Authors Roberto Bigazzi, Federico Landi, Silvia Cascianelli, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara
经过训练以探索和导航室内逼真环境的具体代理在标准数据集和基准测试中取得了令人印象深刻的结果。到目前为止，实验和评估已经涉及办公室、公寓和房屋等家庭和工作场景。在本文中，我们构建并发布了一个具有独特特征的新的3D空间，它是一个完整的艺术博物馆。我们将此环境命名为 ArtGallery3D AG3D 。与现有的 3D 场景相比，采集到的空间更宽敞，视觉特征更丰富，并且提供了非常稀疏的占用信息。对于通常在拥挤的家庭环境中训练并具有大量占用信息的基于占用的代理而言，此功能具有挑战性。此外，我们还标注了博物馆内主要景点的坐标，例如绘画、雕像和其他物品。由于这个手动过程，我们在这个新空间内为 PointGoal 导航提供了新的基准。该数据集中的轨迹远比 Gibson 和 Matterport3D 中现有的地面实况导航路径复杂和冗长。我们使用我们的新评估空间进行广泛的实验评估，并证明现有方法很难适应这种情况。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com