AI视野·今日CS.Robotics 机器人学论文速览
Daily Robotics Papers
|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Robust Online Epistemic Replanning of Multi-Robot Missions Authors Lauren Bramblett, Branko Miloradovic, Patrick Sherman, Alessandro V. Papadopoulos, Nicola Bezzo 随着多机器人系统 MRS 变得更加经济实惠且计算能力不断增强,它们为环境监测、水下检查或太空探索等复杂应用提供了显着的优势。然而,解决这些应用领域中潜在的通信丢失或通信基础设施不可用的问题仍然是一个悬而未决的问题。许多适用的 MRS 研究假设系统可以通过邻近规则和编队控制或通过设计一个框架来维持通信,用于分离和遵守长时间断开连接的预定计划。后一种技术使 MRS 更加高效,但故障和环境不确定性可能会对整个系统产生多米诺骨牌效应,特别是当任务目标复杂或时间敏感时。为了解决这个问题,我们提出的框架有两个主要阶段:一是集中式规划器,通过奖励机器人之间的间歇性会合来分配任务任务,以减轻任务执行期间不可预见事件的影响;二是去中心化重新规划方案,利用认知规划来形式化信念传播和蒙特卡罗树搜索在给定分布式理性信念更新的情况下进行策略优化。 |
| Complete and Near-Optimal Robotic Crack Coverage and Filling in Civil Infrastructure Authors Vishnu Veeraraghavan, Kyle Hunte, Jingang Yi, Kaiyan Yu 我们提出了一种基于传感器的同步检测和足迹覆盖 SIFC 规划和控制设计,并应用于自主机器人裂缝测绘和填充。 SIFC 问题的主要挑战在于将用于测绘的完整传感与用于填充覆盖任务的机器人足迹相结合。最初,我们假设已知的目标信息(例如裂纹)并采用经典的单元分解方法来实现工作空间的完整传感覆盖和使用最低成本路线的完整机器人足迹覆盖。随后,我们将算法推广到处理未知的目标信息,允许机器人在进行机器人足迹覆盖的同时在线扫描并增量构建目标图。实证实验证明,在线多项式时间 SIFC 规划算法最大限度地减少了机器人总行进距离,保证了整个工作空间的完整传感覆盖,并实现了接近最优的机器人足迹覆盖。对于演示的应用,我们设计了与规划的机器人轨迹协调的喷嘴运动控制,以有效填充机器人足迹内的所有裂缝。实验结果说明了算法的设计、性能和比较。 |
| Predicting UAV Type: An Exploration of Sampling and Data Augmentation for Time Series Classification Authors Tarik Crnovrsanin, Calvin Yu, Dane Hankamer, Cody Dunne 无人机正在变得越来越普遍,并且具有许多生产用途。然而,它们的日益普及引发了安全问题,我们如何保护受限空域了解无人机的类型对于确定其所带来的任何潜在风险大有帮助。例如,固定翼飞行器可以在更长的距离上承载更大的重量,从而可能构成更重大的威胁。本文提出了一种机器学习模型,用于将无人机分类为四旋翼、六旋翼或固定翼。我们的方法有效地应用了长短期记忆 LSTM 神经网络来进行时间序列分类。我们进行了实验来测试改变时间戳采样方法和解决类别分布不平衡的效果。通过这些实验,我们确定了表现最好的采样和类别不平衡修复方法。对 10 倍数据的宏观 f 分数进行平均,我们发现大多数四旋翼飞行器类别的预测效果良好,为 98.16 ,并且尽管存在极端的类别不平衡,该模型也可以正确预测大多数固定翼飞行 73.15 。由于多旋翼飞行器的相似性,六旋翼飞行器实例经常被错误分类为四旋翼飞行器 42.15 。然而,某些方法的结果仍然相对稳定,这促使我们分析和报告它们的权衡。 |
| Rational Linkages: From Poses to 3D-printed Prototypes Authors Daniel Huczala, Johannes Siegele, Daren A. Thimm, Martin Pfurner, Hans Peter Schr cker 本文介绍了一套工具,可以简化单环有理运动链的合成和快速原型设计。它允许用户对最多四个给定姿势执行合理的运动插值,并生成可以执行该运动的连杆的设计参数。该软件包还提供输出的可视化并执行自碰撞分析,并可以调整设计参数。 |
| Safe Hybrid-Action Reinforcement Learning-Based Decision and Control for Discretionary Lane Change Authors Ruichen Xu, Xiao Liu, Jinming Xu, Yuan Lin 自动变道是先进驾驶辅助系统的一项关键功能,可以提高交通效率并减少事故发生率。然而,自动驾驶汽车在复杂环境下的安全驾驶仍然面临挑战。如何进行安全、适当的变道是自动驾驶领域的热门研究课题。目前,很少有论文考虑强化学习在自动变道场景中的安全性。我们首次将安全混合动作强化学习引入自主变道中,并提出了带有 PID 拉格朗日 PASAC PIDLag 算法的参数化 Soft Actor Critic。此外,我们对参数化 Soft Actor Critic PASAC 进行了比较分析,它是 PASAC PIDLag 的不安全版本。这两种算法都用于训练自动驾驶车辆的变道策略,以输出离散的变道决策和纵向车辆加速度。我们的仿真结果表明,在交通密度为每公里 15 辆车 15 veh km 的情况下,PASAC PIDLag 算法表现出卓越的安全性,碰撞率为 0 ,优于碰撞率为 1 的 PASAC 算法。泛化评估的结果表明,在低流量密度水平下,PASAC PIDLag 和 PASAC 算法都能熟练地实现 0 碰撞率。 |
| Learning Quadrupedal Locomotion with Impaired Joints Using Random Joint Masking Authors Mincheol Kim, Ukcheol Shin, Jung Yup Kim 四足机器人凭借其灵活的运动能力,在从结构化环境到复杂恶劣地形的各种环境中发挥了至关重要的作用。然而,如果由于外部事故或内部故障而损坏,这些机器人很容易失去运动功能。在本文中,我们提出了一种新颖的深度强化学习框架,使四足机器人能够在关节受损的情况下行走。所提出的框架由三个部分组成:1 随机关节掩蔽策略,用于模拟受损关节场景;2 关节状态估计器,用于根据过去的观察历史预测当前关节状况的隐式状态;3 渐进式课程学习,允许单个网络进行正常步态和各种关节受损的步态。 |
| Structured Deep Neural Networks-Based Backstepping Trajectory Tracking Control for Lagrangian Systems Authors Jiajun Qian, Liang Xu, Xiaoqiang Ren, Xiaofan Wang 深度神经网络 DNN 因其出色的逼近能力而越来越多地被用于学习控制器。然而,它们的黑盒性质对闭环稳定性保证和性能分析提出了重大挑战。在本文中,我们介绍了一种基于结构化 DNN 的控制器,用于使用支持技术对拉格朗日系统进行轨迹跟踪控制。通过正确设计神经网络结构,所提出的控制器可以确保任何兼容神经网络参数的闭环稳定性。此外,还可以通过进一步优化神经网络参数来提高控制性能。此外,我们在控制器参数方面提供了明确的跟踪误差上限,这使我们能够通过正确选择控制器参数来实现所需的跟踪性能。此外,当系统模型未知时,我们提出了一种改进的拉格朗日神经网络 LNN 结构来学习系统动力学并设计控制器。我们表明,在存在模型逼近误差和外部干扰的情况下,仍然可以保证闭环稳定性和跟踪控制性能。 |
| Robustifying a Policy in Multi-Agent RL with Diverse Cooperative Behavior and Adversarial Style Sampling for Assistive Tasks Authors Tayuki Osa, Tatsuya Harada 对运动障碍人士的自主协助是自主机器人系统最有前途的应用之一。最近的研究报告了在医疗保健领域使用深度强化学习 RL 取得的令人鼓舞的结果。先前的研究表明,辅助任务可以表述为多智能体强化学习,其中有两个智能体,一个是看护者,一个是被看护者。然而,在多智能体强化学习中训练的策略通常对其他智能体的策略敏感。在这种情况下,经过培训的护理人员的政策可能不适用于不同的护理接受者。为了缓解这个问题,我们提出了一个框架,通过针对不同的护理接受者反应进行培训来学习强大的护理人员政策。在我们的框架中,不同的被护理者的反应是通过试验和错误自主学习的。此外,为了强化看护者的政策,我们提出了一种在训练期间以对抗性方式对看护者的反应进行采样的策略。我们使用辅助健身房中的任务评估了所提出的方法。 |
| Never-Ending Embodied Robot Learning Authors Wenqi Liang, Gan Sun, Qian He, Yu Ren, Jiahua Dong, Yang Cong 依靠大型语言模型LLM,实体机器人可以通过视觉观察执行复杂的多模态机器人操作任务,具有强大的泛化能力。然而,大多数视觉行为克隆代理在适应一系列具有挑战性的看不见的任务时都会遭受操作性能下降和技能知识遗忘的困扰。我们在这里用 NBCagent 在具身机器人中研究上述挑战,这是一种开创性的语言条件永无止境的行为克隆代理,它可以从技能特定和技能共享属性中不断学习新颖的机器人操作技能的观察知识。具体来说,我们建立了一个特定于技能的进化规划器来执行知识解耦,它可以不断地将新的技能特定知识从潜在和低等级空间嵌入到我们的 NBCagent 代理中。同时,我们提出了技能共享语义渲染模块和技能共享表示蒸馏模块,以有效传递抗遗忘技能共享知识,进一步从语义和表示方面解决旧技能的灾难性遗忘。最后,我们设计了一个连续的具体机器人操作基准,并且几个昂贵的实验证明了我们方法的显着性能。 |
| Model-Based Planning and Control for Terrestrial-Aerial Bimodal Vehicles with Passive Wheels Authors Ruibin Zhang, Junxiao Lin, Yuze Wu, Yuman Gao, Chi Wang, Chao Xu, Yanjun Cao, Fei Gao 地面和空中双模态飞行器因其跨域机动性而受到广泛关注。然而,它们的双峰动力学显着增加了运动规划和控制的复杂性,从而阻碍了未知环境中稳健且高效的自主导航。为了解决这个问题,我们开发了一个基于模型的地面航空双模态飞行器规划和控制框架。这项工作首先推导统一的动态模型和相应的微分平坦度。利用差分平坦度,提出了一种基于优化的轨迹规划器,该规划器同时考虑了解质量和计算效率。此外,我们基于所提出的统一动态模型,设计了一种使用非线性模型预测控制的跟踪控制器,以实现精确的轨迹跟踪和平滑的模式转换。 |
| DISORF: A Distributed Online NeRF Training and Rendering Framework for Mobile Robots Authors Chunlin Li, Ruofan Liang, Hanrui Fan, Zhengen Zhang, Sankeerth Durvasula, Nandita Vijaykumar 我们提出了一个框架 DISORF,能够对资源受限的移动机器人和边缘设备捕获的场景进行在线 3D 重建和可视化。为了解决边缘设备有限的计算能力和潜在的有限网络可用性,我们设计了一个框架,可以在边缘设备和远程服务器之间有效地分配计算。我们利用设备 SLAM 系统生成姿势关键帧并将其传输到远程服务器,远程服务器可以利用 NeRF 模型在运行时执行高质量 3D 重建和可视化。我们发现了在线 NeRF 训练的一个关键挑战,即简单的图像采样策略可能会导致渲染质量显着下降。我们提出了一种新颖的移位指数帧采样方法来解决在线 NeRF 训练的这一挑战。 |
| Learning to walk in confined spaces using 3D representation Authors Takahiro Miki, Joonho Lee, Lorenz Wellhausen, Marco Hutter 腿式机器人有潜力穿越复杂的地形并进入传统平台无法到达的有限空间,因为它们能够在行走时仔细选择立足点并灵活地调整身体姿势。然而,在现实世界应用程序中的稳健部署仍然是一个开放的挑战。在本文中,我们提出了一种使用强化学习和 3D 体积表示的腿部运动控制方法,以在受限和非结构化环境中实现稳健且多功能的运动。通过采用两层分层策略结构,我们利用高度稳健的低级策略的能力来遵循 6D 命令,并利用高级策略的能力来实现三维空间感知,以便在悬垂的障碍物下导航。我们的研究包括开发程序地形生成器来创建多样化的训练环境。我们在模拟和现实环境中进行了一系列实验评估,证明了我们的方法在有限的崎岖地形中控制四足机器人的有效性。 |
| Developing a Taxonomy of Elements Adversarial to Autonomous Vehicles Authors Mohammadali Saffary, Nishan Inampudi, Joshua E. Siegel 随着高度自动化车辆的部署率越来越高,它们发现自己处于越来越危险的境地。知道碰撞的后果对乘员、旁观者和财产的健康以及自动驾驶和邻近企业的生存能力具有重大意义,我们必须寻找更有效的方法来全面、可靠地训练自动驾驶汽车,以便更好地驾驶他们面临的复杂场景。因此,我们引入了可能导致性能不佳或系统故障的潜在对抗性因素的分类法,作为识别和阐明不太常见的风险的手段。该分类法可用于描述自动化故障的特征,并通过为导致脱离、碰撞或其他负面后果的事件提供更全面的分类系统来支持模拟和现实世界的培训工作。该分类法是根据真实碰撞事件创建并进行测试的,以确保全面覆盖,类别重叠最小,遗漏很少。 |
| From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic Perching Authors Bryan Habas, Bo Cheng 倒立着陆是许多动物飞行者的常规行为。然而,掌握这一壮举对机器人飞行者来说是一个相当大的挑战,特别是通过快速的身体旋转或翻转以及反重力着陆来执行动态栖息。果蝇的倒转着陆表明,光流感觉与身体翻转的精确触发和控制密切相关,从而导致各种成功的着陆行为。基于这些知识,我们的目标是通过开发适用于任意天花板接近条件的控制策略来复制小型四轴飞行器中的苍蝇着陆行为。首先,我们在模拟中采用强化学习来优化各种接近天花板的速度和方向的离散感觉运动对。接下来,我们将感觉运动对转换为连续增强光流空间中的两级控制策略。控制策略由第一阶段翻转触发策略(采用一类支持向量机)和第二阶段翻转动作策略(作为前馈神经网络实现)组成。为了将反向着陆策略转移到物理系统,我们利用域随机化和系统识别技术来实现零样本模拟到真实转移。 |
| Navigation and Control of Unconventional VTOL UAVs in Forward-Flight with Explicit Wind Velocity Estimation Authors Mitchell Cohen, James Richard Forbes 本文针对一类非常规垂直起降垂直起降无人机在前飞条件下的状态估计和控制问题提出了一种解决方案。紧耦合状态估计方法用于估计飞机导航状态、传感器偏差和风速。状态估计是使用不变扩展卡尔曼滤波器 IEKF 在矩阵李群框架内完成的,与传统上用于航空航天和机器人问题的标准乘法 EKF 相比,它具有多种优势。采用基于 SO 3 的姿态控制器,从而实现单一姿态控制律,无需单独的侧滑控制环路。控制分配器用于确定如何使用多个(可能是冗余的)执行器来产生所需的控制力矩。风速估计用于姿态控制器和控制分配器以提高性能。考虑使用具有四个控制面的 VTOL 尾座式无人机样本的数值示例。 |
| The Invariant Rauch-Tung-Striebel Smoother Authors Niels van der Laan, Mitchell Cohen, Jonathan Arsenault, James Richard Forbes 本文提出了一种不变的 Rauch Tung Striebel IRTS 平滑器,适用于状态为矩阵李群元素的系统。特别是,扩展的 Rauch Tung Striebel RTS 平滑器适合在矩阵李群框架内工作。不变 RTS IRTS 平滑器的主要优点是,过程和测量模型的线性化独立于状态估计,从而在满足某些技术要求时产生与状态估计无关的雅克比行列式。考虑了一个示例问题,涉及估计 SE 3 上刚体的三维姿态以及传感器偏差。还回顾了乘法 RTS MRTS 平滑器,并将其用作使用实验数据提出的 IRTS 平滑器的直接比较。 |
| TEXterity -- Tactile Extrinsic deXterity: Simultaneous Tactile Estimation and Control for Extrinsic Dexterity Authors Sangwoon Kim, Antonia Bronars, Parag Patre, Alberto Rodriguez 我们引入了一种新颖的方法,它将触觉估计和控制结合起来进行手持物体操作。通过集成机器人运动学和基于图像的触觉传感器的测量结果,我们的框架估计和跟踪物体姿态,同时以后退地平线方式生成运动计划以控制所抓取物体的姿态。该方法由一个离散姿势估计器和一个连续姿势估计控制器组成,离散姿势估计器跟踪粗略离散网格中最可能的物体姿势序列,连续姿势估计器控制器用于细化姿势估计并准确操纵所抓取物体的姿势。我们的方法在不同的物体和配置上进行了测试,实现了预期的操纵目标,并在估计精度方面优于单次方法。所提出的方法对于在视觉遮挡下需要精确操作和有限的手部灵活性的任务具有潜力,为重新抓取、插入和工具使用等应用中的闭环行为奠定了基础。 |
| Primal-Dual iLQR Authors Jo o Sousa Pinto, Dominique Orban 我们引入了一种解决无约束离散时间最优控制问题的新算法。我们的方法遵循直接多重射击方法,并且包括将 SQP 方法与 ell 2 增强拉格朗日原始对偶评价函数一起应用。我们使用 LQR 算法来有效地解决原始对偶 SQP 问题。由于我们的算法是 NPSQP Gill 等人的专业化。 1992年,它继承了其通用属性,包括全局收敛、快速局部收敛以及不需要二阶校正,改进了现有的直接多重射击方法,例如GNMS Giftthaler等人。 2018 年和 FDDP Mastalli 等人。 |
| Can Transformers Capture Spatial Relations between Objects? Authors Chuan Wen, Dinesh Jayaraman, Yang Gao 物体之间的空间关系代表了人类理解世界并与世界互动的关键场景信息。为了研究当前计算机视觉系统识别物理基础空间关系的能力,我们首先提出精确的关系定义,以允许一致地注释基准数据集。尽管与识别文献中的其他任务相比,该任务明显简单,但我们观察到现有方法在此基准上表现不佳。我们提出了利用变压器的长期注意力能力来完成这项任务的新方法,并评估关键设计原则。我们确定了一个简单的 RelatiViT 架构,并证明它优于当前的所有方法。据我们所知,这是第一种在野外环境中的空间关系预测方面令人信服地优于朴素基线的方法。 |
| Path Tracking using Echoes in an Unknown Environment: the Issue of Symmetries and How to Break Them Authors Mireille Boutin, Gregor Kemper 本文研究了在由平面结构组成的未知环境中利用声音重建车辆路径的问题。文献中的许多系统通过使用安装在车辆上的扬声器和麦克风来实现这一点。环境中的对称性会导致此类系统的解决方案含糊不清。我们建议通过将扬声器放置在环境中的固定位置而不是车辆上来解决此问题。无论环境几何形状如何,这是否会消除歧义的问题引出了一个关于对称性破缺的问题,这个问题可以用纯数学术语来表达。如果几何体是三维或更大的,我们肯定地解决这个问题,并给出二维的反例。排除极少数出现反例的情况,我们在第二维度也给出了肯定的答案。我们的研究结果得出了一种简单的路径重建算法,用于携带四个麦克风的车辆在固定位置的扬声器发出短促声音的环境中导航。 |
| EfficientZero V2: Mastering Discrete and Continuous Control with Limited Data Authors Shengjie Wang, Shaohuai Liu, Weirui Ye, Jiacheng You, Yang Gao 样本效率仍然是将强化学习 RL 应用到现实世界任务中的一个关键挑战。虽然最近的算法在提高样本效率方面取得了显着的进步,但没有一个算法能够在不同的领域实现一致的卓越性能。在本文中,我们介绍了 EfficientZero V2,这是一个为样本高效 RL 算法设计的通用框架。我们已将 EfficientZero 的性能扩展到多个领域,包括连续和离散动作,以及视觉和低维输入。通过我们提出的一系列改进,EfficientZero V2 在有限数据设置下的各种任务中显着优于当前最先进的 SOTA。 |
| Multiple Ways of Working with Users to Develop Physically Assistive Robots Authors Amal Nanavati, Max Pascher, Vinitha Ranganeni, Ethan K. Gordon, Taylor Kessler Faulkner, Siddhartha S. Srinivasa, Maya Cakmak, Patr cia Alves Oliveira, Jens Gerken 尽管过去十年物理辅助机器人 PAR 研究不断增长,但近一半的 PAR 用户研究并未涉及目标残疾的参与者。造成这种招聘挑战的原因有很多,样本量小,运输物流都受到残疾人面临的系统性障碍的影响。然而,众所周知,与最终用户合作可以带来更好地满足他们的需求并融入他们的生活环境的技术。在本文中,我们反思了在三个 PAR 项目的设计、开发和评估中与运动障碍人士合作所采取的多种方法:a 使用机器人手臂进行辅助喂食 b 使用移动机械臂进行辅助远程操作 c 与共享控制一个机器人手臂。 |
| Computer-Controlled 3D Freeform Surface Weaving Authors Xiangjia Chen, Lip M. Lai, Zishun Liu, Chengkai Dai, Isaac C.W. Leung, Charlie C.L. Wang, Yeung Yam 在本文中,我们提出了一种新的计算机控制编织技术,该技术能够通过使用具有高弯曲刚度的非传统材料中的线来制造给定 3D 表面形状的编织结构,从而允许所得编织物的多种应用。开发了新型编织机和新的制造工艺,利用短排成形原理实现3D表面编织的功能。研究了一种计算解决方案,将输入的 3D 自由曲面转换为相应的编织操作(表示为 W 代码),以指导该系统的操作。 |
| Autonomous Robotic Arm Manipulation for Planetary Missions using Causal Machine Learning Authors C. McDonnell, M. Arana Catania, S. Upadhyay 自主机械臂操纵器有潜力使行星探索和原位资源利用任务更加省时高效,因为操纵器可以自行处理物体并执行特定目标的动作。我们训练机械手自主研究它没有先验知识的物体,例如行星岩石。这是通过在模拟的行星环境中使用因果机器学习来实现的。在这里,操纵器与物体交互,并根据不同的因果因素对它们进行分类。这些参数,例如质量或摩擦系数,因果性地决定了其相互作用的结果。通过强化学习,操纵者学会以揭示潜在因果因素的方式进行交互。我们证明,即使没有任何对象的先验知识或任何先前收集的训练数据,这种方法也能发挥作用。 |
| MS-Net: A Multi-Path Sparse Model for Motion Prediction in Multi-Scenes Authors Xiaqiang Tang, Weigao Sun, Siyuan Hu, Yiyang Sun, Yafeng Guo 人类行为的多模态和随机特征使得运动预测成为一项极具挑战性的任务,这对于自动驾驶至关重要。尽管深度学习方法已经在这一领域展示了其巨大潜力,但在多个驾驶场景(例如并道、环岛、交叉路口)之间建立联系以及深度学习模型的设计仍然悬而未决。当前基于学习的方法通常使用一种统一的模型来预测不同场景中的轨迹,这可能会导致单个场景的次优结果。为了解决这个问题,我们提出了多场景网络(Multi Scenes Network)。 MS Net,这是一个通过进化过程训练的多路径稀疏模型。 MS Net 在推理阶段有选择地激活其参数的子集,以生成每个场景的预测结果。在训练阶段,区分场景下的运动预测任务被抽象为多任务学习问题,设计了一种进化算法来鼓励网络搜索每个场景的最优参数,同时共享不同场景之间的公共知识。 |
| Chinese Abs From Machine Translation |