【AI视野·今日Robot 机器人论文速览 第六十五期】Mon, 30 Oct 2023

AI视野·今日CS.Robotics 机器人学论文速览

Mon, 30 Oct 2023
Totally 18 papers
👉上期速览更多精彩请移步主页

Daily Robotics Papers

|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Gen2Sim: Scaling up Robot Learning in Simulation with Generative Models Authors Pushkal Katara, Zhou Xian, Katerina Fragkiadaki 多面手机器人操纵者需要学习跨不同环境的各种操纵技能。当前的机器人训练流程依赖于人类提供动觉演示或对模拟环境进行编程以及为强化学习编写奖励函数。这种人类的参与是扩大机器人在不同任务和环境中学习的一个重要瓶颈。我们提出了 Generation to Simulation Gen2Sim,这是一种通过使用大型预先训练的语言和视觉生成模型自动生成 3D 资产、任务描述、任务分解和奖励函数来扩展模拟中机器人技能学习的方法。我们使用图像扩散模型将开放世界 2D 以对象为中心的图像提升为 3D,并查询 LLM 以确定合理的物理参数,从而生成用于模拟的 3D 资产。给定生成的和人类开发的资产的 URDF 文件,我们的思想链提示法学硕士将这些映射到相关的任务描述、时间分解和相应的用于强化学习的 python 奖励函数。我们证明 Gen2Sim 在各种长期任务的学习策略方面取得了成功,而使用非时间分解奖励函数的强化学习却失败了。 Gen2Sim 为在模拟中扩大机器人操纵器的强化学习提供了一条可行的途径,既通过多样化和扩展任务和环境开发,又通过 RL 中的时间任务分解促进强化学习行为的发现。 |
| Socially Cognizant Robotics for a Technology Enhanced Society Authors Kristin J. Dana, Clinton Andrews, Kostas Bekris, Jacob Feldman, Matthew Stone, Pernille Hemmer, Aaron Mazzeo, Hal Salzman, Jingang Yi 机器人技术的新兴应用以及对其影响的担忧要求研究界将以人为本的目标放在首位和中心。为了应对这一挑战,我们提倡采用跨学科方法,即社会认知机器人技术,它综合了技术和社会科学方法。我们认为,这种方法源于需要授权利益相关者参与,从同步人类反馈到异步社会评估,以塑造各个层面的人工智能驱动的机器人行为,并带来一系列新颖的研究观点和问题,以改善机器人与个人的互动,以及改善机器人与个人的互动。对社会的影响。根据这些论点,我们开发了具有社会认知的机器人设计的最佳实践,以平衡基于传统技术的指标,例如 |
| Interactive Motion Planning for Autonomous Vehicles with Joint Optimization Authors Yuxiao Chen, Sushant Veer, Peter Karkus, Marco Pavone 在高度交互的驾驶场景中,一个智能体的行为会极大地影响其邻居的行为。因此,在这种交互式环境中规划自动驾驶车辆的安全运动需要推理自我预期运动计划对附近智能体行为的影响。基于深度学习的模型最近在轨迹预测方面取得了巨大成功,文献中的许多模型都允许自我条件预测。然而,由于神经网络的复杂性,利用自我条件预测在下游规划中仍然具有挑战性,将规划器结构限制为简单的结构,例如基于采样的规划器。尽管它们能够生成细粒度的高质量运动计划,但基于梯度的规划算法(例如模型预测控制 MPC)由于其迭代性质和对梯度的需要而很难利用自我条件预测。我们提出了交互式联合规划 IJP,它以计算可扩展的方式将 MPC 与学习的预测模型联系起来,为我们提供两全其美的方案。特别是,IJP 联合优化自我和周围代理的行为,并利用深度学习的预测模型作为连接轨迹优化试图保持接近的预测先验。此外,通过利用同伦类,我们的联合优化器搜索不同的运动计划,以避免陷入局部最小值。 |
| Enhancing the Performance of a Biomimetic Robotic Elbow-and-Forearm System Through Bionics-Inspired Optimization Authors Haosen Yang, Guowu Wei, Lei Ren 本文描述了创新机器人前臂和肘部设计的制定和验证,反映了人类骨骼和韧带系统复杂的生物力学。传统的机器人模型常常低估软组织的实质功能,导致在紧凑性、安全性、稳定性和运动范围之间做出妥协。相比之下,这项研究提出了生物关节的整体复制,包括骨骼、软骨、韧带和肌腱,最终形成仿生机器人。该研究强调了人类前臂的紧凑而稳定的结构,这归因于三骨框架和多样化的软组织。该方法涉及对人体解剖学的详尽检查,并通过对软组织对原型稳定性的贡献的理论探索来取得成功。评估结果揭示了机器人关节的运动范围与人类关节之间的显着相似之处。机器人肘部模拟了生物肘部 98.8 的运动范围,具有 11.25 Nm 伸展和 24 Nm 弯曲的高扭矩能力。同样,机器人前臂的旋转范围是人类前臂的 58.6 倍,产生 14 Nm 旋前和 7.8 Nm 旋后的大量输出扭矩。此外,该原型机表现出显着的承载能力,可承受5公斤的哑铃负载而没有明显的位移。它展示了超过4kg的有效负载能力和快速动作能力,例如以0.74Hz的速度举起2kg的哑铃,以3.2m·s的末端执行器速度击打乒乓球。 |
| Development and Characteristics of a Highly Biomimetic Robotic Shoulder Through Bionics-Inspired Optimization Authors Haosen Yang, Guowu Wei, Lei Ren 本文批判性地分析了传统和仿生机械臂,强调了当前仿生模型中尺寸、运动范围和负载能力之间的权衡。通过深入研究人体肩部的机械智能,特别是盂肱关节的复杂特征,例如其独特的球窝结构和自锁机制,我们确定了在保持紧凑性的同时增强稳定性和活动性的创新。为了证实这些见解,我们提出了一种突破性的仿生机器人盂肱关节,它真实地反映了从韧带到肌腱的人类肌肉骨骼元素,整合了生物关节的机械智能。我们详尽的模拟和测试揭示了机器人关节增强的灵活性和负载能力。先进的机械臂展示了显着的功能,包括大范围的运动和 4 公斤的有效负载能力,甚至可以施加超过 1.5 Nm 的扭矩。 |
| Do we need scan-matching in radar odometry? Authors Vladim r Kubelka, Emil Fritz, Martin Magnusson 目前,支持 4D 多普勒的雷达和激光雷达测距传感器的开发不断增加,这些传感器可生成 3D 点云,其中所有点还具有有关相对于传感器的径向速度的信息。 4D 雷达尤其适用于低能见度条件下的物体感知和导航,灰尘、烟雾等激光雷达和摄像头通常会出现故障。随着高分辨率多普勒雷达的出现,可以从单点云估计里程计,从而不再需要扫描配准,而扫描配准在特征稀疏的场环境中很容易出错。我们在三个数据集(包含来自两个最新 4D 雷达和两个 IMU 的数据)上比较了几种里程计估计方法,从多普勒 IMU 数据和卡尔曼滤波器传感器融合的直接集成到 3D 扫描到扫描和扫描到地图配准。令人惊讶的是,我们的结果表明,仅来自多普勒和 IMU 数据的里程计可以提供与 3D 点云配准相似或更好的结果。在我们的实验中,在 1.8 公里和 4.5 公里的轨迹上,平均位置误差可以低至 0.3。这使得在特征稀疏的矿山环境中也能准确估计长距离的 6DOF 自我运动。 |
| er.autopilot 1.0: The Full Autonomous Stack for Oval Racing at High Speeds Authors Ayoub Raji, Danilo Caporale, Francesco Gatti, Andrea Giove, Micaela Verucchi, Davide Malatesta, Nicola Musiu, Alessandro Toschi, Silviu Roberto Popitanu, Fabio Bagni, Massimiliano Bosi, Alexander Liniger, Marko Bertogna, Daniele Morra, Francesco Amerotti, Luca Bartoli, Federico Martello, Riccardo Porta 印地自动驾驶挑战赛 IAC 历史上首次汇聚了九支自动驾驶赛车队,在开轮赛车上使用独立开发的软件,以前所未有的速度进行正面交锋。本文介绍了 TII EuroRacing TII ER 团队使用的完整软件架构,涵盖了避开静态障碍物、执行主动超车以及达到 75 m s 270 km h 以上速度所需的所有模块。除了与感知、规划和控制相关的最常见模块之外,我们还讨论用于车辆动力学建模、仿真、遥测和安全的方法。 |
| ProcNet: Deep Predictive Coding Model for Robust-to-occlusion Visual Segmentation and Pose Estimation Authors Michael Zechmair, Alban Bornet, Yannick Morel 涉及人机协作的系统必然要求采取措施确保参与人员的安全。如果能够准确、可靠地估计人体姿势,这通常是可以实现的。在本文中,我们提出了一种支持视觉分割的深度预测编码 PC 模型,我们将其扩展以实现姿势估计。该模型旨在为人类和机器人彼此靠近操作时自然发生的瞬态遮挡类型提供鲁棒性。 |
| Autonomous 3D Exploration in Large-Scale Environments with Dynamic Obstacles Authors Emil Wiman, Ludvig Wid n, Mattias Tiger, Fredrik Heintz 在动态和不确定的现实世界环境中进行探索是机器人技术中的一个开放性问题,并且构成了在大多数现实世界中运行的自主系统的基本能力。虽然 3D 探索规划已被广泛研究,但环境假设为静态或仅执行反应性碰撞避免。我们提出了一种新颖的方法,不仅可以避免动态障碍,还可以将它们包含在计划本身中,以利用有利于代理的动态环境。所提出的规划器"动态自主探索规划器 DAEP"将 AEP 扩展为针对动态障碍物进行显式规划。为了彻底评估此类环境中的勘探规划者,我们提出了一个新的增强基准套件,其中包含多个动态环境,包括大型室外环境。在动态和大规模环境中,DAEP 的表现优于最先进的规划器。 |
| Decision-theoretic MPC: Motion Planning with Weighted Maneuver Preferences Under Uncertainty Authors mer ahin Ta , Philipp Heinrich Brusius, Christoph Stiller 基于连续优化的运动规划器需要在优化轨迹之前决定机动同伦。在不确定的情况下,其他参与者的机动意图可能不清楚,车辆可能无法决定最合适的机动。这项工作介绍了一种在规划中纳入多种机动偏好的方法。它通过考虑加权机动偏好以及从感知到预测的不确定性来优化轨迹,同时确保机会受限后备选项的可行性。 |
| Dynamic Grasping of Unknown Objects with a Multi-Fingered Hand Authors Yannick Burkhardt, Qian Feng, Karan Sharma, Zhaopeng Chen, Alois Knoll 自主机器人的一个重要先决条件是它们能够可靠地抓取各种物体。大多数最先进的系统都采用专门或简单的末端执行器,例如两个钳口夹具,这严重限制了要操纵的物体的范围。此外,它们通常需要一个结构化且完全可预测的环境,而我们世界的绝大多数都是复杂的、非结构化的和动态的。本文提出了解决这两个问题的实现方案。首先,五指手的集成增强了可能的抓握和可操纵物体的多样性。这种运动学复杂的末端执行器由基于深度学习的生成抓取网络控制。通过处理视觉传感器数据迭代完成未知目标物体所需的虚拟模型。其次,利用视觉反馈来实现闭环伺服控制,补偿外部干扰。我们在真实硬件上的实验证实了系统能够可靠地掌握未知的动态目标物体,而无需先验了解其轨迹。据我们所知,这是第一个实现未知物体动态多指抓取的方法。 |
| Split Covariance Intersection Filter Based Visual Localization With Accurate AprilTag Map For Warehouse Robot Navigation Authors Susu Fang, Yanhao Li, Hao Li 准确、高效的定位以及方便建立的地图是移动机器人在仓库环境中作业的基本要求。借助基于 LiDAR 的 SLAM 可以方便地建立准确的 AprilTag 地图。确实,与基于视觉的系统相比,基于 LiDAR 的系统通常不具有商业竞争力,但幸运的是,对于仓库应用来说,只需要一个基于 LiDAR 的 SLAM 系统即可建立准确的 AprilTag 地图,而大量的视觉定位系统可以共享这个已建立的 AprilTag 地图以供自己操作。因此,基于激光雷达的SLAM系统的成本实际上是由大量的视觉定位系统分担的,对于实际的仓库应用来说是可以接受甚至可以忽略不计的。一旦获得准确的 AprilTag 地图,视觉定位就可以作为递归估计来实现,该递归估计融合了 AprilTag 测量结果,即 AprilTag 检测结果和机器人运动数据。 AprilTag 测量可能是非线性部分测量,这可以通过众所周知的扩展卡尔曼滤波器 EKF 本着局部线性化的精神来处理。 AprilTag 测量往往也具有时间相关性,但是 EKF 无法合理处理这一点。采用分裂协方差交叉滤波器Split CIF 来处理AprilTag 测量之间的时间相关性。本着局部线性化精神的 Split CIF 还可以处理 AprilTag 非线性部分测量。基于Split CIF的视觉定位系统结合了测量自适应机制来处理AprilTag测量中的异常值,并采用动态初始化机制来解决绑架问题。 |
| Dimensionally Homogeneous Jacobian using Extended Selection Matrix for Performance Evaluation and Optimization of Parallel Manipulators Authors Hassen Nigatu, Doik Kim 本文提出了一种推导基于点的维度齐次雅可比行列式的新方法,旨在用于混合自由度并联机械手的性能评估和优化。最佳操纵器通常依赖于从雅可比矩阵获得的性能指数。然而,当机械手表现出混合的平移和旋转自由度时,传统的雅可比单位不一致会导致最优结果不平衡。为了解决这个问题,基于点的维度齐次雅可比行列式已经成为一个突出的解决方案。然而,用于制定维度齐次雅可比行列式的现有基于点的方法适用于有限种类的并联机械臂。此外,它们很复杂且不太直观。本文引入了一种扩展的选择矩阵,该矩阵结合了来自不同点的分量速度来描述移动板的整个运动。这种提出的方法使我们能够制定一个直观的基于点的、维度均匀的雅可比行列式,它可以应用于各种约束并联机械手。 |
| Soft Wrist Exosuit Actuated by Fabric Pneumatic Artificial Muscles Authors Katalin Sch ffer, Yasemin Ozkan Aydin, Margaret M. Coad 最近,基于软执行器的外装由于其高强度重量比、固有的安全性和低成本而引起了人们的兴趣。我们提出了一种新型腕外装,由织物气动人工肌肉驱动,可以使手腕进行屈曲伸展和尺骨径向偏差。我们推导了一个代表外装服施加扭矩的模型,并引入了一种基于模型的优化方法来选择外装服肌肉的放置参数。我们通过测量整个腕部屈曲伸展范围内的外装扭矩来评估模型的准确性。当考虑安装点的位移时,模型预测外装扭矩的平均绝对误差为 0.279 Nm,是平均测量扭矩的 26.1。为了探索外骨骼移动人体的能力,我们测量了其在被动人体手腕上的运动范围,外骨骼能够达到主动生物范围的 55.0 屈曲、69.1 伸展、68.6 尺偏和 68.4在径向偏差中。 |
| Learning Extrinsic Dexterity with Parameterized Manipulation Primitives Authors Shih Min Yang, Martin Magnusson, Johannes A. Stork, Todor Stoyano 许多实际相关的机器人抓取问题都具有目标物体的特征,该物体的所有抓取都被遮挡,例如被环境遮挡。在这种情况下,单次抓取规划总是会失败。相反,有必要首先将物体操纵成可供抓握的配置。我们通过学习一系列利用环境来改变物体姿势的动作来解决这个问题。具体来说,我们采用分层强化学习来组合一系列学习到的参数化操作原语。通过学习低级操纵策略,我们的方法可以通过利用对象、夹具和环境之间的交互来控制对象的状态。在不受控制的条件下,通过分析方法设计如此复杂的行为是不可行的,因为分析方法需要对相互作用和接触动力学进行精确的物理建模。相比之下,我们学习了一个直接对深度感知数据进行操作的分层策略模型,无需对象检测、姿态估计或手动设计控制器。我们评估了从受限的桌面工作空间中挑选各种重量、形状和摩擦特性的盒状物体的方法。 |
| Bin Assignment and Decentralized Path Planning for Multi-Robot Parcel Sorting Authors Teng Guo, Jingjin Yu 在现代仓库中,移动机器人运输包裹并将其放入基于邮政编码等分组的运输目的地的收集箱滑槽中。系统吞吐量以单位时间分拣的包裹数量来衡量,决定了仓库的效率。本研究开发了一种可扩展、高吞吐量的多机器人包裹分拣解决方案,将任务分解为两个相关的流程:箱分配和离线在线多机器人路径规划,并对两者进行优化。箱分配将收集箱与包裹类型相匹配,以最大限度地减少运输成本。随后,机器人被分配来拾取包裹并将其放入指定的箱子中。提出了多种高效的箱分配算法,可以与任意规划算法一起使用。我们提出了一种分散式路径规划例程,仅使用本地信息在精心构建的定向道路网络上路由机器人,以进行多机器人路径规划。我们的去中心化规划器可以证明概率上没有死锁,始终能够提供接近最佳的结果,与一些性能最佳的集中式规划器相当,同时显着减少计算时间几个数量级。 |
| Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning Authors Nicholas E. Corrado, Yuxiao Qu, John U. Balis, Adam Labiosa, Josiah P. Hanna 从演示中学习 LfD 是一种流行的技术,它使用专家演示来学习机器人控制策略。然而,获得专家质量演示的困难限制了 LfD 方法的适用性,现实世界的数据收集通常成本高昂,并且演示的质量在很大程度上取决于演示者的能力和安全问题。许多作品利用数据增强 DA 来廉价地生成额外的演示数据,但大多数 DA 作品以随机方式生成增强数据,并最终产生高度次优的数据。在这项工作中,我们提出了 Guided Data Augmentation GuDA,这是一种人类引导的 DA 框架,可以生成专家质量的增强数据。 GuDA 的关键见解是,虽然可能很难演示生成专家数据所需的操作顺序,但用户通常可以轻松识别增强轨迹段何时代表任务进度。因此,用户可以对 DA 过程施加一系列简单的规则,以自动生成近似专家行为的增强样本。为了从 GuDA 中提取策略,我们使用现成的离线强化学习和行为克隆算法。我们在物理机器人足球任务以及模拟 D4RL 导航任务、模拟自动驾驶任务和模拟足球任务上评估 GuDA。 |
| What You See Is What You Detect: Towards better Object Densification in 3D detection Authors Tianran Liu, Zeping Zhang Morteza Mousa Pasandi, Robert Laganiere 最近的工作证明了激光雷达信号 3D 感知中对象完成的重要性。已经提出了几种方法,其中使用模块来致密激光扫描仪产生的点云,从而实现更好的召回和更准确的结果。沿着这个方向,我们在这项工作中提出了一种反直觉的观点,广泛使用的全形状完成方法实际上会导致更高的误差上限,特别是对于远处的物体和像行人这样的小物体。基于这一观察,我们引入了一种可见部分完成方法,该方法仅需要先前方法生成的 11.3 个预测点。为了恢复密集表示,我们提出了一种基于网格变形的方法来增强与可见前景对象相关的点集。考虑到我们的方法仅关注前景物体的可见部分以实现精确的 3D 检测,我们将我们的方法命名为"所见即检测"所见即所得。因此,我们提出的方法是一个独立于检测器的模型,由两部分组成:内部截锥体分割变压器 IFST 和网格深度完成网络 MDCNet,用于根据网格变形预测前景深度。这样,我们的模型不需要大多数基于伪激光雷达的方法所使用的耗时的全深度完成任务。我们的实验评估表明,与 KITTI 和 NuScenes 数据集上的大多数公共基线模型相比,我们的方法可以提供高达 12.2 的性能改进,将最先进的技术提升到一个新的水平。 |
| Chinese Abs From Machine Translation |

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关推荐
OpenCSG4 分钟前
CSGHub开源版本v1.2.0更新
人工智能
weixin_515202495 分钟前
第R3周:RNN-心脏病预测
人工智能·rnn·深度学习
Altair澳汰尔8 分钟前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
AI视觉网奇29 分钟前
人脸生成3d模型 Era3D
人工智能·计算机视觉
call me by ur name32 分钟前
VLM--CLIP作分类任务的损失函数
人工智能·机器学习·分类
吃个糖糖1 小时前
34 Opencv 自定义角点检测
人工智能·opencv·计算机视觉
禁默1 小时前
2024年图像处理、多媒体技术与机器学习
图像处理·人工智能·microsoft
KeepThinking!1 小时前
YOLO-World:Real-Time Open-Vocabulary Object Detection
人工智能·yolo·目标检测·多模态
AIGCmagic社区1 小时前
AI多模态技术介绍:理解多模态大语言模型的原理
人工智能·语言模型·自然语言处理
图王大胜1 小时前
模型 双螺旋(通俗解读)
人工智能·管理·系统科学·认知科学·生命科学·战略规划·通识科学