【AI视野·今日Robot 机器人论文速览 第六十九期】Wed, 3 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览

Wed, 3 Jan 2024
Totally 5 papers
👉上期速览更多精彩请移步主页

Daily Robotics Papers

|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| NID-SLAM: Neural Implicit Representation-based RGB-D SLAM in dynamic environments Authors Ziheng Xu, Jianwei Niu, Qingfeng Li, Tao Ren, Chen Chen 人们已经探索了神经隐式表示来增强视觉 SLAM 算法,特别是在提供高保真度密集地图方面。现有方法在静态场景中运行稳健,但难以应对移动物体造成的干扰。在本文中,我们提出了 NID SLAM,它显着提高了神经 SLAM 在动态环境中的性能。我们提出了一种新方法来增强语义掩模中的不准确区域,特别是在边缘区域。利用深度图像中存在的几何信息,该方法能够准确去除动态物体,从而降低相机漂移的可能性。此外,我们引入了动态场景的关键帧选择策略,该策略增强了摄像机对大型物体的跟踪鲁棒性,并提高了建图效率。 |
| Symbolic Manipulation Planning with Discovered Object and Relational Predicates Authors Alper Ahmetoglu, Erhan Oztop, Emre Ugur 从机器人对其环境的无监督探索和持续的感觉运动经验中发现可用于长期规划的符号和规则是一项具有挑战性的任务。先前的研究提出从单个或成对的对象交互中学习符号并利用这些符号进行规划。在这项工作中,我们提出了一个系统,该系统使用发现的对象和关系符号来学习规则,这些符号对任意数量的对象及其之间的关系进行编码,将这些规则转换为规划领域描述语言 PDDL ,并生成涉及任意数量的可供性的计划实现任务的对象。我们使用不同尺寸的盒状物体验证了我们的系统,并表明该系统可以开发拾取、携带和放置操作的符号知识,同时考虑到不同配置的对象组合,例如盒子将与更大的盒子一起携带放置它们的盒子。 |
| PLE-SLAM: A Visual-Inertial SLAM Based on Point-Line Features and Efficient IMU Initialization Authors Jiaming He, Mingrui Li, Yangyang Wang, Hongyu Wang 视觉惯性SLAM在AR VR、无人机、工业机器人、自动驾驶等各个领域都至关重要。相机和惯性测量单元IMU的融合可以弥补信号传感器的缺点,从而显着提高在挑战性环境下定位的准确性和鲁棒性。鲁棒的跟踪和准确的惯性参数估计是系统稳定运行的基础。本文介绍了 PLE SLAM,一种基于点线特征和高效 IMU 初始化的完全精确、实时的视觉惯性 SLAM 算法。首先,我们介绍基于点的视觉惯性 SLAM 系统中的线特征。我们使用并行计算方法来提取特征并计算描述符以确保实时性能。其次,所提出的系统通过旋转预积分和点线观测来估计陀螺仪偏差。加速度计偏差和重力方向通过解析方法求解。初始化后,所有惯性参数通过最大后验 MAP 估计进行细化。此外,我们开放了动态特征消除线程来提高对动态环境的适应性,并使用CNN、词袋和GNN来检测循环和匹配特征。基于 DNN 的匹配方法具有出色的宽基线匹配能力和光照鲁棒性,显着提高了循环检测召回率和循环帧间姿态估计。前端和后端都是为硬件加速而设计的。 |
| GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation Authors Zifan Wang, Junyu Chen, Ziqing Chen, Pengwei Xie, Rui Chen, Li Yi 本文提出了 GenH2R,一个用于学习基于通用视觉的人机 H2R 切换技能的框架。目标是让机器人能够可靠地接收人类在各种复杂轨迹中移交的具有看不见的几何形状的物体。我们通过使用包括程序模拟资产创建、自动演示生成和有效模仿学习的综合解决方案大规模学习 H2R 切换来获得这种通用性。我们利用大规模 3D 模型库、灵巧的抓取生成方法和基于曲线的 3D 动画创建了名为 simabbns 的 H2R 切换仿真环境,比现有模拟器中的场景数量超出了三个数量级。我们进一步介绍了一种蒸馏友好的演示生成方法,可以自动生成一百万个适合学习的高质量演示。最后,我们提出了一种通过未来预测目标增强的 4D 模仿学习方法,将演示提炼为视觉运动切换策略。模拟器和现实世界中的实验评估表明,在所有情况下,成功率比基线至少提高了 10 倍。 |
| Fast and Continual Learning for Hybrid Control Policies using Generalized Benders Decomposition Authors Xuan Lin 具有连续变量和离散变量的混合模型预测控制广泛适用于机器人控制任务,特别是涉及与环境接触的任务。由于组合复杂性,混合 MPC 的求解速度对于实时应用来说可能不够。在本文中,我们提出了一种基于广义 Benders 分解 GBD 的混合 MPC 求解器。该算法在线枚举并存储有限缓冲区内的切割平面。经过短暂的冷启动阶段后,存储的切割为新问题实例提供热启动,以提高解决速度。尽管存在干扰和随机变化的环境,求解速度仍保持不变。利用可行性割断的稀疏性,我们还提出了一种解决 Benders 主问题的快速算法。我们的求解器通过控制具有随机移动的软接触壁的车杆系统和绕障碍物导航的自由飞行机器人进行了验证。 |
| Chinese Abs From Machine Translation |

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关推荐
小陈工2 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬6 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志6 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
YQ_016 小时前
ROS 2 / Gazebo / Autoware 一键清理与切换 Domain 使用指南
机器人
2501_948114246 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠6 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光6 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好7 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力7 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo7 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin