【AI视野·今日Robot 机器人论文速览 第五十期】Mon, 9 Oct 2023

AI视野·今日CS.Robotics 机器人学论文速览

Mon, 9 Oct 2023
Totally 25 papers
👉上期速览更多精彩请移步主页

Daily Robotics Papers

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Learning to Grasp: from Somewhere to Anywhere Authors Fran ois H l non, Johann Huber, Fa z Ben Amar, St phane Doncieux 机器人抓取仍然是一个部分解决的多学科问题,其中数据驱动技术发挥着越来越重要的作用。奖励的稀疏性使得自动生成抓取数据集具有挑战性,特别是对于非常规形态或高度驱动的末端执行器。大多数获取大规模数据集的方法都依赖于大量人工提供的演示或精心设计的解决方案,而这些解决方案的扩展性不好。质量多样性 QD 方法的最新进展研究了如何学习具有不同机器人形态的特定姿势的物体抓取。目前的工作引入了一个管道,用于使 QD 生成的轨迹适应新的物体姿势。使用 RGB D 数据流,视觉管道首先检测目标对象,预测其 6 DOF 姿态,最后对其进行跟踪。然后可以通过相对于对象框架投影来调整自动生成的触及和抓取轨迹。数百条轨迹已部署到现实世界中的多个物体上,并采用不同的机器人设置,例如带有平行夹具的 Franka Research 3 和带有灵巧的 SIH Schunk 手的 UR5。 |
| Graph learning in robotics: a survey Authors Francesca Pistilli, Giuseppe Averta 图的深度神经网络已经成为学习复杂非欧几里德数据的强大工具,这种数据在各种不同的应用中变得越来越普遍。然而,尽管它们的潜力已在机器学习社区中得到广泛认可,但对于机器人应用等下游任务,图学习在很大程度上尚未得到探索。为了充分释放它们的潜力,因此,我们提出从机器人角度对图神经架构进行回顾。本文涵盖了基于图的模型的基础知识,包括其架构、训练过程和应用程序。它还讨论了应用环境中出现的最新进展和挑战,例如与感知、决策和控制的整合相关的进展和挑战。最后,本文对各种受益于图结构学习的机器人应用进行了广泛的回顾,例如身体和接触建模、机器人操纵、动作识别、舰队运动规划等等。 |
| A Dataset of Anatomical Environments for Medical Robots: Modeling Respiratory Deformation Authors Inbar Fried, Janine Hoelscher, Jason A. Akulian, Ron Alterovitz 医疗机器人环境的解剖模型可以极大地帮助指导新机器人系统的设计和开发。这些模型可用于对运动规划算法进行基准测试、评估控制器、优化机械设计选择、模拟程序,甚至作为数据生成的资源。目前,生成这些环境的耗时任务是由各个研究小组重复执行的,并且很少广泛共享。这不仅导致多余的工作,而且还使得准确比较系统和算法变得困难。在这项工作中,我们展示了在肺部操作的医疗机器人的临床相关解剖环境的集合。由于解剖变形是在肺部操作的医疗机器人面临的基本挑战,因此我们描述了一种使用患者衍生数据来模拟这些环境中呼吸变形的方法。 |
| Compositional Servoing by Recombining Demonstrations Authors Max Argus, Abhijeet Nayak, Martin B chner, Silvio Galesso, Abhinav Valada, Thomas Brox 基于图像输入的学习操纵策略通常表现出较弱的任务转移能力。相比之下,视觉伺服方法可以在高精度场景下实现高效的任务转移,同时只需要少量演示。在这项工作中,我们提出了一个框架,将视觉伺服任务表述为图遍历。我们的方法不仅扩展了视觉伺服的鲁棒性,而且还基于一些特定任务的演示实现了多任务能力。我们通过拆分现有演示并重新组合它们来构建演示图。为了遍历推理案例中的演示图,我们利用相似性函数来帮助为特定任务选择最佳演示。这使我们能够计算穿过该图的最短路径。最终,我们表明,重新组合演示可以带来更高的任务各自的成功。 |
| DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms Trajectories Authors Matteo El Hariry, Antoine Richard, Vivek Muralidharan, Baris Can Yalcin, Matthieu Geist, Miguel Olivares Mendez 这项研究引入了一种新颖的基于深度强化学习的套件,用于控制模拟和现实环境中的浮动平台。浮动平台作为多功能测试台来模拟地球上的微重力环境。我们的方法通过训练能够在动态和不可预测的条件下进行精确操作的策略来解决控制此类平台的系统和环境不确定性。利用最先进的深度强化学习技术,我们的套件实现了鲁棒性、适应性以及从模拟到现实的良好可迁移性。我们的深度强化学习 DRL 框架具有快速训练时间、大规模测试能力、丰富的可视化选项以及用于与现实世界机器人系统集成的 ROS 绑定等优势。 |
| A New Safety Objective for the Calibration of the Intelligent Driver Model Authors Kingsley Adjenughwure, Arturo Tejada, Pedro F. V. Oliveira, Jeroen Hogema, Gerdien Klunder 智能驾驶模型IDM是近年来继CF车型之后应用最广泛的汽车之一。该模型的参数是利用自然驾驶、驾驶模拟器实验和无人机数据获得的真实轨迹进行校准的。模型校准过程的一个重要方面是定义校准的主要目标。该目标影响校准的目标函数和性能测量。例如,为了校准 CF 模型,目标通常是最小化测量间距或速度的误差,而忽略了模型的重要安全方面(例如防撞机制)。对于此类模型,无法保证校准参数将保留模型的安全属性,因为没有明确考虑这些参数。为了明确考虑校准过程中的安全特性,本文提出了一个简单的目标函数,该函数可以最小化当前所做的实际测量间距的误差,以及从无碰撞特性导出的动态安全间距所需的最小间隙的误差。 IDM 模型。所提出的目标函数用于使用无人机从荷兰高速公路获得的车辆轨迹来校准 IDM 的两个变体。然后根据实际间距和时间间隙的误差来比较校准性能。 |
| The WayHome: Long-term Motion Prediction on Dynamically Scaled Authors Kay Scheerer, Thomas Michalke, Juergen Mathes 自动驾驶汽车面临的主要挑战之一是准确预测周围环境中其他物体(例如行人或其他车辆)运动的能力。在本文中,受 Gilles 等人的工作启发,开发了一种用于自动驾驶车辆的新颖运动预测方法。 1.我们使用基于神经网络的模型为自动驾驶车辆附近的每个交通参与者预测多个热图,每个时间步一张热图。热图用作新颖采样算法的输入,该算法提取与最可能的未来位置相对应的坐标。我们尝试使用不同的编码器和解码器,并对两种损失函数进行比较。此外,还引入了新的网格缩放技术,显示出进一步改进的性能。总体而言,我们的方法提高了 3 秒的函数相关预测间隔的最先进的错过率性能,同时在长达 8 秒的较长预测间隔中具有竞争力。 |
| Indoor Positioning based on Active Radar Sensing and Passive Reflectors: Concepts & Initial Results Authors Pascal Schlachter, Zhibin Yu, Naveed Iqbal, Xiaofeng Wu, Sven Hinderer, Bin Yang 为了在室内环境中可靠地导航,工业自动驾驶车辆必须知道其位置。然而,当前的室内车辆定位技术要么缺乏准确性、可用性,要么过于昂贵。因此,我们提出了一种称为本地参考点辅助主动雷达定位的新概念,它能够克服这些缺点。它基于在室内环境中分布无源后向反射器,使得可以通过关于反射器的独特反射特性来识别车辆的每个位置。为了观察这些特征,自动驾驶车辆配备了主动雷达系统。一方面,本文介绍了室内车辆定位新方法的基本思想和概念,特别关注反射器的关键放置。另一方面,它还通过进行完整的系统仿真(包括本地参考点的放置、基于雷达的距离估计以及两种不同定位方法的比较)来提供概念验证。 |
| Towards 6D MCL for LiDARs in 3D TSDF Maps on Embedded Systems with GPUs Authors Marc Eisoldt, Alexander Mock, Mario Porrmann, Thomas Wiemann 蒙特卡罗定位是移动机器人领域广泛使用的方法。虽然这个问题已经在 2D 情况下得到了很好的研究,但迄今为止,具有六个自由度的 3D 地图中的全局定位对计算的要求过高。因此,文献中尚未提出能够实时解决该问题的移动机器人系统。计算最密集的步骤是传感器模型的评估,但它也提供了很高的并行化潜力。这项工作研究了嵌入式 GPU 上三维激光扫描仪截断符号距离场中粒子评估的大规模并行化。 |
| Light-LOAM: A Lightweight LiDAR Odometry and Mapping based on Graph-Matching Authors Shiquan Yi, Yang Lyu, Lin Hua, Quan Pan, Chunhui Zhao 同时定位和建图 SLAM 在机器人自主性中发挥着重要作用。可靠性和效率是 SLAM 在机器人应用中应用的两个最有价值的特征。在本文中,我们考虑在计算有限的平台上实现可靠的基于 LiDAR 的 SLAM 功能,例如基于图的点云关联的四旋翼无人机。首先,与大多数为点云配准选择显着特征的工作相反,我们提出了一种出于可靠性和鲁棒性目的的非显着特征选择策略。然后使用两阶段对应选择方法来配准点云,其中包括基于 KD 树的粗匹配,然后是基于图的匹配方法,该方法使用几何一致性来投票掉不正确的对应。此外,我们提出了一种里程计方法,其中权重优化由上述几何一致性图的投票结果指导。这样,LiDAR里程计的优化快速收敛并评估出相当准确的变换,从而使后端模块高效地完成建图任务。最后,我们在 KITTI 里程计数据集和现实世界环境上评估我们提出的框架。 |
| Maximizing Performance with Minimal Resources for Real-Time Transition Detection Authors Zeynep Ozge Orhan, Andrea Dal Prete, Anastasia Bolotnikova, Marta Gandolla, Auke Ijspeert, Mohamed Bouri 外骨骼和假肢等辅助设备彻底改变了康复和行动辅助领域。有效检测不同活动(例如行走、上下楼梯以及坐下)之间的转换对于确保自适应控制和增强用户体验至关重要。我们在这里提出一种实时转换检测的方法,旨在优化处理时间性能。通过训练有素的机器学习模型建立活动特定阈值,我们可以有效区分运动模式并识别运动模式之间的过渡时刻。与机器学习方法相比,这种基于阈值的方法将实时嵌入式处理时间性能提高了 11 倍。使用从三个不同测量系统收集的数据来验证所开发的有限状态机的功效。此外,在主动骨盆矫形器上对健康参与者进行了实验,以验证我们方法的稳健性和可靠性。所提出的算法在检测活动之间的转换方面实现了高精度。 |
| Doppler-only Single-scan 3D Vehicle Odometry Authors Andres Galeote Luque, Vladim r Kubelka, Martin Magnusson, Jose Raul Ruiz Sarmiento, Javier Gonzalez Jimenez 我们提出了一种新颖的 3D 里程计方法,仅通过支持多普勒的距离传感器来恢复车辆的完整运动。它利用从场景测量的径向速度,通过单次扫描估计传感器的速度。 |
| Graph-based 3D Collision-distance Estimation Network with Probabilistic Graph Rewiring Authors Minjae Song, Yeseung Kim, Daehyung Park 我们的目标是解决给定 3 维 3D 几何形状的数据驱动碰撞距离估计问题。传统算法由于依赖有限的表示(例如点云)而导致精度较低。相比之下,我们之前基于图的模型 GraphDistNet 使用边缘信息实现了高精度,但随着图大小的增加,消息传递成本更高,限制了其对 3D 几何图形的适用性。为了克服这些挑战,我们提出了 GDN R,一种新颖的基于 3D 图的估计网络。GDN R 采用利用可微 Gumbel 顶 K 松弛的分层概率图重新布线算法。我们的方法通过迭代图重新布线和更新相关嵌入来准确推断最小距离。概率重新布线可以实现对于不可预见的几何类别的快速且稳健的嵌入。通过 150 对 3D 对象的 41,412 个随机基准任务,我们证明 GDN R 在准确性和通用性方面优于最先进的基线方法。我们还表明,所提出的重新布线提高了更新性能,减少了估计模型的大小。 |
| CineTransfer: Controlling a Robot to Imitate Cinematographic Style from a Single Example Authors Pablo Pueyo, Eduardo Montijano, Ana C. Murillo, Mac Schwager 这项工作提出了 CineTransfer,这是一种算法框架,可驱动机器人录制模仿输入视频的电影风格的视频序列。我们提出了抽象输入视频的美学风格的特征,因此机器人可以将这种风格转移到具有与输入视频显着不同的视觉细节的场景。该框架建立在 CineMPC 之上,CineMPC 是一种工具,允许用户通过操纵电影摄影机的内部和外部来控制电影摄影功能,例如图像上的主体位置和景深。然而,CineMPC 需要人类专家指定所需的镜头构图、摄像机运动、变焦、对焦等风格。 CineTransfer 弥补了这一差距,旨在打造一个完全自主的电影平台。用户选择单个输入视频作为风格指南。 CineTransfer 提取并优化两个重要的风格特征,即图像中主体的构图和场景景深,并为 CineMPC 提供指令来控制机器人记录尽可能匹配这些特征的输出序列。与其他风格转移方法相比,我们的方法是一个轻量级且可移植的框架,不需要深度网络训练或大量数据集。 |
| Bridging Low-level Geometry to High-level Concepts in Visual Servoing of Robot Manipulation Task Using Event Knowledge Graphs and Vision-Language Models Authors Chen Jiang, Martin Jagersand 在本文中,我们提出了一个在智能人类机器人交互范围内构建知识机器人控制的框架,通过联合使用事件知识图 EKG 和大规模预训练视觉语言模型 VLM,为基本的未校准视觉伺服控制器提供上下文知识。 。该框架首先进行了双重扩展,我们将低级图像几何解释为高级概念,使我们能够提示 VLM 并选择点和线的几何特征来实现运动控制技能,然后,我们创建事件知识图 EKG 来概念化机器人感兴趣的操作任务,其中 EKG 的主体以可执行行为树为特征,叶子以与操作上下文相关的语义概念为特征。我们通过真实的机器人试验证明,在未经校准的环境中,我们的方法降低了任务接口期间对人类注释的依赖,通过将基于几何的低水平运动控制技能视为高级概念,使机器人能够更轻松地执行日常生活活动, |
| TRAIL Team Description Paper for RoboCup@Home 2023 Authors Chikaha Tsuji, Dai Komukai, Mimo Shirasaka, Hikaru Wada, Tsunekazu Omija, Aoi Horo, Daiki Furuta, Saki Yamaguchi, So Ikoma, Soshi Tsunashima, Masato Kobayashi, Koki Ishimoto, Yuya Ikeda, Tatsuya Matsushima, Yusuke Iwasawa, Yutaka Matsuo 我们的团队 TRAIL 由来自东京大学的 AI ML 实验室成员组成。我们利用在最先进的机器学习方面的丰富研究经验来构建通用的家庭服务机器人。我们之前使用人类支持机器人 HSR RoboCup Home Japan Open 2020 DSPL 和 World Robot Summit 2020 参加了两项比赛,相当于 RoboCup 世界锦标赛。在整个比赛中,我们证明了数据驱动的方法对于执行家庭任务是有效的。为了进一步开发构建多功能且快速适应的系统,在 RoboCup Home 2023 中,我们将最近被评估为深度学习和机器人学习领域组件的三项技术统一到真正的家用机器人系统中。 |
| TWICE Dataset: Digital Twin of Test Scenarios in a Controlled Environment Authors Leonardo Novicki Neto, Fabio Reway, Yuri Poledna, Maikol Funk Drechsler, Eduardo Parente Ribeiro, Werner Huber, Christian Icking 确保自动驾驶汽车在恶劣天气下安全可靠的运行仍然是一个重大挑战。为了解决这个问题,我们开发了一个综合数据集,由在真实测试赛道中获取并在实验室中针对相同测试场景复制的传感器数据组成。提供的数据集包括摄像头、雷达、LiDAR、惯性测量单元IMU以及雨、夜间和下雪等恶劣天气条件下记录的GPS数据。我们使用汽车、骑自行车的人、卡车和行人等感兴趣的对象记录测试场景,其中一些受 EURONCAP 欧洲新车评估计划的启发。实验室生成的传感器数据是通过在循环环境中的硬件中执行基于仿真的测试以及每个真实测试场景的数字孪生来获取的。该数据集包含超过2小时的记录,总计超过280GB的数据。因此,对于自动驾驶汽车领域的研究人员来说,在恶劣天气条件下测试和改进算法以及探索模拟与现实的差距是宝贵的资源。 |
| Frequency Domain Analysis of Nonlinear Series Elastic Actuator via Describing Function Authors Motohiro Hirao, Burak Kurkcu, Alireza Ghanbarpour, Masayoshi Tomizuka 非线性刚度SEAs 受生物肌肉启发的NSEA 为辅助机器人实现自适应刚度提供了希望。虽然辅助机器人通常是根据扭矩能力和控制带宽来设计和比较的,但由于 NSEA 的非线性,尚未在频域中进行系统设计。描述函数是非线性系统的分析概念,提供了一种理解系统在频域中行为的方法。本文介绍了使用描述函数法对非线性串联弹性作动器进行频域分析。 |
| Neuromorphic Robust Framework for Concurrent Estimation and Control in Dynamical Systems using Spiking Neural Networks Authors Reza Ahmadvand, Sarah Safura Sharif, Yaser Mike Banad 机器人系统的并行估计和控制仍然是一个持续的挑战,其中控制器依赖于从充满不确定性和噪声的状态参数中提取的数据。框架的适用性取决于任务复杂性和计算限制,需要计算效率和关键任务准确性之间的平衡。这项研究利用了神经形态计算的最新进展,特别是尖峰神经网络 SNN,用于估计和控制应用。我们提出的框架采用了泄漏集成和激发 LIF 神经元的循环网络,通过稳健的过滤策略(改进的滑动创新过滤器 MSIF)模仿线性二次调节器 LQR。受益于 MSIF 的鲁棒性和 SNN 的计算效率,我们的框架可以定制 SNN 权重矩阵来匹配所需的系统模型,而无需训练。此外,该网络采用了类似于预测编码的生物学上合理的激发规则。在存在不确定性的情况下,我们将 SNN LQR MSIF 与非尖峰 LQR MSIF 以及最佳线性二次高斯 LQG 策略进行比较。对工作台线性问题和卫星交会机动的评估,在空间机器人技术中实施 Clohessy Wiltshire CW 模型,表明 SNN LQR MSIF 在计算效率、鲁棒性和准确性方面实现了可接受的性能。 |
| On Solving Close Enough Orienteering Problem with Overlapped Neighborhoods Authors Qiuchen Qian, Yanran Wang, David Boyle 足够近的旅行商问题 CETSP 是经典旅行商问题的一个众所周知的变体,智能体可以在目标邻域内的任何点完成其任务。基于重叠邻域的启发式方法(称为 Steiner Zones SZ)在解决 CETSP 问题时受到了关注。虽然 SZ 提供了对原始图的有效近似,但它们固有的重叠对搜索空间施加了限制,可能与全局优化目标相冲突。在这里,我们提出了具有非均匀邻域 CEOP N 的足够接近的定向问题,它通过引入可变的奖品属性和奖品收集的非均匀成本考虑因素来扩展 CETSP。为了解决 CEOP N,我们开发了一种新方法,采用随机 Steiner 区域离散化 RSZD 方案以及基于粒子群优化 PSO 和蚁群系统 ACS CRaSZe AntS 的混合算法。 RSZD 方案识别 PSO 探索的子区域,ACS 确定离散访问序列。我们评估了 RSZD 在源自已建立的 CETSP 实例的 CEOP 实例上的离散化性能,并将 CRaSZe AntS 与关注 CEOP 单邻域优化的最相关的最先进启发式进行比较。我们还比较了 SZ 内的内部搜索和 CEOP N 背景下单个邻域的边界搜索的性能。我们的结果表明,与单邻域策略相比,CRaSZe AntS 可以产生可比的解质量,同时显着减少计算时间,我们观察到奖金收集平均增加 140.44,执行时间平均减少 55.18。 |
| DiffPrompter: Differentiable Implicit Visual Prompts for Semantic-Segmentation in Adverse Conditions Authors Sanket Kalwar, Mihir Ungarala, Shruti Jain, Aaron Monis, Krishna Reddy Konda, Sourav Garg, K Madhava Krishna 恶劣天气场景下的语义分割是自动驾驶系统的一项关键任务。虽然基础模型已显示出希望,但为了处理更具挑战性的场景,对专用适配器的需求变得明显。我们引入了 DiffPrompter,这是一种新颖的可微分视觉和潜在提示机制,旨在扩展基础模型中现有适配器的学习能力。我们提出的 nabla HFC 图像处理模块尤其在恶劣的天气条件下表现出色,而传统方法在这种情况下往往达不到要求。此外,我们研究了联合训练视觉提示和潜在提示的优势,证明这种组合方法可以显着提高分发场景外的性能。我们的可微视觉提示利用并行和串行架构来生成提示,有效改进不利条件下的对象分割任务。通过一系列全面的实验和评估,我们提供了经验证据来支持我们方法的有效性。 |
| Open-Fusion: Real-time Open-Vocabulary 3D Mapping and Queryable Scene Representation Authors Kashu Yamazaki, Taisei Hanyu, Khoa Vo, Thang Pham, Minh Tran, Gianfranco Doretto, Anh Nguyen, Ngan Le 精确的 3D 环境测绘对于机器人技术至关重要。现有方法通常在训练期间依赖于预定义的概念,或者在生成语义图时非常耗时。本文介绍了 Open Fusion,这是一种使用 RGB D 数据进行实时开放词汇 3D 映射和可查询场景表示的突破性方法。 Open Fusion 利用预训练视觉语言基础模型 VLFM 的强大功能进行开放集语义理解,并采用截断符号距离函数 TSDF 进行快速 3D 场景重建。通过利用 VLFM,我们提取基于区域的嵌入及其相关的置信图。然后使用增强的基于匈牙利的特征匹配机制将它们与来自 TSDF 的 3D 知识集成。值得注意的是,Open Fusion 为开放词汇提供了出色的无注释 3D 分割,无需额外的 3D 培训。针对领先的零样本方法对 ScanNet 数据集进行的基准测试凸显了 Open Fusion 的优越性。此外,它无缝结合了基于区域的 VLFM 和 TSDF 的优势,促进实时 3D 场景理解,包括对象概念和开放世界语义。 |
| WLST: Weak Labels Guided Self-training for Weakly-supervised Domain Adaptation on 3D Object Detection Authors Tsung Lin Tsou, Tsung Han Wu, Winston H. Hsu 在 3D 对象检测的域适应 DA 领域,大部分工作致力于无监督域适应 UDA。然而,在没有任何目标注释的情况下,UDA 方法和完全监督方法之间的性能差距仍然很明显,这对于现实世界的应用程序来说是不切实际的。另一方面,弱监督域适应 WDA 是一项尚未充分探索但实际的任务,只需要在目标域上进行很少的标记工作。为了以经济有效的方式提高 DA 性能,我们提出了一种通用的弱标签引导自训练框架 WLST,专为 3D 对象检测上的 WDA 设计。通过将自动标记器(可以从 2D 边界框生成 3D 伪标签)合并到现有的自训练管道中,我们的方法能够生成更强大且一致的伪标签,这将有利于目标域上的训练过程。大量实验证明了我们的 WLST 框架的有效性、鲁棒性和检测器不可知性。 |
| HandMeThat: Human-Robot Communication in Physical and Social Environments Authors Yanming Wan, Jiayuan Mao, Joshua B. Tenenbaum 我们推出了 HandMeThat,这是一个对物理和社会环境中的指令理解和遵循进行整体评估的基准。以前的数据集主要侧重于语言基础和规划,而 HandMeThat 则根据物理对象状态和关系以及社会人类行为和目标信息来考虑解决具有歧义的人类指令。 HandMeThat 包含 10,000 个人类机器人交互片段。在每一集中,机器人首先观察人类朝着其内部目标行动的轨迹。接下来,机器人接收人类指令,并应采取行动来完成通过指令设定的子目标。在本文中,我们为我们的基准测试提供了一个文本界面,其中机器人通过文本命令与虚拟环境进行交互。 |
| A Deep Learning Sequential Decoder for Transient High-Density Electromyography in Hand Gesture Recognition Using Subject-Embedded Transfer Learning Authors Golara Ahmadi Azar, Qin Hu, Melika Emami, Alyson Fletcher, Sundeep Rangan, S. Farokh Atashzar 由于越来越多地使用人工智能驱动的人机界面,手势识别 HGR 受到了极大的关注,这些界面可以解释来自周围神经系统的生物信号的深层时空动态,例如表面肌电图 sEMG。这些接口具有广泛的应用,包括扩展现实的控制、灵活的假肢和外骨骼。然而,个体间表面肌电图的自然变异性导致研究人员专注于针对特定主题的解决方案。深度学习方法通常具有复杂的结构,特别需要数据,并且训练起来非常耗时,这使得它们对于特定主题的应用不太实用。在本文中,我们提出并开发了一种瞬态高密度 sEMG HD sEMG 的通用序列解码器,通过受试者嵌入式迁移学习,利用预训练期间获得的 HGR 预先知识,在部分观察的受试者的 65 个手势上实现 73 平均准确度。在手势稳定之前使用瞬态高清表面肌电图使我们能够预测手势,最终目标是平衡系统控制延迟。结果表明,所提出的广义模型明显优于特定于主题的方法,特别是当训练数据有限且存在大量手势类别时。通过建立在预先知识的基础上并结合乘法主题嵌入结构,我们的方法在部分观察的主题上以最小的数据可用性相对实现了超过 13 的平均准确度。 |
| Chinese Abs From Machine Translation |

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关推荐
谢眠1 分钟前
机器学习day6-线性代数2-梯度下降
人工智能·机器学习
sp_fyf_20241 小时前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
CoderIsArt1 小时前
基于 BP 神经网络整定的 PID 控制
人工智能·深度学习·神经网络
开源社1 小时前
一场开源视角的AI会议即将在南京举办
人工智能·开源
FreeIPCC1 小时前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源
机器之心1 小时前
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
人工智能·后端
z千鑫2 小时前
【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比:深度学习框架的终极指南
人工智能·pytorch·深度学习·aigc·tensorflow·keras·codemoss
EterNity_TiMe_2 小时前
【论文复现】神经网络的公式推导与代码实现
人工智能·python·深度学习·神经网络·数据分析·特征分析
机智的小神仙儿2 小时前
Query Processing——搜索与推荐系统的核心基础
人工智能·推荐算法
AI_小站2 小时前
RAG 示例:使用 langchain、Redis、llama.cpp 构建一个 kubernetes 知识库问答
人工智能·程序人生·langchain·kubernetes·llama·知识库·rag