Simultaneous Localization and Mapping for Inspection Robots in Water and Sewer Pipe Networks: A Review
JONATHAN M. AITKEN 1
, MATHEW H. EVANS1
, ROB WORLEY 1
, S. EDWARDS1
,
RUI ZHANG1
, TONY DODD2
, LYUDMILA MIHAYLOVA 1
, (Senior Member, IEEE),
AND SEAN R. ANDERSON 1
1Department of Automatic Control and Systems Engineering, The University of Sheffield, Sheffield S1 3JD, U.K.
2School of Digital, Technology and Arts, Staffordshire University, Stoke-on-Trent ST4 2DE, U.K
Received August 6, 2021, accepted September 8, 2021, date of publication September 27, 2021, date of current version October 19, 2021.
Digital Object Identifier 10.1109/ACCESS.2021.311598
文章目录
- [Simultaneous Localization and Mapping for Inspection Robots in Water and Sewer Pipe Networks: A Review](#Simultaneous Localization and Mapping for Inspection Robots in Water and Sewer Pipe Networks: A Review)
-
- [JONATHAN M. AITKEN 1 , MATHEW H. EVANS1 , ROB WORLEY 1 , S. EDWARDS1 , RUI ZHANG1 , TONY DODD2 , LYUDMILA MIHAYLOVA 1 , (Senior Member, IEEE), AND SEAN R. ANDERSON 1 1Department of Automatic Control and Systems Engineering, The University of Sheffield, Sheffield S1 3JD, U.K. 2School of Digital, Technology and Arts, Staffordshire University, Stoke-on-Trent ST4 2DE, U.K](#JONATHAN M. AITKEN 1 , MATHEW H. EVANS1 , ROB WORLEY 1 , S. EDWARDS1 , RUI ZHANG1 , TONY DODD2 , LYUDMILA MIHAYLOVA 1 , (Senior Member, IEEE), AND SEAN R. ANDERSON 1 1Department of Automatic Control and Systems Engineering, The University of Sheffield, Sheffield S1 3JD, U.K. 2School of Digital, Technology and Arts, Staffordshire University, Stoke-on-Trent ST4 2DE, U.K)
- [智能管道检测:SLAM 技术综述](#智能管道检测:SLAM 技术综述)
- [I. 引言](#I. 引言)
-
-
- 管道网络的规模与投资
- 管道故障的严重性
- 现状:人工操作与局限性
- 现有综述的不足与本文的焦点
- [SLAM 及其在管道中的应用](#SLAM 及其在管道中的应用)
- 论文的组织结构
- [II. 供水和排污管道网络 SLAM 所面临的挑战](#II. 供水和排污管道网络 SLAM 所面临的挑战)
-
- [1. 缺乏 GPS 信号](#1. 缺乏 GPS 信号)
- [2. 管道直径小](#2. 管道直径小)
- [3. 恶劣的内部环境](#3. 恶劣的内部环境)
- [4. 移动的挑战与限制](#4. 移动的挑战与限制)
- [5. 缺乏精确的先验地图](#5. 缺乏精确的先验地图)
- [6. 运动受限](#6. 运动受限)
- [7. 特征稀疏的环境](#7. 特征稀疏的环境)
- [8. 感知混叠(Perceptual Aliasing)](#8. 感知混叠(Perceptual Aliasing))
- [SLAM 的有利方面](#SLAM 的有利方面)
- [III. 水务行业对管道网络地图构建和缺陷定位的要求](#III. 水务行业对管道网络地图构建和缺陷定位的要求)
-
- [A. 管道网络地图构建 (PIPE NETWORK MAPPING)](#A. 管道网络地图构建 (PIPE NETWORK MAPPING))
- [B. 管道缺陷定位 (PIPE DEFECT LOCALIZATION)](#B. 管道缺陷定位 (PIPE DEFECT LOCALIZATION))
- [C. 尺寸、重量、功率和成本 (SWaP-C) 要求](#C. 尺寸、重量、功率和成本 (SWaP-C) 要求)
- [D. 供水管道的特殊要求 (REQUIREMENTS SPECIFIC TO WATER DISTRIBUTION)](#D. 供水管道的特殊要求 (REQUIREMENTS SPECIFIC TO WATER DISTRIBUTION))
- [IV. SLAM 概述](#IV. SLAM 概述)
-
- [A. 预备知识 (PRELIMINARIES)](#A. 预备知识 (PRELIMINARIES))
- [B. SLAM 前端:特征提取、数据关联和闭环检测](#B. SLAM 前端:特征提取、数据关联和闭环检测)
-
- 1) 数据关联方法 数据关联方法)
- 2) 基于外观识别的闭环检测 基于外观识别的闭环检测)
- [C. SLAM 后端:机器人位姿和地图估计](#C. SLAM 后端:机器人位姿和地图估计)
- [D. 视觉里程计和视觉 SLAM (VISUAL ODOMETRY AND VISUAL SLAM)](#D. 视觉里程计和视觉 SLAM (VISUAL ODOMETRY AND VISUAL SLAM))
- [E. 用于 SLAM 的激光扫描仪和激光雷达 (LASER SCANNERS AND LIDAR FOR SLAM)](#E. 用于 SLAM 的激光扫描仪和激光雷达 (LASER SCANNERS AND LIDAR FOR SLAM))
- [F. SLAM 算法比较 (COMPARISON OF SLAM ALGORITHMS)](#F. SLAM 算法比较 (COMPARISON OF SLAM ALGORITHMS))
- [V. 供水和排污管道网络 SLAM 的地图类型](#V. 供水和排污管道网络 SLAM 的地图类型)
-
- [A. 特征地图 (FEATURE MAPS)](#A. 特征地图 (FEATURE MAPS))
-
- 1) 点特征 (POINT FEATURES) 点特征 (POINT FEATURES))
- 2) 大型特征 (LARGE FEATURES) 大型特征 (LARGE FEATURES))
- [B. 密集地图:栅格地图和点云 (DENSE MAPS: GRID MAPS AND POINT CLOUDS)](#B. 密集地图:栅格地图和点云 (DENSE MAPS: GRID MAPS AND POINT CLOUDS))
-
- 1) 栅格地图 (GRID MAPS) 栅格地图 (GRID MAPS))
- 2) 点云 (POINT CLOUDS) 点云 (POINT CLOUDS))
- 3) 表面表示 (SURFACE REPRESENTATIONS) 表面表示 (SURFACE REPRESENTATIONS))
- [C. 拓扑地图 (TOPOLOGICAL MAPS)](#C. 拓扑地图 (TOPOLOGICAL MAPS))
- [D. 语义地图 (SEMANTIC MAPS)](#D. 语义地图 (SEMANTIC MAPS))
- [E. 混合地图 (HYBRID MAPS)](#E. 混合地图 (HYBRID MAPS))
- [F. 地图比较 (COMPARISON OF MAPS)](#F. 地图比较 (COMPARISON OF MAPS))
- [VI. 供水和排污管道中的地图构建和定位传感器](#VI. 供水和排污管道中的地图构建和定位传感器)
-
- [A. 惯性和里程计推算传感器与漂移校正](#A. 惯性和里程计推算传感器与漂移校正)
- [B. 相机 (CAMERAS)](#B. 相机 (CAMERAS))
- [C. 激光扫描仪 (LASER SCANNERS)](#C. 激光扫描仪 (LASER SCANNERS))
- [D. 声学和射频发射-接收传感 (ACOUSTIC AND RADIO FREQUENCY EMITTER-RECEIVER SENSING)](#D. 声学和射频发射-接收传感 (ACOUSTIC AND RADIO FREQUENCY EMITTER-RECEIVER SENSING))
- [E. 地面传感方法,包括探地雷达 (ABOVE-GROUND SENSING METHODS INCLUDING GROUND PENETRATING RADAR)](#E. 地面传感方法,包括探地雷达 (ABOVE-GROUND SENSING METHODS INCLUDING GROUND PENETRATING RADAR))
- [F. 传感器比较 (COMPARISON OF SENSORS)](#F. 传感器比较 (COMPARISON OF SENSORS))
- [IV. SLAM 概述(续)](#IV. SLAM 概述(续))
-
- [A. 预备知识(PRELIMINARIES)](#A. 预备知识(PRELIMINARIES))
- [B. SLAM 前端:特征提取、数据关联和闭环检测](#B. SLAM 前端:特征提取、数据关联和闭环检测)
- [C. SLAM 后端:机器人位姿和地图估计](#C. SLAM 后端:机器人位姿和地图估计)
- [V. 管道SLAM的地图类型](#V. 管道SLAM的地图类型)
- [VI. 供水和排污管道的传感器](#VI. 供水和排污管道的传感器)
-
- [A. 惯性和里程计(IMU + 里程计)](#A. 惯性和里程计(IMU + 里程计))
- [B. 相机](#B. 相机)
- [C. 激光扫描仪(Lidar)](#C. 激光扫描仪(Lidar))
- [D. 声学和RF传感](#D. 声学和RF传感)
- [E. 地面传感(GPR等)](#E. 地面传感(GPR等))
- 传感器优劣总结(表5)
- [VII. 未来的挑战](#VII. 未来的挑战)
-
- [A. 单机器人在管道中的 SLAM](#A. 单机器人在管道中的 SLAM)
-
- 1) 长期鲁棒的自主运行与可扩展性 长期鲁棒的自主运行与可扩展性)
- 2) 具备故障感知和可信度的机器人 具备故障感知和可信度的机器人)
- 3) 路径规划与主动 SLAM 路径规划与主动 SLAM)
- [B. 管网 SLAM 的先验地图生成](#B. 管网 SLAM 的先验地图生成)
- [C. 多机器人在管道中的 SLAM](#C. 多机器人在管道中的 SLAM)
- [VIII. 结论](#VIII. 结论)
-
智能管道检测:SLAM 技术综述
目前,供水和排污管道网络 的检测主要以人工方式进行。
在不久的将来,智慧城市 将利用小型机器人团队 对深埋的管道网络执行智能自主监测 。这些机器人将配备所有必需的计算设施和传感器(光学、声学、惯性、热学、压力等),能够在管道内导航、自主定位,并与人类操作员通信,报告管道状况和故障信息(例如泄漏或堵塞),从而提供监测和决策支持。
从人工到自主:大规模管道检测的挑战
当前以人工为主的管道网络检测,将被能够长时间、大规模运行的自主检测机器人团队所取代。
在这种规模下,可靠的自主导航和故障报告需要有效的定位与地图构建(localization and mapping),即估算机器人的位置及其周围环境。
本综述的焦点与内容
本综述旨在概述机器人同时定位与地图构建(SLAM)技术的最新研究进展,重点关注供水和排污管道网络。它考虑了管道 SLAM 问题的各个方面,包括:
- 动机
- 水务行业的需求
- 现代 SLAM 方法
- 适用于管道的地图类型和传感器
未来挑战与方向
文中还讨论了未来的挑战,例如实现机器人长期在管道中运行所需的鲁棒性 。其中也探讨了如何利用先验知识 (例如地理信息系统 (GIS) )来构建地图估算,并改进管道环境中的多机器人 SLAM 技术。
好的,这是您提供的文本的翻译:
I. 引言
水 是我们最宝贵的自然资源之一。管道网络 负责在水源和目的地之间输送水资源,同样地,排污和排水管道 则将废物从客户处输送到处理厂。对水管网络的检查和维护 [1] 对于保持稳健的供水和节约资源至关重要;对于污水管道,则能防止泄漏造成的污染和清除堵塞。
管道网络的规模与投资
- 在英国 ,用于供水和污水的地下管道网络总长约为 80 万公里 [2]。
- 美国 拥有 120 万英里的供水主管道,以及大致相当长度的排污管道 [3]。
- 对水务和废物基础设施的投资相应巨大:英国已投入超过 2500 亿英镑 [4];美国环境保护局估计,未来 20 年需要投入 2710 亿美元 用于污水/雨水升级,3840 亿美元用于饮用水升级 [5]。
管道故障的严重性
管道网络中的故障,如泄漏、爆裂或堵塞,可能导致严重的破坏,包括供水中断和维修期间的道路封闭。
- 据估计,英国每天因泄漏损失超过 30 亿升的水 [6]。
- 美国每年约有 9000 亿加仑未经处理的污水排入水道 [7]。
因此,对水管和排污管道的持续检查、监测恶化情况以及检测和定位损坏至关重要。
现状:人工操作与局限性
目前,行业中没有 任何可在现实世界使用、能在大空间和长时间范围内自主监测 管道以检测和定位缺陷的移动机器人技术。
目前用于监测管道的行业方法通常是人工操作、有缆(Tethered)系统,例如:
- 用于排污管道的管道内闭路电视 (CCTV) 检查 [8]。
- 用于水管和排污管(及其他地下基础设施)的地面技术 ,包括探地雷达 (GPR) [9], [10] 和电磁定位 (EML) [11], [12]。
行业内也开发了一些用于水管检查的机器人设备,如Sahara [13](有缆设备)和 Smartball [14]。Smartball 是一种较新的、无缆 技术,依赖于自由流动(滚动)检查。然而,这两种机器人技术通常局限于特定、较短的管段进行一次性检查。
现有综述的不足与本文的焦点
以往的综述主要侧重于:
- 水管 [15], [16]、排污管 [17]、小直径管道 [18] 的检查。
- 以及简要提及地下管道的地图构建 [19]。
但重点在于传感器类型和测量技术 ,具体取决于管道的类型。目前缺乏 一篇专注于水管和排污管道网络中机器人定位与地图构建最新技术的综述,而本文正是要解决这一空白。
SLAM 及其在管道中的应用
机器人地图构建和定位方法通常基于同时定位与地图构建 (SLAM):
- 前端处理原始传感器数据,进行特征提取、数据关联和闭环检测。
- 后端优化算法生成机器人的位置和地图估计。
SLAM 对于机器人控制和导航 以及本文所讨论的绘制管道网络地图和定位缺陷都非常有用。SLAM 问题及其经典解决方法已在 [20], [21] 中得到很好的综述,最新的方法和未来挑战则在 [22] 中有所介绍。
本文的目的是综述管道网络中 SLAM 的最新技术进展。重点是水管和排污管,但也会提及相关工作的其他管道(例如燃气管道)。
论文的组织结构
本文的其余部分结构如下:
- 第二节:描述管道环境对 SLAM 带来的特殊挑战。
- 第三节:描述水务行业的高层次要求,并将其与管道 SLAM 的技术要求联系起来。
- 第四节:概述 SLAM 方法。
- 第五节:回顾地图表示,并讨论其在管道中的适用性。
- 第六节:回顾用于管道 SLAM 的不同传感器。
- 第七节:考虑未来的挑战。
- 第八节:给出结论。
好的,这是您提供的第二节内容的翻译:
II. 供水和排污管道网络 SLAM 所面临的挑战
SLAM(同时定位与地图构建)从根本上说是一个难以解决的问题,因为要估计地图 ,你需要对自己的位置 有一个良好的估计;反之,要估计位置 ,你需要对地图 有一个良好的估计。里程计(Odometry)方法可以用于位置估计,但其估计值会随时间漂移。因此,在探索新区域或缺乏可识别地标特征以校正里程计漂移的区域时,SLAM 尤其具有挑战性。
为了可靠运行,SLAM 系统在其所有组成部分中都应具有鲁棒性 :前端感知(通常认为使用多传感器可以提高鲁棒性)、地标识别以及生成位置和地图估计的后端优化算法。
这些是 SLAM 的普遍挑战,但供水和排污管道中的 SLAM 存在许多特殊挑战(并总结在表 1 中),本节将对此进行描述。
1. 缺乏 GPS 信号
水管和排污管通常深埋地下 ,这意味着管道内的机器人无法接收 GPS 信号 来估计其位置。GPS 是最流行和标准的定位方法之一,也常用于校正航位推算(dead reckoning)传感器(如基于里程计和惯性传感)的漂移。缺乏 GPS 信号使得管道中的 SLAM 问题比典型的室外场景更具挑战性。
2. 管道直径小
水管和排污管的直径通常相对较小:
- 全球大多数水管的直径在 100-150 毫米左右。
- 英国大多数排污管的直径在 300 毫米或更小(更多细节见第三节)。
这限制了机器人的尺寸 ,特别是其传感器有效载荷、计算硬件和电池 。这意味着典型的管道机器人可能传感器数量有限,并且某些类型的传感器(例如那些不易小型化或功耗大的)可能不适合该环境。
3. 恶劣的内部环境
水管和排污管内部是难以穿越的环境:
- 它们黑暗。
- 充满水(配水管总是如此,排污管中的废水水位随时间变化)。
- 污水中的废弃物可能造成传感器遮挡。
这使得基于视觉 的 SLAM 特别复杂,因为它需要光源 。脏污环境可能污染传感器 ,也增加了传感器故障 的可能性,因此感知和导航的鲁棒性 以及故障感知机器人技术是一个关键问题。
4. 移动的挑战与限制
移动性也提出了挑战:
- 水管 有压力,机器人逆流移动可能很困难。
- 排污管顺着坡度向下流动,因此人孔连接处的入口管道高度通常会有显著落差,从厘米级到米级不等。
因此,对于水管和排污管来说,单向移动 (分别顺流或顺坡度向下)更容易,这可能会影响主动 SLAM 方法(其目标是主动探索和绘制环境地图)。
5. 缺乏精确的先验地图
另一个挑战是缺乏精确的管道网络地图 。尽管水务公司通常拥有管道网络地图 (以俯视 2D 线图的形式,见图 1),但它们通常含有错误,原因包括:
- 规划更换(地图通常基于此)与实际现场安装之间存在差异。
- 记录丢失(管道可能有数十年的历史)。
- 缺乏精确的记录保存。
地图中的错误可能误导 SLAM 系统 ,可能导致不正确的数据关联 ,进而影响脆弱的后端估计算法 ,导致整个系统失败。因此,一个关键挑战是如何以既有益又鲁棒 的方式将先验地图知识整合到系统中。
6. 运动受限
SLAM 算法通常依赖于从不同位置对相同(静态)地图特征进行连续测量,以减少地图和机器人位置的不确定性。
然而,机器人在管道中的移动主要被限制为沿着管道的一维 (1D) 运动 ,而管道网络本身存在于三维 (3D) 空间 中。这种受限的运动意味着无法从多个视角观察相同的地图特征,从而难以帮助减少地图和定位的不确定性。
7. 特征稀疏的环境
管道内部往往是特征稀疏 的环境,缺乏 能够可靠和重复检测的独特地标。
这对观测外部世界的传感器(如相机和激光扫描仪 )来说是一个特殊问题,尽管基于内部运动测量(如惯性测量和车轮里程计)的传感器不受此影响。例如,相机常用于基于特征的视觉里程计,其中连续图像帧共有的特征用于估计机器人姿态。特征不足可能导致此类算法失败。
8. 感知混叠(Perceptual Aliasing)
闭环检测(Loop closing)是 SLAM 系统的一个重要组成部分,指的是机器人返回到先前访问的位置时能够识别 该地点。闭环检测能够校正漂移误差,从而提高 SLAM 系统的精度。
管道中的闭环检测可能更具挑战性,因为:
- 这是一个高度同质化的环境,视觉特征变化很小。
- 整个网络中重复 着相似的结构和几何形状,例如管道的圆柱形 以及管道接头、连接处和人孔的标准形状。
因此,管道环境容易发生感知混叠 ,即环境中不同的地点产生相似的感知"足迹"。这对管道 SLAM 来说是一个挑战,因为机器人可能容易出现闭环假阳性 (错误地识别地点并闭合循环)和假阴性(未能识别出已返回到先前访问的位置,阻止了成功的闭环)。
SLAM 的有利方面
最后值得注意的是,在管道 SLAM 的各种挑战中,也存在一些优势。例如:
- 排污管通常是直线铺设 的,方向变化发生在人孔 等点,这应该有助于避免航向估计中的漂移。
- 排污管的人孔 和水管的消防栓 出现频率相对较高(相隔约数十米 ),并且可以从地面进行精确测绘 ,当在管道内被正确识别和数据关联时,就可以提供已知的参考点。
因此,环境的某些方面可以被利用来简化 SLAM 问题。
好的,这是第三节内容的翻译:
III. 水务行业对管道网络地图构建和缺陷定位的要求
在本节中,我们将探讨水务行业对管道网络中机器人地图构建和定位的高层次 和技术性 要求。以下章节引用的规范是基于已发表文献(将在接下来的章节中讨论)以及通过个人通信和知识分享活动与关键利益相关者(包括水务公司代表和水务行业技术公司)互动所得出的。这些利益相关者又与客户、监管机构和政府等其他利益相关者进行互动并受其指导。
英国的监管机构------水务服务监管局(OFWAT )已经发布了要求,将弹性 ,特别是运营弹性 ,列为一项关键要求 [23]。运营弹性意味着:
- 减少 供水中断和污水泛滥的可能性。
- 通过高效处理、良好沟通和快速恢复来减轻 任何中断的影响。
水务行业运营弹性的要求有许多不同的促成因素,但本综述主要关注机器人地图构建和定位可以协助的两个关键方面:
- 管道网络地图构建,以便水务公司知道其资产的位置。
- 缺陷定位 ,以便水务公司知道在哪里进行维修,尤其是当这涉及到挖掘街道的成本和中断时。
A. 管道网络地图构建 (PIPE NETWORK MAPPING)
负责管理管道网络的供水和排污公司通常并未完全了解深埋管道的位置。这可能是由于多种原因,例如:
- 安装时未记录管道位置。
- 信息记录不准确。
- 信息随时间丢失。
因此,管道网络地图构建是机器人检测系统的一项基本任务,以便水务公司了解其资产的位置。
管道网络地图可以用几个关键变量来描述:
- 管道的 3D 坐标,即 X、Y、Z 位置。
- 管道直径 \\mathbf{d}。
- 管道坡度 \\mathbf{g}。
现有方法的测量已经有指定的精度水平,管道内机器人必须与之竞争。例如:
- 英国标准协会 (BSI) 发布了公开可用的规范 PAS 128 [12],用于地下公用设施的检测、验证和定位,其中规定的精度水平见表 2。
- 类似地,美国土木工程师协会 (ASCE) 发布了《现有地下公用设施数据收集和描绘标准指南》[24],给出了四种公用设施检测质量水平,如表 3所示。
B. 管道缺陷定位 (PIPE DEFECT LOCALIZATION)
管道网络中需要定位的缺陷主要有两种类型:
- 次要缺陷 :了解其位置对于长期监测缺陷很重要。
- 主要缺陷 :找到其位置对于维修过程 至关重要------无论是传统的开挖 还是使用非开挖技术。
为降低成本(包括恢复费用)、最大限度地减少中断,并限制损坏相邻地下公用设施的可能性,开挖尺寸应保持最小 。与水务公司的讨论表明,低于 0.5 米的定位精度是指导开挖所需要的,这为机器人 SLAM 系统定义了精度要求。
然而,行业强调的一个关键点是:他们倾向于第一次尝试就在正确的位置进行开挖 ------即,通常宁愿进行一次性较大的开挖,也不愿在错误位置进行多次较小的开挖。这意味着 SLAM 系统应该通过概率方法 正确地表征其位置不确定性。
报告缺陷和随后维修的时间尺度取决于故障的类型和相关的严重程度:
- 管道网络地图构建可以在较长的时间尺度(数月或数年)内处理,并将持续进行。
- 排污管堵塞和水管小泄漏也可以在中等时间尺度(数周至数月)内处理。
- 水管爆裂需要在较短的时间尺度(数天)内处理。
C. 尺寸、重量、功率和成本 (SWaP-C) 要求
供水和排污管道网络机器人系统的 尺寸、重量、功率和成本 (SWaP-C) 要求是一个重要的考量因素,它们与地图构建和定位的许多问题相关。
- 尺寸限制:小直径管道中对机器人(尤其是传感器)的尺寸限制,限定了可用于 SLAM 的技术类型。
- 功率限制 :移动机器人将是无缆的,必须在测绘网络时在充电站之间移动;至关重要的是,它们在这些点之间不能失去动力,以免在网络中迷失,造成堵塞和额外的回收成本。
- 成本限制 :用于检查和维护的机器人解决方案的成本需要与现有的人工解决方案(例如,两名人员操作手动闭路电视检查系统)具有竞争力。
水管和排污管的尺寸差异很大:
- 全球大多数配水管 的直径倾向于在 100-150 毫米 范围内(更多细节见表 4)[25],而非常大的输水干线可以有数米宽。
- 排污管 的尺寸也差异很大,英国约 70% 的排污管直径小于 300 毫米 ,而只有 9% 的直径为 900 毫米或更大 [26]。
因此,用于配水管或排污管的机器人需要相对较小 以确保网络覆盖,或者需要开发不同尺寸的机器人 。小尺寸机器人反过来将要求小型传感器有效载荷、电池和计算硬件。
一个关键的额外细节是,进入管道网络的入口点尺寸 是对机器人尺寸的硬性约束:
- 在配水管 中,消防栓 提供了自然的接入点,这很有吸引力,因为它避免了创建特殊机器人接入点相关的成本。英国新型的通孔式消防栓 的管道直径仅为 80 毫米,如果使用这些入口,这就给机器人尺寸设定了上限(尽管英国许多旧式消防栓有急弯和限制性阀门,会使机器人插入更加困难)。
- 排污管 在很大程度上避免了入口尺寸的顾虑 ,因为它们可以通过大型人孔进入。
功率要求 主要涉及执行器、传感器和计算硬件 。现代机器学习技术(例如基于深度学习的视觉导航算法 [27], [28])可能需要相对高功率的专用计算设备(基于嵌入式通用图形处理单元 GPGPU)。
功率要求 (以运行的瓦特小时计)也应结合机器人最终应能长期 (数月乃至数年)执行管道网络检查的目标来考虑。这意味着机器人将需要充电 ,因此需要在管道网络中专门增加充电点 。关于功率的问题实际上变成了充电之间的时间和距离 ,以及安装充电点相关的基础设施成本。
D. 供水管道的特殊要求 (REQUIREMENTS SPECIFIC TO WATER DISTRIBUTION)
水是一种独特的管道商品,与污水、石油和天然气不同(后两者的管道监测已在其他地方进行综述 [29]),水必须适于人类饮用 。机器人的使用绝不能降低水质安全,这在机器人设计中产生了两个主要问题:
- 避免 因将异物引入管道网络而造成水污染。
- 避免 使管道壁上的物质脱落而出现在客户的水龙头中。
虽然这些要求更多地涉及机器人的机械设计 和机器人插入设备,但由于其重要性,在此仍值得注意。
IV. SLAM 概述
SLAM 问题通常被分为两部分 :前端 (front-end) 和后端 (back-end)(见图 2)。
- 前端 :处理原始传感器数据以提取特征 并执行数据关联 ,即短期内机器人绕物体移动时的特征跟踪 ,以及长期内机器人返回并识别先前访问位置时的闭环检测。
- 后端 :使用前端提取的信息,估计机器人的姿态 (其在 2D 或 3D 空间中的位置和方向)和地图 。后端通常使用标准方法,例如扩展卡尔曼滤波、粒子滤波或平滑方法 来执行估计。后端可以为闭环检测 提供反馈给前端。(图 2 经过重新绘制和修改自 [22])。
好的,这是您提供的第四节到第六节内容的翻译:
A. 预备知识 (PRELIMINARIES)
典型的 SLAM 问题是通过联合概率分布来表述的,该分布表示了截至当前时间步 k 的机器人历史位姿 \\mathbf{X}_{1:k} 以及地图 \\mathbf{m}:
p ( X 1 : k , m ∣ Z 1 : k , U 1 : k , x 0 ) ( 1 ) p(\mathbf{X}{1:k}, \mathbf{m}|\mathbf{Z}{1:k}, \mathbf{U}_{1:k}, \mathbf{x}_0) \quad (1) p(X1:k,m∣Z1:k,U1:k,x0)(1)
其中:
- \\mathbf{x}_0 是初始机器人位姿。
- \\mathbf{U}_{1:k} 是控制输入(或里程计测量值)的历史记录。
- \\mathbf{Z}_{1:k} 是所有观测到的地图地标集合。
具体地:
- \\mathbf{X}_{1:k} = {\\mathbf{x}_1, \\dots, \\mathbf{x}_k} \\quad (2)
- \\mathbf{Z}_{1:k} = {\\mathbf{z}_1, \\dots, \\mathbf{z}_k} \\quad (3)
- \\mathbf{U}_{1:k} = {\\mathbf{u}_1, \\dots, \\mathbf{u}_k} \\quad (4)
机器人位姿 \\mathbf{x}_k 在 3D 空间中可以定义为:
x k = ( X k , Y k , Z k , θ k , ϕ k , ψ k ) T ( 5 ) \mathbf{x}_k = (X_k, Y_k, Z_k, \theta_k, \phi_k, \psi_k)^T \quad (5) xk=(Xk,Yk,Zk,θk,ϕk,ψk)T(5)
其中 (X_k, Y_k, Z_k) 定义了机器人在世界坐标系中的 3D 位置 ,(\\theta_k, \\phi_k, \\psi_k) 定义了其方向(俯仰角、偏航角、滚转角),同样是在世界坐标系中。
地图 \\mathbf{m} 可以由世界中检测到的可识别特征或地标的空间位置来指定:
m = { l 1 , ... , l n m } T ( 6 ) \mathbf{m} = \{ \mathbf{l}1, \dots, \mathbf{l}{n_m} \}^T \quad (6) m={l1,...,lnm}T(6)
其中 \\mathbf{l}*i = { l* {i,x}, l_{i,y}, l_{i,z} }\^T 是第 i 个地标在世界坐标系中的位置,n_m 是地图特征的数量。地图也可以用更密集的形式表示,例如栅格地图 。本文假设地图是静态的,因此 \\mathbf{m} 与时间步 k 无关,这与机器人位姿不同。
我们假设机器人状态可以通过以下方式更新:
p ( x k ∣ x k − 1 , u k ) ⟺ x k = f ( x k − 1 , u k ) + w k ( 7 ) p(\mathbf{x}k | \mathbf{x}{k-1}, \mathbf{u}_k) \iff \mathbf{x}k = f(\mathbf{x}{k-1}, \mathbf{u}_k) + \mathbf{w}_k \quad (7) p(xk∣xk−1,uk)⟺xk=f(xk−1,uk)+wk(7)
其中 f(\\cdot) 函数定义了状态转移 ,\\mathbf{u}_k 是机器人的输入(或里程计测量值),\\mathbf{w}_k 是状态噪声,我们假设它是均值为零、白噪声的高斯分布,协方差为 \\mathbf{Q}_k,即 \\mathbf{w}_k \\sim \\mathcal{N}(0, \\mathbf{Q}_k)。
接下来,我们假设对地图特征 \\mathbf{z}_k 的观测可以通过测量函数 h(\\cdot) 与状态相关联:
p ( z k ∣ x k , m ) ⟺ z k = h ( x k , m ) + v k ( 8 ) p(\mathbf{z}_k | \mathbf{x}_k, \mathbf{m}) \iff \mathbf{z}_k = h(\mathbf{x}_k, \mathbf{m}) + \mathbf{v}_k \quad (8) p(zk∣xk,m)⟺zk=h(xk,m)+vk(8)
其中 \\mathbf{v}_k 是观测噪声,我们假设它是均值为零、白噪声的高斯分布,协方差为 \\mathbf{R}_k,即 \\mathbf{v}_k \\sim \\mathcal{N}(0, \\mathbf{R}_k)。
B. SLAM 前端:特征提取、数据关联和闭环检测
机器人技术中使用了各种传感器,它们产生不同类型的原始数据。例如,相机产生像素数据,而激光扫描仪产生距离和方位数据。
SLAM 前端 首先执行特征提取,将这些不同类型的原始数据处理成可直接用于后端估计过程的测量格式 \\mathbf{z}_k(即特征)。
前端还执行数据关联,即找到地图 \\mathbf{m} 中最有可能与测量值 \\mathbf{z}_k 相关联的特征,这使得我们能够写出上面的测量方程 (8)。
数据关联有两个方面:
- 短期数据关联,处理连续传感器测量值之间的数据关联。
- 长期数据关联 ,即闭环检测 (loop closing),当机器人返回到先前访问的位置时,通过将当前测量值与先前测绘的地标相关联来识别该地点。
数据关联可能出现两种主要类型的错误:
- 假阳性 (false positives) :观测值与地图之间发生了错误的关联 ------这可能导致后端算法灾难性失败。
- 假阴性 (false negatives) :观测值被拒绝为伪造------这导致后端数据减少,可能会降低估计精度,但可以说比假阳性不那么严重。
1) 数据关联方法
数据关联可以使用简单的统计验证门控 (statistical validation gating) 来执行,类似于目标跟踪中的用法 [30]。验证门的思想是,地图中任何先前测绘的地标都必须落在一个由该门定义的区域内,才能被认为是有效,可与当前地标测量值相关联。
如果多个地标落入由 (11) 定义的门控区域内,则必须采用额外的数据关联方法 。最简单的方法之一是将测量值与门内最近的已测绘地标相关联,即最近邻方法 ,称为个体兼容性最近邻 (ICNN) [31]。
早期的 SLAM 实现使用了最近邻方法 [32],但当用于多个地标时,这种方法容易出错 [21]。后来的方法考虑了更鲁棒的批量模式 数据关联,例如联合兼容性分支定界 (JCBB) [31]。JCBB 也被扩展到处理测量点众多且相关的 2D 激光雷达扫描 [33]。
自早期工作以来 [34],多假设方法 也被用于 SLAM 的数据关联中,直到现代系统,例如将 JCBB 扩展到 MHJCBB(多假设 JCBB)[35]。这些方法有可能更鲁棒,但计算强度也往往高得多。
2) 基于外观识别的闭环检测
闭环检测 通常基于外观识别 (appearance recognition)。这可以通过各种传感器完成,例如相机和激光扫描仪。
快速基于外观的地图构建 (FAB-MAP) 算法 [36] 开发了一种视觉外观识别算法,它使用从语音识别修改而来的词袋 (bag-of-words, BOW) 方法------其思想是构建一个将图像存储为 BOW 空间中数值向量的数据库。为了构建 BOW,从地点的图像中提取视觉特征以创建视觉词 ,使用 SIFT [37] 或 SURF [38] 等方法,然后每个地点由一个直方图 表示,即每个视觉词在图像中出现的频率。FAB-MAP2 [39] 使这种方法更高效,可以实现更大环境的闭环。通过向图像匹配过程添加快速几何检查 [40],基于 BOW 方法的外观识别也得到了扩展和增强。
FAB-MAP 仅使用单个图像 进行外观识别,这可能对外观变化敏感,例如由于光照条件变化、季节性变化、视点变化和动态物体。因此,开发了 SeqSLAM [41],它使用一系列图像 进行外观识别,并且往往是一种更鲁棒的方法。SeqSLAM 使用绝对差之和 (SAD) 来匹配最近观测值和数据库之间的图像序列。SeqSLAM 进行了各种更新,例如更高效的版本,它避免了详尽搜索,而是使用带有最近邻的高效树搜索 [42]。关于 FAB-MAP 和 SeqSLAM 等基于外观识别方法的综述可以在 [43] 中找到。
深度学习 方法现在也应用于基于视觉外观的识别问题 ,其中最初的方法使用经过图像识别预训练的深度卷积神经网络 (DCNN) [44], [45]:其思想是使用 DCNN 的内层作为自动生成的特征 ,而不是通常在外观识别中使用的"手工设计"特征,如 SIFT 或 SURF。NetVLAD [46] 通过获取 DCNN 特征并将它们通过专门为图像检索设计的局部聚合描述符向量 (VLAD) 模块 ,改进了基本 DCNN 的使用。随后,[47] 引入了一个大规模数据集,用于有针对性地训练 DCNN 进行视觉地点识别,证明了相比仅使用重新利用的图像识别 DCNN 有所改进。最近的工作表明,当使用图像序列 并为匹配保持多重假设 时 [48],传统图像处理特征 (梯度方向直方图 HOG )和 DCNN 特征 都可以提供鲁棒的性能。为了结合上述方法的优势,SAD、HOG 和 DCNN 特征已被融合以提供最先进的性能 [49]。
距离数据 ,通常来自激光扫描仪或激光雷达 (lidar) ,也可以用于执行基于外观识别的闭环检测,无论是 2D [50], [51] 还是 3D [52], [53]。使用距离数据克服了相机对不同光照条件的敏感性。与视觉外观识别类似,深度学习 近年来也应用于基于距离的 3D 激光雷达外观识别问题 [54]。
C. SLAM 后端:机器人位姿和地图估计
用于获取机器人位姿 \\mathbf{x}_k 和地图 \\mathbf{m} 的 SLAM 后端估计算法大致分为两类:
- 基于滤波器 (Filter-based) 的算法 :这些算法递归 地估计当前的机器人位姿和地图,即它们产生估计值 \\mathbf{\\hat{x}}_k,通常被表述为贝叶斯滤波 问题。主要方法包括基于扩展卡尔曼滤波器 (EKF) (例如 EKF-SLAM [55]--[58])、稀疏扩展信息滤波器 (SEIF) [59]、粒子滤波器 (PF) (例如 DP-SLAM [60])和 Rao-Blackwellized 粒子滤波器 (RBPF)(例如 FastSLAM [61], [62] 及其变体 [63])。
- 基于平滑器/优化 (Smoother/optimization-based) 的算法 :这些算法使用所有数据以批量模式 估计机器人的历史位姿和地图,即它们产生估计值 \\mathbf{\\hat{X}}_{1:k},通常被表述为稀疏非线性最小二乘 问题。主要方法是基于图的方法,例如 GraphSLAM [64], [65]、平滑和地图构建 (SAM) [66] 和增量平滑和地图构建 (iSAM/iSAM2) [67], [68]。
关于位姿/地图估计问题的扩展,首先,我们根据 (1) 定义以下最大后验 (MAP) 问题:
{ X ^ 1 : k , m ^ } = arg max X 1 : k , m { p ( X 1 : k , m ∣ Z 1 : k , U 1 : k , x 0 ) } ( 12 ) \{\mathbf{\hat{X}}{1:k}, \mathbf{\hat{m}}\} = \arg \max{\mathbf{X}{1:k}, \mathbf{m}} \{ p(\mathbf{X}{1:k}, \mathbf{m}|\mathbf{Z}{1:k}, \mathbf{U}{1:k}, \mathbf{x}_0) \} \quad (12) {X^1:k,m^}=argmaxX1:k,m{p(X1:k,m∣Z1:k,U1:k,x0)}(12)
假设测量值和状态预测是独立的,并使用贝叶斯规则,我们可以说:
p ( X 1 : k , m ∣ Z 1 : k , U 1 : k , x 0 ) = η ∏ k = 1 N p ( z k ∣ x k , m ) ∏ k = 1 N p ( x k ∣ x k − 1 , u k ) ( 13 ) p(\mathbf{X}{1:k}, \mathbf{m}|\mathbf{Z}{1:k}, \mathbf{U}_{1:k}, \mathbf{x}0) = \eta \prod{k=1}^N p(\mathbf{z}_k | \mathbf{x}k, \mathbf{m}) \prod{k=1}^N p(\mathbf{x}k | \mathbf{x}{k-1}, \mathbf{u}_k) \quad (13) p(X1:k,m∣Z1:k,U1:k,x0)=η∏k=1Np(zk∣xk,m)∏k=1Np(xk∣xk−1,uk)(13)
其中 \\eta 是归一化常数。请注意,为了简化方程式,我们采取了初始位姿 \\mathbf{x}_0 完全已知的常见假设。
将 (7) 和 (8) 替换到 (13) 中,两者都受高斯噪声影响,并注意到最大化 (13) 等效于最小化负对数后验,从而得出类似于 [64] 和 [66] 中定义的非线性加权最小二乘问题:
J ( X 1 : k , m ) = ∑ k = 1 N ∥ x k − f ( x k − 1 , u k ) ∥ Σ k − 1 2 + ∑ k = 1 N 1 2 ∥ z k − h ( x k , m ) ∥ Ω k − 1 2 ( 14 ) J(\mathbf{X}{1:k}, \mathbf{m}) = \sum{k=1}^N \| \mathbf{x}k - f(\mathbf{x}{k-1}, \mathbf{u}k) \|^2{\mathbf{\Sigma}k^{-1}} + \sum{k=1}^N \frac{1}{2} \| \mathbf{z}_k - h(\mathbf{x}k, \mathbf{m}) \|^2{\mathbf{\Omega}_k^{-1}} \quad (14) J(X1:k,m)=∑k=1N∥xk−f(xk−1,uk)∥Σk−12+∑k=1N21∥zk−h(xk,m)∥Ωk−12(14)
其中 \\left\| \\mathbf{a} \\right\|\^2_{\\mathbf{P}} = \\mathbf{a}\^T \\mathbf{P} \\mathbf{a},权重矩阵 \\mathbf{\\Sigma}_k\^{-1} = \\mathbf{Q}_k\^{-1} 且 \\mathbf{\\Omega}_k\^{-1} = \\mathbf{R}_k\^{-1}。
SLAM 估计算法的主要区别在于如何最小化这个成本函数 J(\\mathbf{X}_{1:k}, \\mathbf{m})。
- 基于滤波器的方法 (EKF [56]--[58]、SEIF [59]、PF [60] 和 RBPF [61], [63])使用递归算法来产生当前机器人位姿 \\mathbf{\\hat{x}}_k 的估计。
- 相比之下,平滑/优化算法 (GraphSLAM [64], [65] 和 SAM [66]--[68])使用批量数据 和稀疏最小二乘法 来产生整个状态历史 \\mathbf{\\hat{X}}_{1:k} 的估计,其中利用 SLAM 问题中的稀疏结构 来提高算法的计算效率。稀疏结构源于每个地标仅被少量位姿观察的事实。平滑和优化算法的一个关键优势在于,当进行新的闭环时,它们本质上会校正所有先前的机器人位姿。
许多 SLAM 算法(EKF、SEIF、GraphSLAM 和 SAM),除了基于 PF 的那些,都使用 J(\\mathbf{X}_{1:k}, \\mathbf{m}) 的线性化形式来简化估计过程。
平滑和优化算法的一个重要优势在于,它们能够迭代线性化问题直到收敛 ,而滤波算法(EKF 和 SEIF)只执行一次更新 ,这意味着滤波方法更容易出现线性化误差。
D. 视觉里程计和视觉 SLAM (VISUAL ODOMETRY AND VISUAL SLAM)
相机已成为机器人技术中的主导传感器类型,因此,关于相机在 SLAM 中应用的文献非常广泛和专业。
视觉里程计 (VO) 通常用于机器人技术中的纯定位 部分,即位姿估计,而不进行地图构建 [81]。
完整的视觉 SLAM (vSLAM) 问题可以大致定义为 [82]:
vSLAM = VO + 全局地图优化 \text{vSLAM} = \text{VO} + \text{全局地图优化} vSLAM=VO+全局地图优化
其中全局地图优化 通常使用前面讨论的闭环检测 和平滑/优化算法来完成。
vSLAM/VO 问题可以使用立体相机 (stereo) [83]--[88] 或单目相机 (monocular) [89], [90] 来解决。
VO 算法 在管道机器人技术中特别受关注,因为从位姿 \\mathbf{x}_k 重建机器人路径本质上生成了管道网络地图(因为机器人沿着管道移动,因此机器人位姿 \\mathbf{x}_k 定义了管道位置以及机器人位姿)。
VO 算法 可以分为基于特征的方法 (例如 ORB-SLAM [88], [93])和直接法 (直接对像素强度进行操作,例如 LSD-SLAM [95] 和 DSO [92])。
另一种重要的 VO 方法是基于深度学习 的 [96]--[102]。这些方法在基准问题上似乎能给出与其他 VO 方法相媲美的结果,并且具有端到端 的优势,因此不需要相机标定、特征提取和匹配以及在线优化 。然而,它们通常需要大量的训练数据,这对于污水和水管来说可能是一个问题。
VO 通常与惯性测量单元 (IMU) 融合,称为视觉-惯性导航系统 (VINS) 或视觉惯性里程计 (VIO) [105], [106]。将 VO 与 IMU 融合往往可以提高精度 ,成本低廉 ,并且对于单目系统有助于解决尺度模糊性。
E. 用于 SLAM 的激光扫描仪和激光雷达 (LASER SCANNERS AND LIDAR FOR SLAM)
激光扫描仪和激光雷达 (lidar) 是 SLAM 中使用的另一种主要传感器类型,与相机并列。激光雷达传感器会产生环境扫描,返回附近物体的距离和方位。激光雷达 SLAM 问题通常也分为里程计类型 的问题(使用连续扫描进行位姿估计)和带有闭环检测的单独地图更新 [120]。
通常使用扫描匹配算法 来估计机器人位姿,这本质上是一种里程计方法 ,会随时间漂移。扫描匹配通常基于迭代最近点 (ICP) 类型的算法 [113], [121]。
可以使用扫描到地图匹配 [123] 或扫描到子图匹配 [115], [126] 来执行闭环检测。
激光雷达也可以与视觉融合,以克服不同方法相关的问题 [119], [127]。
F. SLAM 算法比较 (COMPARISON OF SLAM ALGORITHMS)
-
前端方法 (数据关联和闭环检测)对于管道环境的感知混叠 高可能性,必须鲁棒 。我们预计仅基于视觉的外观识别在管道中将具有挑战性,因此使用多传感器数据融合 和先验地图知识来提高鲁棒性将非常重要。
-
后端 SLAM 算法的优势和劣势:
- EKF 方法相对简单,但在中小型地图问题中表现良好,但可能不一致,导致滤波器发散。
- SEIF 和 FastSLAM 提高了 EKF-SLAM 的计算效率。
- 平滑/优化方法 优于基于滤波器的方法,因为它们在估计中处理所有数据 ,当闭环时,这本质上会导致对较旧位姿和地图估计的校正,并且不易发散。因此,平滑方法在现代 SLAM 实现中往往更受青睐。
管道中的 SLAM 需要计算高效 的解决方案,适用于计算资源适中的小型机器人。因此,管道中的 SLAM 很可能会假设已知地图 用于在线定位 ,而只间歇性地执行 SLAM。
V. 供水和排污管道网络 SLAM 的地图类型
地图选择对 SLAM 系统的精度、计算效率和鲁棒性 都有影响。对于管道环境中的机器人,地图选择将受到机器人尺寸、传感器载荷、运动方式 (例如,主要是一维运动)以及水务公司现有地图的准确性等因素的影响。
A. 特征地图 (FEATURE MAPS)
1) 点特征 (POINT FEATURES)
点特征可以从传感器数据(如图像)中提取,通常对应于环境中可以识别和区分的显著点(见图 4(a))。这些方法检测图像中的突出点,并使用附近像素的强度变化来描述该点。
2) 大型特征 (LARGE FEATURES)
环境可以表示为墙壁、门、家具等几何特征。对于管道,特征可以是管道的圆柱形形状 (见图 4c)、管道接头、弯头、三通等。早期 SLAM 工作使用了简单的几何表示,例如平面、圆柱体和角点 [135]。
B. 密集地图:栅格地图和点云 (DENSE MAPS: GRID MAPS AND POINT CLOUDS)
1) 栅格地图 (GRID MAPS)
连续度量空间可以分解为离散、有限大小的单元格网格。在占用栅格地图 (见图 4b)中 [145], [146],每个单元格具有被物体占据或为空的概率。栅格表示具有灵活性 ,并且不需要对特征进行解释或数据关联 ,但精度损失 不可避免,且在高分辨率大规模测绘时需要大量内存。
2) 点云 (POINT CLOUDS)
点云 表示(见图 4a)是一组代表机器人观测到的环境中特征位置的数据点,通常只有位置数据。它内存密集,可能不适合内存容量有限的小型管道机器人。
3) 表面表示 (SURFACE REPRESENTATIONS)
密集表面表示 (如 Surfel 地图 [152] 和截断符号距离场)利用了传感器数据的更多信息,即使在纹理较低 的表面上也能提供良好性能。由于管道环境主要由简单表面组成,因此这一概念很容易适用。然而,与点云一样,这些表示计算成本高昂,不利于在管道中的小型机器人应用。
C. 拓扑地图 (TOPOLOGICAL MAPS)
拓扑地图 (见图 4d)描述了环境中的离散地点 ,其定义基于连通性而非度量关系。
管道网络 可以自然地被描述为节点 (如连接点或人孔)和连接这些节点的走廊 (管道)。拓扑表示的优势在于降低了在大型环境中定位和导航的计算成本 [156]。对于管道环境,即使精确的度量信息可能不可用 ,但其通用拓扑结构通常是已知的。
D. 语义地图 (SEMANTIC MAPS)
语义地图 包含环境的空间信息 和特征的分类 [163]。在管道中具有语义意义的特征包括:管段长度、三通、弯头、阀门、管接头、用户连接、消防栓连接和人孔 。由于水务公司现有的地图已经对人孔和阀门等特征进行了语义标记,因此在语义 SLAM 中包含和利用这些先验知识是很自然的。
E. 混合地图 (HYBRID MAPS)
混合地图(例如度量/拓扑 SLAM [170]--[172])适用于结合管道网络的拓扑结构(用于高效路径规划和探索)和度量信息(用于精确定位缺陷)的需求。
F. 地图比较 (COMPARISON OF MAPS)
在管道环境中,计算受到显著限制 ,灵活性需求较低 ,而所需的精度可能有所不同 (取决于是在导航还是精确定位故障)。因此,管道环境的有效地图表示很可能是一种混合表示 ,它在一定程度上利用环境拓扑进行高效路径规划和探索,并使用度量表示来精确测绘网络和定位故障。
VI. 供水和排污管道中的地图构建和定位传感器
A. 惯性和里程计推算传感器与漂移校正
管道内定位的最简单方法是基于航位推算 (dead-reckoning) 技术,通常结合惯性测量单元 (IMU) 和某种形式的里程计 [177], [178]。漂移 是航位推算传感器的关键问题,因此需要结合地标检测 来进行漂移校正 。地标可以是自然产生的 (如管段接头 [180])或故意添加到管道网络中的(如 GPS 定位的地面参考站 [186])。
B. 相机 (CAMERAS)
相机由于其多功能性,通常被安装在管道检查机器人上。早期的工作仅使用视觉来估计沿着管道行进的距离 [194],但现在更常使用现代 VO 系统。
- 鱼眼相机最常用于管道中的 VO,因为环境狭窄 [139]。
- 立体相机 (双目)比单目系统有优势,因为它们有固定的基线,有助于三角测量,并自动解决尺度模糊性。
- 单目系统 已被用于管道中,例如结合结构光来恢复尺度因子 [139]。
- 深度 (RGB-D) 相机 具有优势,它们还可以轻松用于检测管道中的障碍物 [203]--[205]。
许多管道 VO 算法利用圆柱形信息 ,即利用环境形状的先验知识 来提高位姿估计精度 [196]。相机也可以用于基于外观的 SLAM 方法和识别管道中的地标特征,如三通、弯头等 [168]。
C. 激光扫描仪 (LASER SCANNERS)
激光扫描仪已被用于管道检查多年 [17],也用于管道导航。它们通常用于识别排污管中的地标特征,如三通、接头和弯头 [167]。
D. 声学和射频发射-接收传感 (ACOUSTIC AND RADIO FREQUENCY EMITTER-RECEIVER SENSING)
最近出现了一些发射-接收方法,旨在克服视觉的潜在限制,利用声学和射频传感。
- 高频超声波 [218]、中频水听器 [219]--[221] 和射频 (RF) 传感 [222], [223] 都应用于管道定位,它们都使用发射-接收方法沿着管道创建一维空间地图。
- 低频声学传感 已被用于绝对测量机器人在管道中的位置,相比随时间漂移的视觉里程计具有优势 [224], [225]。
E. 地面传感方法,包括探地雷达 (ABOVE-GROUND SENSING METHODS INCLUDING GROUND PENETRATING RADAR)
地面方法 常用于管道检测和定位,它们可以作为管道内机器人 SLAM 系统的有用组成部分,提供先验信息 并与管道内地图估计融合 以改进资产测绘。探地雷达 (GPR) [9] 是最主要的地面方法之一,它通常与 GPS、激光雷达等附加传感器结合使用 [228]。
F. 传感器比较 (COMPARISON OF SENSORS)
不同类型的传感器各有优势和劣势(总结在表 5 中):
- 惯性和里程计 :提供简单的定位,但容易漂移,需要地标识别进行校正。
- 相机 :应用最广泛,但在管道中存在特征缺乏、感知混叠、计算密集、易脏污、需要光源等问题。
- 激光扫描仪/激光雷达 :不需要光源 ,但传感器成本高且笨重 ;主要用于地标识别,似乎不适用于沿着管段的位姿估计。
- 声学传感 :在管道中传播良好,不需要光源。
- 地面方法 :可用于先验信息 和数据融合,但自主实施可能更复杂。
因此,多传感器数据融合 似乎是管道 SLAM 传感器选择最具吸引力的方法。视觉里程计、声学方法和惯性传感 非常适合沿着管段的定位。漂移校正方法 对于使用人孔或管道接头等地标的里程计类型方法至关重要。
这是你提供的第4章到第6章的翻译:
IV. SLAM 概述(续)
A. 预备知识(PRELIMINARIES)
典型的 SLAM 问题是用联合概率分布表示的,即:截至当前时间 k 的机器人历史位姿 X_{1:k} 和地图 m:
p ( X 1 : k , m ∣ Z 1 : k , U 1 : k , x 0 ) p(X_{1:k}, m | Z_{1:k}, U_{1:k}, x_0) p(X1:k,m∣Z1:k,U1:k,x0)
其中:
-
x_0 为机器人初始位姿
-
U_{1:k} 表示控制输入(或里程计测量)
-
Z_{1:k} 是所有观测到的地图地标集合。
具体定义为:
-
X_{1:k} = {x_1, ..., x_k}
-
Z_{1:k} = {z_1, ..., z_k}
-
U_{1:k} = {u_1, ..., u_k}
机器人在时刻 k 的位置 x_k 在三维空间中定义为:
x k = ( X k , Y k , Z k , θ k , ϕ k , ψ k ) T x_k = (X_k, Y_k, Z_k, \theta_k, \phi_k, \psi_k)^T xk=(Xk,Yk,Zk,θk,ϕk,ψk)T
其中 (X_k, Y_k, Z_k) 表示机器人在世界坐标系中的位置,(\\theta_k, \\phi_k, \\psi_k) 表示姿态(俯仰、偏航、滚转)。
地图 m 由环境中检测到的特征(或地标)的位置组成:
m = { l 1 , . . . , l n m } T m = \{l_1, ..., l_{n_m}\}^T m={l1,...,lnm}T
每个地标 l_i 在世界坐标系中的位置为:
l i = ( l i , x , l i , y , l i , z ) T l_i = (l_{i,x}, l_{i,y}, l_{i,z})^T li=(li,x,li,y,li,z)T
n_m 为地图特征的数量。地图还可以用稠密的形式表示,如栅格地图,本论文假设地图在整个过程中是静态的,与机器人位置不同会不断变化。
机器人状态随着控制输入更新(包括噪声)可表达为:
p ( x k ∣ x k − 1 , u k ) ⟺ x k = f ( x k − 1 , u k ) + w k p(x_k | x_{k-1}, u_k) \iff x_k = f(x_{k-1}, u_k) + w_k p(xk∣xk−1,uk)⟺xk=f(xk−1,uk)+wk
w_k 为高斯白噪声,均值为零,协方差为 \\mathbf{Q}_k,即:w_k \\sim \\mathcal{N}(0, \\mathbf{Q}_k)。
观测某一地图地标 z_k 相关联的尺度用测量函数 h(\\cdot) 表示:
p ( z k ∣ x k , m ) ⟺ z k = h ( x k , m ) + v k p(z_k | x_k, m) \iff z_k = h(x_k, m) + v_k p(zk∣xk,m)⟺zk=h(xk,m)+vk
v_k 也是高斯白噪声,协方差为 \\mathbf{R}_k。
B. SLAM 前端:特征提取、数据关联和闭环检测
机器人使用多种传感器,产生不同的原始数据。前端先提取特征,把不同类型的原始数据转化为后端估计的测量值 z_k。
同时实现数据关联,找到与当前 z_k 最可能对应的地图中的地标(使得测量符合模型方程)。
数据关联包括两方面:
- 短期关联:处理连续测量之间的数据对应。
- 长期关联(闭环检测):机器人返回已访问地点时,将当前测量与已知的地图地标关联,识别地点。
关联时可能遇到两种错误:
- 假阳性(误关联):将错误的地标算法引入,可能导致后端失效。
- 假阴性(漏检):拒绝错误的观测,可能降低估测的准确性,但相对不那么严重。
方法:
- 统计验证门控(验证门):只接受落在验证区域内的假设(比如最近邻匹配)
- 多假设方法如 JCBB、MHJCBB 等,计算复杂但更鲁棒。
基于外观识别:
- FAB-MAP 利用特征词袋(Bag-of-Words)方法进行场景识别,结合SIFT或SURF可提高效果。
- SeqSLAM 利用图像序列匹配,增强鲁棒性。
- 深度学习如DCNN、NetVLAD、HOG等也在外观识别中崭露头角,可结合多特征融合。
激光或距离数据也用来匹配和闭环:
- 通过扫描-地图匹配(scan-to-map)实现闭环
- 结合图像和激光------融合技术增强鲁棒性。
C. SLAM 后端:机器人位姿和地图估计
后端估计分为两大类:
- 基于滤波(如 EKF、粒子滤波)递归估计当前位置和地图。
- 基于优化(如图优化、批量平滑)进行全局估计,能纠正历史定位误差。
优化过程:
- 定义目标函数(非线性加权最小二乘)
- 线性化:用泰勒展开,计算雅可比矩阵。
- 迭代优化直到收敛(平滑算法)或执行单次更新(滤波器)。
优缺点:
- 滤波:简单但可能线性化误差大,易发散。
- 平滑:更鲁棒,能修正历史状态,但计算复杂。
V. 管道SLAM的地图类型
地图表达影响准确性、计算效率、鲁棒性。主要类型有:
- 特征地图(点特征,大特征,如弯头、接头)
- 密集地图(格栅地图、点云、曲面模型)
- 拓扑地图(节点、路径连接结构)
- 语义地图(含特征类别信息,如阀门、人孔)
- 混合地图(结合度量和拓扑信息)
在管道环境中,计算资源有限,通常采用混合地图:拓扑结构用于路径规划,度量信息用于定位。
VI. 供水和排污管道的传感器
A. 惯性和里程计(IMU + 里程计)
- 简单的轨迹推算,漂移明显,需结合地标修正。
- 常用自然地标:管段接头、磁通泄漏等,成本低。
B. 相机
- 常用于视觉检测和定位,鱼眼摄像机较多用(适应狭窄空间)。
- 立体摄像头可自动解决尺度模糊。
- 单目 + 结构光可以用来校正尺度。
- 图像特征(如角点)在管道内部可能稀疏,导致匹配困难。
- 可作为生成地图的辅助工具。
C. 激光扫描仪(Lidar)
- 识别井口、弯头、接头等特征
- 可以与相机结合使用。
- 由于缺乏明显的特征,通常不用于沿管段的连续定位。
D. 声学和RF传感
- 超声波、声呐和射频技术,适合管道内部传播良好环境。
- 可以用来建立连续的空间地图,避免视觉对光照的敏感性。
E. 地面传感(GPR等)
- 主要用于管道的先验检测和目标定位。
- 结合激光、GNSS等提高识别准确性。
传感器优劣总结(表5)
- 惯性和里程计:简单成本低,但漂移大,需配合地标校正。
- 相机:多用但受光照、污染影响,计算密集。
- 激光雷达:不需光源,识别地标有效,但成本重。
- 声学:传播快,无需光照,灵敏但受环境影响。
- 多传感融合:最优,结合多种优势,提升鲁棒性。
总之,水管和排污管SLAM应多传感器融合,结合视觉、声学、惯性、地标等,充分利用各类信息的优势。
VII. 未来的挑战
A. 单机器人在管道中的 SLAM
目前为止,针对水管和污水管道中 SLAM 的研究主要还是在实验室环境或小规模的室外实验中进行。要真正应用到现实世界,还需要克服一系列挑战。Cadena 等人 [22] 在最新且全面的 SLAM 综述中强调了以下未来需要解决的普遍问题:鲁棒性能、高层理解、资源感知以及任务驱动推理。这些问题在管道场景下尤为突出,下面将逐一讨论。
1) 长期鲁棒的自主运行与可扩展性
水管和污水管网络中的 SLAM 必须在长期运行中保持鲁棒性。如果机器人在管网中迷失方向,反而会增加问题而不是解决问题,这是水务行业无法接受的。Cadena 等人 [22] 的综述认为,目前还不能实现长期鲁棒的 SLAM,仍需要进行大量基础性研究。近期的工作提出了通过 多假设方法(MH-iSAM2) 来提升后端优化的鲁棒性 [129],但尚未解决如何保证 SLAM 绝对安全的问题。
在近期应用中,一个可行的办法是在管道网络中布设定位信标 。这种方法类似于地面基准站 [186], [187],只是应用于地下的水管和污水管。当前有越来越多的研究关注智能基础设施监测,例如 智能管道 [239] 和智能井盖 [240],它们通过 RFID 标签与云端通信 [241], [242]。这些装置可以间歇性地分布在管网中,当 SLAM 失败时提供重定位的恢复点。虽然改造管网会增加成本,但考虑到传输巡检数据也需要布设通信节点,这种成本是可以接受的。
长期运行还涉及可扩展性 问题:数据存储和处理需求会无限增长。由于管道巡检机器人通常体积小、功率低,并且管网地图随时间变化较慢,一个策略是:只在通信节点更新地图 ,机器人在行进过程中只执行定位,而地图更新由通信节点上传至云端完成。这样既减轻了实时 SLAM 的计算负担,又能通过通信节点实现可靠的重定位,从而达到鲁棒和可扩展的目的。关键在于如何降低改造管网的成本 ,并保证通信节点的分布能覆盖足够范围,实现 SLAM 的安全运行。最终需要将 SLAM 算法与智能管网基础设施协同设计,在一个完整框架中权衡成本与鲁棒性。
2) 具备故障感知和可信度的机器人
机器人与 AI 领域的一个重要问题是如何开发可信赖的系统 [243]--[248]。在管道场景中,机器人巡检将提供故障有无、类型、严重程度以及位置等关键信息,供人工决策是否开挖维修。开挖不仅成本高、扰动大,如果机器人系统出错,将严重影响该技术的推广,甚至影响整个机器人行业的声誉。
因此,发展可信的管道机器人系统是关键挑战 。这要求机器人能够适应不同环境变化,并能评估自身结果的可信度。例如,当相机部分被遮挡导致视觉 SLAM 精度下降时,机器人应能自我感知并将这一信息传达给操作人员。总体上,机器人系统需要具备故障感知能力:一旦 SLAM 出现问题,机器人要能智能检测并主动报告。目前尽管有大量研究致力于鲁棒与可信 AI,但在管道机器人领域仍显不足。
3) 路径规划与主动 SLAM
管道巡检机器人的主要任务是检测和定位故障 ,并且绘制管网地图 。要实现这一目标,机器人必须彻底探索管网并保持长期覆盖,以保证故障检测的完整性 [249]。这与主动 SLAM 框架自然契合 [250]:即在任务驱动下进行路径规划,同时完成建图与定位。
主动 SLAM 已经在多种后端框架中得到研究,包括 EKF-SLAM [250]、粒子滤波 SLAM [251] 和优化/平滑类方法 [252], [253]。典型的主动 SLAM 包括三个步骤 [251]:
- 确定候选目标点:包括前沿点 (地图边界处的不确定区域)和轨迹点(回到已知区域以降低定位不确定性)。
- 预测访问目标点带来的信息增益,并评估轨迹误差风险。
- 执行移动,并判断是否继续或终止任务。
然而,主动 SLAM 还未在地下管网场景中研究过。挑战主要在于信息增益预测开销大 ,而管道机器人往往计算能力有限,因此需要更高效的算法。此外,水流方向对运动有约束,机器人顺流而下更省能量,这会影响路径规划和主动 SLAM 的设计。
B. 管网 SLAM 的先验地图生成
大多数 SLAM 方法假设环境信息为零,但在水管/污水管道中情况并非如此。我们可以从多种来源获取先验地图,未来的挑战在于如何融合这些数据并合成可用于导航的先验地图。
在水务行业,地理信息系统 (GIS) 已广泛应用于存储和分析管网信息 [254]--[256],包括管道位置、井盖和消防栓等。结合机器人在管道内识别到的井盖位置,可以用于纠正定位漂移 [204]。但 GIS 数据可能存在误差 [255],因此仅靠 GIS 难以生成可靠的先验地图。
近年来,利用多种传感器(如 GPS、摄像头、激光雷达)对地上基础设施进行自动化识别的研究快速发展,尤其是井盖检测 [257]--[267]。例如,深度卷积神经网络 (DCNNs) 已用于井盖识别和定位 [263]--[265],并可结合行业规则推断井盖之间的地下管道布局 [266], [267]。
未来的挑战是如何融合 GIS 数据和数据驱动的地上地图 ,生成管道 SLAM 的先验地图 [268]--[270]。难点在于:不同来源的数据存在不确定性,需要通过贝叶斯方法进行融合 [234], [235]。同时,在将先验信息引入 SLAM 时,还要合理调整可信度:如果先验权重过高,SLAM 会忽视传感器观测;如果过低,则无法发挥先验优势 [272]。因此,需要开发适用于管道 SLAM 的通用先验融合框架。
C. 多机器人在管道中的 SLAM
未来的城市中,管道巡检可能由机器人团队协作完成,以确保管网全面覆盖。目前尚无相关研究,面临的挑战主要包括数据共享与算法问题。
在数据层面 [273]:
- 共享的数据类型(原始数据还是处理后的数据)。
- 通信受限时如何共享数据。
- 数据处理架构:集中式、分布式或混合式。
- 如何保证方法的可扩展性,以及处理缺失数据或不同采样率的数据。
在算法层面,多机器人 SLAM 的数据融合主要有三种方式 [274], [275]:
-
集中式融合:所有传感器数据上传到中央节点统一处理。
-
分布式融合:每个节点先局部处理,再在中央节点进行融合。
- 已知数据相关性。
- 未知数据相关性(需额外估计)。
-
去中心化融合:完全在本地节点处理和融合。
集中式方法理论最优,但依赖高带宽和强算力,且存在单点故障风险。不过,如果通过云端执行集中式融合,则可以解决算力和鲁棒性问题,特别适合低功耗的管道机器人 [285]。
多机器人 SLAM 的核心是地图合并,通常需要:已知机器人初始位姿、机器人之间会合,或地图有重叠 [273]。在管道中,这个问题相对简化:入口处可以通过 GPS 或井盖位置信息确定初始位姿,机器人也可以在管道或通信节点处会合并交换地图。
如果已知入口处的世界坐标,并且使用地面已知特征(如井盖、消防栓)作为 SLAM 地标 [203], [204],则各机器人可以直接在世界坐标系下建图,大幅简化地图合并。但挑战仍在于多机器人识别相同地标的一致性(即数据关联问题),需要发展鲁棒的多假设 SLAM 方法来解决。
VIII. 结论
本文综述了水管和污水管道巡检机器人中的 SLAM 技术。首先强调了管网在智慧城市建设中的重要性,并回顾了机器人系统在地图构建与故障定位方面的需求。
我们总结了常见的 SLAM 方法,发现优化/平滑类方法逐渐取代早期的 EKF 和粒子滤波方法。同时,深度学习在闭环检测和视觉里程计中的应用日益突出。地图表示方面,混合地图(度量/拓扑、度量/语义、语义/拓扑)在管道环境中更有优势:拓扑地图适合大规模路径规划,度量信息适合故障定位。
在传感器方面,多种传感器已被成功应用于管道 SLAM,这说明多传感器融合是最有前景的方向,以最大化鲁棒性。
最后,本文讨论了未来的挑战:
- 单机器人 SLAM:长期鲁棒与可扩展性、可信度、主动 SLAM;
- 先验地图利用:融合 GIS 和地上数据生成管网先验;
- 多机器人 SLAM:协作建图、数据共享和地图合并问题。