从零实战SLAM-第十课(回环检测与建图)(完)

在七月算法报的班,老师讲的蛮好。好记性不如烂笔头,关键内容还是记录一下吧,课程入口,感兴趣的同学可以学习一下。


SLAM的前段和后端都存在误差,因为建图与定位是耦合的,所以整个误差会积累。

回环检测是通过检测出之前去过的地点,对预测的轨迹进行修正。

回环检测的步骤:

❑ 检测到回环的发生

❑ 计算回环修选帧与当前帧的运动

❑ 验证回环是否成立

❑ 闭环

验证两帧之间的相似度,有以下几种常用的策略,其中基于外观的方法是主流,核心在于衡量两帧图像之间的相似度。

基于外观的主要方法:词袋BoW,词袋是对特征的聚类

➢ 特征聚类形成了 Word

➢ 许多 Word 组成了 Dictionary

➢ 只看 Word 的有无,无视 Word 的顺序

➢ 图像的相似性 = Word 的相似性

其中会对各word用one-hot模式进行编码

再通过词的相似度,推算出图像的相似度。

聚类: 无监督机器学习(Unsupervised ML)中一个特别常见的问题;

❖ 用于让机器自行寻找数据中的规律的问题。

BoW的字典生成问题亦属于其中之一,N个特征点,归为k个单词。

K-Means 的算法流程

当我们有N个数据,想要归为k各类:

➢ 随机选取k个中心点:𝑐1, 𝑐2 ... 𝑐𝑘;

➢ 对每一个样本,计算与每个中心点之间的距离,取最小的作为它的归类;

➢ 重新计算每个类的中心点。

➢ 如果每个中心点都变化很小,则算法收敛,退出;否则重复进行。

字典的结构

➢ 当实际拿到一个特征时,需要查询它对应的Word是什么

➢ 遍历比较: 𝑂(𝑛)

➢ 建立字典结构可以加速比较,比如KD Tree

word 的相似度测量

用到了TF-IDF,本质上是信息论的那一套

两个词之间的相似度测量

找到相似帧之后的处理方式。

SLAM 中的回环检测

➢ 使用相对的评分而非绝对的评分

➢ 思路:相邻关键帧是相似的,而回环的相似度应该约等于相邻关键帧

检测成功以后:

➢ 根据 PnP 等算法计算运动关系

➢ 根据重投影关系验证回环是否成立

➢ 利用全局 BA 或 Pose Graph 进行优化

建图,实际当中地图往往有不同形式,对应不同需求。

➢ 定位仅需匹配特征点

➢ 导航和避障需要稠密障碍物信息

➢ 交互需要稠密的物体表面信息

➢ 高层任务需要语义信息

单目的稠密建图

构建的一般为点云数据类型的地图

后续包括泊松重建和Surfel重建等

还有Octomap等,可以降低点云的数据量

重要的开源SLAM,很好的学习材料。

GitHub - raulmur/ORB_SLAM2: Real-Time SLAM for Monocular, Stereo and RGB-D Cameras, with Loop Detection and Relocalization Capabilities

相关推荐
CoovallyAIHub7 小时前
CVPR 2026 | MixerCSeg:仅2.05 GFLOPs刷新四大裂缝分割基准!解耦Mamba隐式注意力,CNN+Transformer+Mamba三
深度学习·算法·计算机视觉
CoovallyAIHub7 小时前
YOLO26-Pose 深度解读:端到端架构重新设计,姿态估计凭什么跨代领先?
深度学习·算法·计算机视觉
CoovallyAIHub8 小时前
化工厂气体泄漏怎么用AI检测?30张图3D重建气体泄漏场景——美国国家实验室NeRF新研究
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
OpenClaw 近 2000 个 Skills,为什么没有一个好用的视觉检测工具?
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
Claude Code 突然变成了 66 个专家?这个 5.8k Star 的开源项目,让我重新理解了什么叫"会用 AI"
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
181小时视频丢给GPT-5,准确率只有15%——南大联合NVIDIA等五校发布多模态终身理解数据集
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
CVPR 2026 | GS-CLIP:3D几何先验+双流视觉融合,零样本工业缺陷检测新SOTA,四大3D工业数据集全面领先!
深度学习·算法·计算机视觉
CoovallyAIHub5 天前
语音AI Agent编排框架!Pipecat斩获10K+ Star,60+集成开箱即用,亚秒级对话延迟接近真人反应速度!
深度学习·算法·计算机视觉
CoovallyAIHub6 天前
Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!
深度学习·算法·计算机视觉