slam

kobesdu3 天前
笔记·ros·slam
【ROS2实战笔记-24】ROS2 Launch 实用技巧:条件逻辑与节点动态生成在一个典型的 ROS2 项目中,总有一个巨大的 launch/ 文件夹和一个臃肿到几乎让人望而却步的主 launch 文件。但 ROS2 的 Python launch 系统其实是一把功能强大的“瑞士军刀”,远远不止于按顺序启动节点那么简单。
大江东去浪淘尽千古风流人物4 天前
slam·语义slam·vio·开放词汇·动态场景
【RADIO-ViPE】动态环境下的在线开放词汇语义SLAM:视觉-语言-几何紧耦合BA与自适应鲁棒核深度解析RADIO-ViPE 是一个面向动态环境的在线语义 SLAM 系统,能够将任意自然语言查询与三维场景中的局部区域和物体关联起来(开放词汇语义定位)。与现有方法依赖标定好的 RGB-D 输入不同,RADIO-ViPE 直接处理原始单目 RGB 视频流,不需要相机内参、深度传感器或位姿初始化。其核心创新在于:将来自 RADIO 聚合基础模型的多模态嵌入(视觉+语言)与几何场景信息在初始化、优化和因子图连接三个层面进行紧耦合融合,并通过时序一致的自适应鲁棒核处理动态物体干扰。在 TUM-RGBD 动态基准测试上
大江东去浪淘尽千古风流人物5 天前
网络·深度学习·transformer·slam·位姿估计·kv-cache
【KV-Tracker】Transformer 实时位姿跟踪:KV-Cache 加速多视图几何网络达 27FPS多视图 3D 几何 Transformer(如 DUSt3R、MASt3R、π³)精度惊人,但全连接注意力的 O ( N 2 ) O(N^2) O(N2) 复杂度使其无法实时运行。Imperial College London 的 KV-Tracker 提出了一个无需额外训练的加速方案:在映射阶段缓存全局自注意力的 Key-Value 对,追踪阶段仅编码单帧并查询缓存,实现约 15× 加速和 27 FPS 实时跟踪。在 TUM RGB-D 上 ATE 0.108m,超越 TTT3R(0.132m)和 CU
大江东去浪淘尽千古风流人物5 天前
人工智能·神经网络·数据挖掘·回归·实时·slam·场景坐标回归
【ACE-SLAM】场景坐标回归实时神经 SLAM:TriMLP 架构与隐式回环闭合神经隐式 SLAM 方法(如 NICE-SLAM、SplaTAM)精度出色但帧率通常不到 1 FPS,无法用于实时应用。Imperial College 的 ACE-SLAM 首次将**场景坐标回归(Scene Coordinate Regression, SCR)**作为核心地图表示,通过训练轻量 MLP 将 2D 图像特征直接映射到 3D 全局坐标,实现 29.7 FPS 严格实时运行,地图仅 ~1MB,且无需专用回环检测模块即可隐式处理回环闭合。
元让_vincent6 天前
slam·性能提升·激光slam·multi-session·先验地图
论文 Review SLAM LiLoc | Lifelong Localization题目:LiLoc: Lifelong Localization using Adaptive Submap Joining and Egocentric Factor Graph
大江东去浪淘尽千古风流人物6 天前
生成对抗网络·3d·无人机·slam·3d重建·deepsdf·去模糊
【SharpSLAM】无人机高速飞行下的物体级视觉 SLAM:GAN 去模糊与 3D 重建联合优化无人机高速飞行时,运动模糊严重劣化视觉 SLAM 的特征提取和物体重建质量。Skoltech 的 SharpSLAM 将 DeblurGANv2 作为前端去模糊模块接入 DSP-SLAM(Deep Shape Priors SLAM)流水线,在不改变 SLAM 后端的前提下,将 3D 物体重建 F-score 从 82.9% 提升至 86.2%,SDF RMSE 从 17.2cm 降至 15.4cm。本文解析其三层系统架构、形状先验优化目标函数以及尺度标定方案。
大江东去浪淘尽千古风流人物10 天前
平面·slam·视觉slam·点线面融合·plücker坐标·平面重建
【Structure PLP-SLAM】点-线-面三基元融合SLAM:从Plücker坐标到Graph-Cut平面重建的完整技术解析Structure PLP-SLAM 是 DFKI 团队提出的多基元视觉 SLAM 系统(ICRA 2023),在 ORB 点特征基础上融合 LSD 线段检测与 PlaneRecNet 实例分割,实现点(Point)、线(Line)、面(Plane)三基元联合优化。系统采用 Plücker 坐标表示 3D 线段,通过 Graph-Cut RANSAC 拟合平面,并在 BA 中隐式约束点-面距离,在 ICL-NUIM、TUM RGB-D 等基准数据集上取得了优于 ORB-SLAM2、PL-SLAM 等方法的
Undergoer_TW17 天前
slam·对极几何
SLAM实战避坑指南:对极几何与极点极线推导——吃透零空间与对极约束投影方程:d1p1=KP(1) d_1 p_1 = K P \qquad (1) d1p1=KP(1)
大江东去浪淘尽千古风流人物17 天前
运维·docker·容器·slam·vio·avx-512
【Polaris-VIO】Docker 镜像跨硬件分发的隐藏陷阱:AVX-512、-march=native 与 CPU 指令集解耦边界很多团队把"做成 Docker 镜像就和环境/平台/芯片架构解耦了"当成理所当然。本文从一段真实排查出发——本地 i5-14400F 跑某 VIO 镜像 Illegal instruction 直接闪退——梳理三件事:① AVX-512 是什么、为什么 Intel 在消费级 CPU 上禁用了它;② Docker 容器到底解耦了哪几层、哪几层完全没解耦;③ Polaris VIO 项目 CMakeLists.txt 里 -march=native 默认值带来的对外分发风险,以及我们为什么把基线改成 x86-
kobesdu18 天前
笔记·安全·slam·ros2
【ROS2实战笔记-23】参数系统中的动态参数与远程加载安全剖析ROS2 参数系统表面上只是“键值对存储”,但深入使用后会发现:参数更新并非原子操作、参数服务的发现延迟可能导致节点加载失败、回调执行顺序能轻易制造隐晦死锁、通过参数传输敏感信息更是常见的安全陷阱。这些潜规则,正是 ROS2 系统在生产环境中稳定运行的关键。
slam与AI智能体19 天前
深度学习·slam·回环检测·vggt
不依赖 IMU / 标定:VGGT-SLAM 回环检测的轻量化方案解析在 SLAM(同步定位与地图构建)领域,回环检测一直是 “关键又麻烦” 的模块:检测成功就能一键修正轨迹漂移、保证地图全局一致性;但传统方法往往要维护词袋、训练分类器,甚至依赖 IMU 或精确标定,复杂度和成本都不低。
大江东去浪淘尽千古风流人物20 天前
3d·slam·vio·光流·动态场景
【Flow4DGS-SLAM】动态环境3DGS-SLAM:光流引导自运动分解与混合4D Gaussian深度解析(CVPR 2026)Flow4DGS-SLAM(CVPR 2026,NUS)针对动态场景 3DGS-SLAM 的两大痛点——变形场训练慢和语义分割依赖——提出了全新的光流引导框架。核心思路是用 depth + 先验光流拟合相机自运动模型,不依赖任何语义类别,直接从残差中生成动态掩膜,同时提供更稳定的位姿初始化。动态区域用混合 4D Gaussian 表示(显式时序位置 + GMM 透明度/旋转 + KNN 刚性约束),相比基线 4DGS-SLAM 将建图速度提升 17.6 倍,PSNR 提升 4 dB,TUM RGB-D A
元让_vincent21 天前
人工智能·分类·数据挖掘·slam·激光slam·退化检测·退化场景
论文Review SLAM X-ICP | 面向极端退化环境的可定位性感知 LiDAR 配准方法论文题目: X-ICP: Localizability-Aware LiDAR Registration for Robust Localization in Extreme Environments 作者: Turcan Tuna, Julian Nubert, Yoshua Nava, Shehryar Khattak, Marco Hutter 期刊: IEEE Transactions on Robotics, 2024 研究方向: LiDAR SLAM、点云配准、ICP、退化检测、鲁棒定位 关键
kobesdu21 天前
算法·slam·定位·反光柱
反光柱定位算法实战02:纯反光柱定位——VEnus算法实际使用与代码原理综述在AGV(自动导引车)和工业移动机器人领域,如何实现稳定、精准的定位,始终是核心技术难题。当前主流的自然特征SLAM虽然灵活,但在某些场景下会暴露出先天短板。当机器人驶入超过30米的长走廊且两侧无柱子、无设备的空旷区域时,纯激光SLAM容易因“无特征可循”而定位丢失。高反光车间(如不锈钢抛光车间)中的激光SLAM同样面临退化风险。
zi紫夕云23 天前
slam
SO(3) 与 so(3) 的对应关系及案例SO(3)(特殊正交群)是三维旋转矩阵的集合:SO(3) = { R ∈ ℝ³ˣ³ | RᵀR = I, det(R) = 1 }
研究点啥好呢1 个月前
c++·算法·机器人·slam·dji
dji机器人SLAM算法工程师 面试题精选:10道高频考题+答案解析大疆创新(DJI)是全球领先的无人机和机器人公司,总部位于深圳。在SLAM(同步定位与建图)领域,大疆拥有深厚的技术积累,其VIO(视觉惯性里程计)算法在无人机自主导航、避障、悬停等场景中发挥核心作用。大疆的SLAM面试非常注重算法原理与工程实践的结合。
放羊郎1 个月前
slam
VSLAM中如何去除动态目标REF:面向动态场景的视觉 SLAM 算法研究视觉SLAM:利用视觉传感器实现同时定位与建图,应用于机器人、自主驾驶和AR/VR等领域,核心由前端感知与后端优化协同构成,前端通过特征提取与匹配(ORB、SIFT)或直接方法(DSO)估算帧间相机位姿,生成初步的关键帧与稀疏特征点,后端利用位姿图优化和回环检测,基于非线性优化(BA)减少累计误差,确保轨迹和地图的一致性与精确性
Stack Overflow?Tan901 个月前
slam·cartographer
Cartographer的slam解决方案Cartographer 解决 SLAM 问题的方案是一个两层优化架构:下面介绍基于激光雷达的点云数据处理到完整建图的过程简单介绍,雷达就按照三个雷达为例。
大势智慧1 个月前
高精度·解决方案·slam·三维重建·三维扫描·手持slam·空地融合
智影R200免像控空地融合建模解决方案实景三维重建领域,无人机航拍可快速获取大范围高空影像,但近地面建筑立面、遮挡区域存在盲区,易导致模型空洞、扭曲;地面激光扫描仪能还原局部精细结构,却缺少空中视角,无法覆盖大场景全局。单一采集方式无法实现全域无死角重建,而传统解决方案一般采用无人机航拍+照片补拍,需人工确定补拍位置、内业手工空三刺点,对作业人员经验要求高、工作量大,成果质量难以保障。
AGV算法笔记1 个月前
深度学习·3d·机器人视觉·slam·三维重建
CVPR 2024顶级SLAM论文精读:SplaTAM如何用3D高斯实现稠密RGB-D SLAM?SLAM 3D Gaussian Splatting RGB-D 三维重建 机器人视觉 稠密建图 CVPR2024