vio

大江东去浪淘尽千古风流人物2 天前
深度学习·计算机视觉·transformer·slam·vio·3d重建
【VGGT-Ω】前馈式3D重建的规模化之路:Register Attention、自监督训练与10B参数Scaling Law深度解析现有前馈式3D重建模型(如VGGT、DUSt3R、MASt3R)虽然摆脱了后优化流程,但模型规模和数据规模对重建精度的影响尚未被系统探索。VGGT-Ω 在架构、数据和训练三个维度同时做了规模化改进:引入 Register Attention 替代部分全局注意力以降低计算开销,用单一 Dense Head + Pixel Shuffle 替代多头 DPT 以节省显存,并构建了覆盖4M序列(含动态场景)的高质量标注流水线。最终在 Sintel 上相机位姿估计 AUC@3° 从22.5提升到40.0(+77%)
大江东去浪淘尽千古风流人物6 天前
slam·语义slam·vio·开放词汇·动态场景
【RADIO-ViPE】动态环境下的在线开放词汇语义SLAM:视觉-语言-几何紧耦合BA与自适应鲁棒核深度解析RADIO-ViPE 是一个面向动态环境的在线语义 SLAM 系统,能够将任意自然语言查询与三维场景中的局部区域和物体关联起来(开放词汇语义定位)。与现有方法依赖标定好的 RGB-D 输入不同,RADIO-ViPE 直接处理原始单目 RGB 视频流,不需要相机内参、深度传感器或位姿初始化。其核心创新在于:将来自 RADIO 聚合基础模型的多模态嵌入(视觉+语言)与几何场景信息在初始化、优化和因子图连接三个层面进行紧耦合融合,并通过时序一致的自适应鲁棒核处理动态物体干扰。在 TUM-RGBD 动态基准测试上
大江东去浪淘尽千古风流人物20 天前
运维·docker·容器·slam·vio·avx-512
【Polaris-VIO】Docker 镜像跨硬件分发的隐藏陷阱:AVX-512、-march=native 与 CPU 指令集解耦边界很多团队把"做成 Docker 镜像就和环境/平台/芯片架构解耦了"当成理所当然。本文从一段真实排查出发——本地 i5-14400F 跑某 VIO 镜像 Illegal instruction 直接闪退——梳理三件事:① AVX-512 是什么、为什么 Intel 在消费级 CPU 上禁用了它;② Docker 容器到底解耦了哪几层、哪几层完全没解耦;③ Polaris VIO 项目 CMakeLists.txt 里 -march=native 默认值带来的对外分发风险,以及我们为什么把基线改成 x86-
大江东去浪淘尽千古风流人物22 天前
3d·slam·vio·光流·动态场景
【Flow4DGS-SLAM】动态环境3DGS-SLAM:光流引导自运动分解与混合4D Gaussian深度解析(CVPR 2026)Flow4DGS-SLAM(CVPR 2026,NUS)针对动态场景 3DGS-SLAM 的两大痛点——变形场训练慢和语义分割依赖——提出了全新的光流引导框架。核心思路是用 depth + 先验光流拟合相机自运动模型,不依赖任何语义类别,直接从残差中生成动态掩膜,同时提供更稳定的位姿初始化。动态区域用混合 4D Gaussian 表示(显式时序位置 + GMM 透明度/旋转 + KNN 刚性约束),相比基线 4DGS-SLAM 将建图速度提升 17.6 倍,PSNR 提升 4 dB,TUM RGB-D A
orcasdli3 个月前
ros·slam·vio
ROS1+VINS-fusion+RTAB-Map 程序部署记录运行环境:Ubuntu 20.04 虚拟机,采用 ROS1 Noetic 版本,使用小鱼一键安装工具完成部署。
吃水果不削皮1 年前
ros·vio
VINS-FUSION:跑通手机录制数据利用智能手机的 摄像头+IMU 采集数据,并在 VINS-Fusion(视觉惯性SLAM系统)中实现定位与建图。
迎风打盹儿1 年前
ip·vivado·vio·采样频率·ila·在线调试
VIVADO ILA IP进阶使用之任意设置ILA的采样频率VIVADO ILA IP进阶使用之任意设置ILA的采样频率VIVADO ILA IP和VIO IP结合使用任意设置ILA的采样频率
后厂村路直博生2 年前
无人机·px4·动捕·vio·optitrack·mocap
【开发环境】PX4无人机实物使用视觉或运动捕捉系统进行位置估计视觉惯性里程计(VIO)和运动捕捉系统(MoCap)允许无人机在全局位置信息不可用或不可靠时导航(例如在室内或在桥下飞行等)。
读书健身敲代码3 年前
slam·vio
VINS-MONO代码解读----vins_estimator(鲁棒初始化部分)整个初始化部分的pipeline如下所示,参照之前的博客,接下来根据代码一步步讲解。上回讲了processImage中addFeatureCheckParallax完成了对KF的筛选,我们知道了2nd是否为KF,接下来是初始化和后端求解部分。对于初始化,先标定Ric外参:
云端舞步3 年前
无人机·px4·vio·室内定位
px4+vio实现无人机室内定位文章主要讲述px4 如何利用vins_fusion里程计数据实现在室内定位功能。文章基于以下软、硬件展开。
读书健身敲代码3 年前
slam·vio
【深蓝学院】手写VIO第8章--相机与IMU时间戳同步--作业参考常鑫助教的答案:思路是将i时刻的观测投到world系,再用j时刻pose和外参投到j时刻camera坐标系下,归一化得到预测的二维坐标(这里忽略了camera的内参,逆深度是在camera系下) 要计算的是i时刻和j时刻之间的补偿之后的u坐标的重投影误差,所以i时刻也要补偿,具体步骤见下,式(5)参照14讲P47的公式,已经用过很多次了。
我是有底线的