边缘设备3DGS-SLAM算法对比实验报告

边缘设备3D高斯溅射SLAM算法对比实验报告

「2026 (MonoRTGS,MonoGS,SGAD-SLAM,SplaTAM)4算法运行结果」
/~72443Yb8hW~:/
链接:https://pan.quark.cn/s/6295f79fc01e

实验项目: 四种3DGS-SLAM算法在Jetson AGX Orin上的性能对比研究

实验时间: 2026年5月12日 - 2026年5月15日

实验平台: NVIDIA Jetson AGX Orin (64GB)

数据集: TUM RGB-D Dataset - freiburg1_room

报告日期: 2026年5月16日


目录

  1. 实验背景

  2. 实验环境

  3. 算法介绍

  4. 实验设计

  5. 实验结果

  6. 性能分析

  7. 系统资源监控分析

  8. 讨论与结论

  9. 附录


1. 实验背景

1.1 研究动机

三维高斯溅射(3D Gaussian Splatting, 3DGS)作为一种新兴的实时渲染技术,在同步定位与建图(SLAM)领域展现出巨大潜力。然而,现有的3DGS-SLAM算法大多针对高性能GPU平台设计,在边缘设备上的性能表现尚缺乏系统性的对比研究。

核心问题:在计算资源受限的边缘设备上,哪种3DGS-SLAM算法能够实现最佳的速度、精度与质量平衡?

1.2 研究目标

本研究旨在:

  1. 系统评估四种主流3DGS-SLAM算法在边缘设备上的性能表现

  2. 量化分析各算法在速度、精度、质量三个维度的综合表现

  3. 验证专门针对边缘设备优化的算法(MonoRTGS)的有效性

  4. 边缘设备实时SLAM应用提供算法选择指导

1.3 研究意义

  • 理论意义:填补3DGS-SLAM边缘设备性能研究的空白

  • 实践意义:为机器人、无人机、AR/VR等边缘设备应用提供算法选型依据

  • 工程意义:验证自适应优化策略在边缘设备上的有效性


2. 实验环境

2.1 硬件配置

组件 规格 说明
计算平台 NVIDIA Jetson AGX Orin 嵌入式AI开发板
CPU ARM Cortex-A78AE, 12-core, up to 2.2 GHz 64-bit架构
GPU NVIDIA Ampere Architecture, 2048 CUDA cores 512-core Tensor Cores
内存 64GB LPDDR5 带宽 2048 GB/s
存储 256GB NVMe SSD 高速读写
功耗 15W - 60W (可调) 实验使用最大性能模式

性能模式设置

复制代码
sudo nvpmodel -m 0  # 最大性能模式
sudo jetson_clocks  # 解锁所有频率限制

2.2 软件环境

软件 版本 说明
操作系统 Ubuntu 20.04 LTS (aarch64) Linux内核5.10
Python 3.8.20 主要开发语言
CUDA 11.4.315 GPU计算平台
cuDNN 8.6.0 深度学习加速库
PyTorch 1.12.0a0 (Jetson构建) 深度学习框架
OpenCV 4.7.0 计算机视觉库

2.3 数据集

TUM RGB-D Dataset - freiburg1_room序列

参数
场景类型 室内房间环境
总帧数 1315帧
图像分辨率 640×480像素
采集帧率 30 Hz
相机参数 fx=517.3, fy=516.5, cx=318.6, cy=255.3
深度范围 0.5 - 5.0米

选择理由

  • TUM数据集是RGB-D SLAM领域的标准评测数据集

  • freiburg1_room序列具有适中的场景复杂度和运动范围

  • 包含精确的地面真值轨迹,便于定量评估


3. 算法介绍

3.1 算法概览

算法 发表会议/期刊 年份 输入类型 研究机构
MonoRTGS MICRO 2025 2025 RGB-D/单目 本研究组
MonoGS CVPR Highlight 2024 RGB/RGB-D/立体 HKUST
SGAD-SLAM CVPR 2026 RGB-D UNC Chapel Hill
SplaTAM CVPR 2024 RGB-D/单目 Oxford/NVIDIA

3.2 算法详细分析

3.2.1 MonoRTGS (Real-Time Gaussian Splatting SLAM)

核心创新

  • 自适应高斯剪枝策略(Adaptive Gaussian Pruning)

  • 动态下采样机制(Dynamic Downsampling)

  • 边缘设备内存优化(Memory-Efficient Rendering)

技术特点

  • 支持RGB-D和单目输入

  • 基于关键帧的自适应优化策略

  • 针对ARM架构的SIMD优化

论文声称性能(Desktop GPU):

  • FPS: >30 (RTX 3090)

  • PSNR: >25 dB

  • 实时性能

3.2.2 MonoGS

核心创新

  • 单目/RGB-D/立体多模态支持

  • 3DGS与SLAM联合优化

  • 高斯点云自适应管理

技术特点

  • 单线程实现(论文中说明)

  • 基于光度误差的跟踪

  • 关键帧选择策略

论文声称性能(Desktop GPU):

  • FPS: ~1-2 (RTX 3090)

  • ATE: ~1-5 mm

3.2.3 SGAD-SLAM

核心创新

  • 子地图策略(Submapping)

  • 高斯点云密集表示

  • 多指标质量评估

技术特点

  • 激进的子地图创建策略(每1帧)

  • 高斯球数量庞大(~89,000个/帧)

  • 完整的SSIM、LPIPS评估

论文声称性能(Desktop GPU):

  • FPS: 未明确说明

  • PSNR: ~22-24 dB

3.2.4 SplaTAM

核心创新

  • 紧凑的3D场景表示

  • 支持iPhone LiDAR数据

  • 高质量渲染

技术特点

  • 激进的迭代策略(200次Tracking + 30次Mapping/帧)

  • 联合优化跟踪与建图

  • 完整的质量评估指标

论文声称性能(Desktop GPU):

  • FPS: 8-12 (!!)

  • 但实际测试显示数据可能来自Desktop GPU

3.3 算法对比总结

特性 MonoRTGS MonoGS SGAD-SLAM SplaTAM
边缘设备优化 ✅ 专门优化 ❌ 未考虑 ❌ 未考虑 ❌ 未考虑
输入类型 RGB-D/单目 多模态 RGB-D RGB-D/单目
实现复杂度 中等 简单 复杂 复杂
内存占用
论文可信度 ✅ 实测一致 ⚠️ 低于声称 ⚠️ 低于声称 ❌ 远低于声称

4. 实验设计

4.1 实验变量

自变量:SLAM算法类型(4种)

因变量

  1. 速度指标:FPS(Frames Per Second)、运行时间

  2. 精度指标:ATE RMSE(Absolute Trajectory Error)

  3. 质量指标:PSNR、SSIM、LPIPS

  4. 资源指标:内存占用、CPU使用率、GPU使用率、温度

控制变量

  • 数据集:freiburg1_room

  • 硬件平台:Jetson AGX Orin

  • 性能模式:最大性能模式

  • 分辨率:640×480(原始)

4.2 评估指标

4.2.1 速度指标
指标 定义 计算方式
FPS 每秒处理的帧数 帧数 / 总时间
运行时间 完成整个序列所需时间 结束时间 - 开始时间
每帧耗时 处理单帧的平均时间 总时间 / 帧数
4.2.2 精度指标
指标 定义 单位 优劣
ATE RMSE 绝对轨迹误差的均方根 厘米(cm) 越小越好
计算方式 与地面真值轨迹的对比 - -
4.2.3 质量指标
指标 定义 单位 优劣
PSNR 峰值信噪比 dB 越大越好
SSIM 结构相似性指数 0-1 越大越好
LPIPS 感知损失距离 0-1 越小越好
4.2.4 资源指标
指标 监控方式 单位
内存占用 tegrastats实时监控 MB
CPU使用率 tegrastats实时监控 %
GPU频率 tegrastats实时监控 %
温度 tegrastats实时监控 °C

4.3 实验流程

复制代码
┌────────────────────────────────────────────────────────────────────┐
│                         实验流程图                                │
├────────────────────────────────────────────────────────────────────┤
│                                                                    │
│  1. 环境准备                                                       │
│     ├─ 配置Jetson AGX Orin(最大性能模式)                        │
│     ├─ 安装所有算法依赖                                           │
│     └─ 准备TUM freiburg1_room数据集                               │
│                                                                    │
│  2. 算法配置                                                       │
│     ├─ 统一数据集路径                                             │
│     ├─ 统一分辨率设置(640×480)                                  │
│     └─ 禁用GUI、调试输出等                                         │
│                                                                    │
│  3. 算法运行(按顺序)                                             │
│     ├─ SGAD-SLAM (2026-05-12)                                     │
│     ├─ SplaTAM (2026-05-13~15)                                    │
│     ├─ MonoRTGS (2026-05-15)                                      │
│     └─ MonoGS (2026-05-15)                                        │
│        │                                                           │
│        ├─ 启动tegrastats监控                                       │
│        ├─ 运行SLAM算法                                            │
│        ├─ 记录系统资源使用                                         │
│        └─ 保存运行结果                                            │
│                                                                    │
│  4. 结果分析                                                       │
│     ├─ 提取速度、精度、质量指标                                    │
│     ├─ 分析系统资源监控数据                                        │
│     ├─ 生成可视化图表                                              │
│     └─ 撰写实验报告                                               │
│                                                                    │
└────────────────────────────────────────────────────────────────────┘

4.4 数据采集

4.4.1 系统监控数据采集

使用 tegrastats 工具进行实时监控,采样间隔1秒:

复制代码
tegrastats --interval 1000 --logfile algo_name.log

监控内容包括:

  • RAM使用量和百分比

  • SWAP使用量

  • CPU各核心使用率

  • GPU频率使用率

  • CPU、GPU、SOC温度

4.4.2 日志数据清理

由于监控脚本关闭延迟,实际记录时间超过算法运行时间。本研究根据算法实际完成时间,对日志进行了精确清理,确保分析数据仅包含算法运行期间的系统状态。

清理情况

算法 原始日志行数 清理后行数 删除行数 删除时长
RTGS 2,902 2,902 0 0秒
MonoGS 23,587 23,507 80 ~1分20秒
SplaTAM 162,203 158,065 4,138 ~1小时9分钟
SGAD-SLAM 6,136 6,132 4 ~4秒

5. 实验结果

5.1 总体结果对比

5.1.1 四算法性能总表
算法 FPS ATE (cm) PSNR (dB) SSIM LPIPS 运行时间 帧数
MonoRTGS 1.80 1.47 25.80 - - 48.2 min 1315
MonoGS 0.056 7.34 - - - 6.57 hr 1315
SGAD-SLAM 0.232 91.71 21.65 0.769 0.447 94.3 min 1315
SplaTAM 0.0083 11.74 21.07 0.823 0.251 44.1 hr 1315
5.1.2 性能排名
维度 🥇 第一名 🥈 第二名 🥉 第三名 第四名
速度 (FPS) MonoRTGS (1.80) SGAD-SLAM (0.232) MonoGS (0.056) SplaTAM (0.0083)
精度 (ATE) MonoRTGS (1.47) MonoGS (7.34) SplaTAM (11.74) SGAD-SLAM (91.71)
质量 (PSNR) MonoRTGS (25.80) SGAD-SLAM (21.65) SplaTAM (21.07) MonoGS (N/A)
质量 (SSIM) SplaTAM (0.823) SGAD-SLAM (0.769) - -
质量 (LPIPS) SplaTAM (0.251) SGAD-SLAM (0.447) - -
效率 (时间) MonoRTGS (48.2min) SGAD-SLAM (94.3min) MonoGS (6.57hr) SplaTAM (44.1hr)
5.1.3 关键发现

MonoRTGS 全面领先

  • ✅ 速度最快:1.80 FPS,比第二快快 7.8倍

  • ✅ 精度最高:ATE 1.47 cm,比MonoGS好 5倍

  • ✅ 质量最好:PSNR 25.80 dB,远超其他算法

  • ✅ 效率最高:48.2分钟完成,是MonoGS的 8.2倍 速度

5.2 详细算法分析

5.2.1 MonoRTGS

运行信息

复制代码
开始时间: 2026-05-15 14:01:13
结束时间: 2026-05-15 14:49:44
总运行时间: 2890秒 (48分17秒)
处理帧数: 1315帧 (100%)

性能指标

复制代码
平均FPS: 1.80
每帧耗时: 0.56秒
峰值内存: 12.90 GB

质量指标

复制代码
ATE RMSE: 1.47 cm
PSNR: 25.80 dB

优势分析

  1. 自适应优化策略有效:根据场景复杂度动态调整计算资源

  2. 内存管理优秀:峰值内存仅12.90GB,远低于其他算法

  3. 温度控制良好:GPU平均温度约55°C,运行稳定

5.2.2 MonoGS

运行信息

复制代码
开始时间: 2026-05-15 16:05:38
结束时间: 2026-05-15 22:38:54
总运行时间: 23657秒 (6小时34分17秒)
处理帧数: 1315帧 (100%)

性能指标

复制代码
平均FPS: 0.056
每帧耗时: 17.99秒
峰值内存: ~14.5 GB

质量指标

复制代码
ATE RMSE: 7.34 cm

问题分析

  1. 单线程限制:论文说明为单线程实现,严重限制性能

  2. 运行时间过长:6.57小时,实际应用不可接受

  3. 缺少质量指标:未提供PSNR、SSIM评估

优势

  • 位姿精度第二好(ATE 7.34 cm)
5.2.3 SGAD-SLAM

运行信息

复制代码
开始时间: 2026-05-12 18:35:15
结束时间: 2026-05-12 20:17:46
总运行时间: 5659秒 (94分19秒)
处理帧数: 1315帧 (100%)

性能指标

复制代码
平均FPS: 0.232
每帧耗时: 4.31秒
峰值内存: ~7.5 GB

质量指标

复制代码
ATE RMSE: 91.71 cm
PSNR: 21.65 dB
SSIM: 0.769
LPIPS: 0.447
Depth L1: 0.560 m

问题分析

  1. 位姿误差过大 :ATE 91.71 cm,几乎是MonoRTGS的 62倍

  2. 子地图策略过于激进:每1帧创建新子地图,造成精度损失

  3. 高斯球数量庞大:每帧约89,000个,计算负担重

优势

  • 速度第二快(0.232 FPS)

  • 提供完整的质量评估指标

5.2.4 SplaTAM

运行信息

复制代码
开始时间: 2026-05-13 16:37:23
结束时间: 2026-05-15 12:42:00
总运行时间: 158700秒 (44小时5分钟)
处理帧数: 1315帧 (100%)

性能指标

复制代码
平均FPS: 0.0083
每帧耗时: 120.68秒 (约2分钟)
峰值内存: ~10.5 GB

质量指标

复制代码
ATE RMSE: 11.74 cm
PSNR: 21.07 dB
SSIM: 0.823 (最高)
LPIPS: 0.251 (最低,最好)
Depth RMSE: 3.25 cm

问题分析

  1. 速度完全不可接受:0.0083 FPS,运行44小时

  2. 迭代策略过于激进:200次Tracking + 30次Mapping/帧

  3. 论文数据严重不符 :声称8-12 FPS,实际差 1000倍

优势

  • SSIM最高(0.823),感知质量最好

  • LPIPS最低(0.251),感知损失最小

  • ATE第三好(11.74 cm)

5.3 论文声称 vs 实际测试

算法 论文声称FPS Jetson实测FPS 差距倍数 可信度
MonoRTGS >30 (Desktop) 1.80 ~17倍 ✅ 实测一致
MonoGS ~1-2 (Desktop) 0.056 ~18-36倍 ⚠️ 低于预期
SGAD-SLAM 未明确 0.232 - ✅ 实测数据
SplaTAM 8-12 0.0083 1000倍 ❌ 严重不符

关键结论:SplaTAM的论文性能数据可能来自高性能Desktop GPU,在边缘设备上完全崩塌。


6. 性能分析

6.1 速度分析

6.1.1 FPS 对比
复制代码
MonoRTGS  ████████████████████████████████████████████ 1.80 FPS
SGAD-SLAM ████████████                                   0.232 FPS
MonoGS    █                                              0.056 FPS
SplaTAM   ▌                                              0.0083 FPS
          0                                              0.5      1.0      1.5      2.0 FPS

倍数关系

  • MonoRTGS vs SGAD-SLAM: 7.8倍

  • MonoRTGS vs MonoGS: 32.1倍

  • MonoRTGS vs SplaTAM: 217倍

6.1.2 运行时间对比
复制代码
MonoRTGS  ████                                           48.2 分钟
SGAD-SLAM ███████████                                    94.3 分钟
MonoGS    ████████████████████████████████████████████   394 分钟 (6.57小时)
SplaTAM   ████████████████████████████████████████████████████████████████████████████████████████   2646 分钟 (44.1小时)
          0      500     1000    1500    2000    2500    3000 分钟

倍数关系

  • MonoRTGS vs SGAD-SLAM: 0.51倍 时间(快约2倍)

  • MonoRTGS vs MonoGS: 0.12倍 时间(快约8.2倍)

  • MonoRTGS vs SplaTAM: 0.018倍 时间(快约55倍)

6.2 精度分析

6.2.1 ATE 对比(越小越好)
复制代码
MonoRTGS  █                                              1.47 cm
MonoGS    ██████                                         7.34 cm
SplaTAM   ██████████                                     11.74 cm
SGAD-SLAM ████████████████████████████████████████████   91.71 cm
          0      20      40      60      80      100     120 cm

关键发现

  • MonoRTGS的ATE是所有算法中最低(最好)

  • SGAD-SLAM的ATE是MonoRTGS的 62倍,精度严重不足

  • MonoGS的ATE第二好,但速度太慢

6.2.2 精度-速度权衡分析
复制代码
高精度
    │
    │         MonoRTGS ★ 综合最优
    │         MonoGS   ○ 精度高但慢
    │         SplaTAM  ○ 质量好但极慢
    │         SGAD-SLAM × 精度差
    │
    │
    │                                    低精度
    └──────────────────────────────────────►
    高速度                                    低速度

结论:MonoRTGS实现了最佳的速度-精度权衡。

6.3 质量分析

6.3.1 PSNR 对比(越大越好)
复制代码
MonoRTGS  ████████████████████████████████   25.80 dB
SGAD-SLAM ████████████████                  21.65 dB
SplaTAM   ████████████████                  21.07 dB
MonoGS    (未提供)
          20      21      22      23      24      25      26 dB

关键发现

  • MonoRTGS的PSNR最高,渲染质量最好

  • 比SGAD-SLAM高 4.15 dB

  • 比SplaTAM高 4.73 dB

6.3.2 SSIM 和 LPIPS 对比
算法 SSIM LPIPS 说明
SplaTAM 0.823 0.251 感知质量最好
SGAD-SLAM 0.769 0.447 感知质量中等
MonoRTGS 未提供 未提供 专注于PSNR优化
MonoGS 未提供 未提供 未提供质量指标

结论:SplaTAM在感知质量指标上表现最好,但速度是致命缺陷。


7. 系统资源监控分析

7.1 监控数据统计

7.1.1 资源使用统计
算法 监控时长 平均RAM 峰值RAM 平均CPU 平均GPU频率 平均CPU温度 平均GPU温度
RTGS 48分 4.7 GB (31%) 6.2 GB (40%) 15% 76% 54°C 55°C
MonoGS 6.6小时 6.1 GB (40%) 8.1 GB (53%) 25% 67% 56°C 55°C
SplaTAM 44小时 4.1 GB (27%) 6.3 GB (41%) 8% 76% 50°C 53°C
SGAD-SLAM 1.6小时 3.5 GB (23%) 5.2 GB (34%) 12% 76% 56°C 55°C
7.1.2 关键发现

内存使用

  • MonoGS峰值内存最高(8.1 GB)

  • SGAD-SLAM内存使用最低(3.5 GB)

  • MonoRTGS内存控制良好(6.2 GB)

CPU使用

  • MonoGS CPU使用率最高(25%),但仍是低水平

  • SplaTAM CPU使用率最低(8%),说明不是CPU密集型

  • 所有算法的CPU使用率都不高,说明GPU是主要计算瓶颈

GPU频率

  • RTGS、SplaTAM、SGAD-SLAM的GPU频率都保持在76%左右

  • MonoGS的GPU频率稍低(67%)

  • GPU被充分利用,是计算的主要瓶颈

温度控制

  • 所有算法的温度都在50-56°C范围,控制良好

  • 没有出现过热降频情况

  • 说明Jetson AGX Orin的散热设计优秀

7.2 资源使用模式分析

7.2.1 MonoRTGS 资源使用模式
复制代码
内存使用: 稳定增长后趋于平稳
GPU使用: 持续高负载(75-80%)
温度: 稳定在55°C左右
CPU使用: 波动较小,平均15%

特点:资源使用平稳,没有明显的峰值波动,说明优化策略工作良好。

7.2.2 MonoGS 资源使用模式
复制代码
内存使用: 持续增长,峰值达到8.1 GB
GPU使用: 波动较大,平均67%
温度: 略高,平均56°C
CPU使用: 波动较大,平均25%

特点:资源使用波动大,可能存在优化空间。

7.2.3 SplaTAM 资源使用模式
复制代码
内存使用: 最低,平均4.1 GB
GPU使用: 持续高负载(76%)
温度: 最低,平均50°C
CPU使用: 最低,平均8%

特点:资源使用保守,但速度极慢,说明存在严重的算法效率问题。

7.3 性能瓶颈分析

7.3.1 主要瓶颈
算法 主要瓶颈 证据
MonoRTGS GPU计算能力 GPU频率持续高负载(76%)
MonoGS 单线程限制 CPU使用率低(25%),GPU未满载
SplaTAM 算法效率 CPU/GPU使用率都不高,但速度极慢
SGAD-SLAM GPU计算能力 + 算法精度 GPU高负载,但精度差
7.3.2 优化潜力分析

MonoGS

  • ⭐⭐⭐⭐⭐ 高优化潜力

  • 单线程限制是主要瓶颈

  • 多线程化可望提升到0.2-0.5 FPS

SGAD-SLAM

  • ⭐⭐⭐ 中等优化潜力

  • 子地图策略需要调整

  • 降低高斯球数量可提升速度

SplaTAM

  • ⭐ 低优化潜力

  • 算法设计本身不适合边缘设备

  • 迭代次数过于激进

MonoRTGS

  • ⭐ 优化空间有限

  • 已经针对边缘设备优化

  • 进一步优化空间较小


8. 讨论与结论

8.1 研究问题回答

Q1: 在边缘设备上,哪种3DGS-SLAM算法性能最佳?

答案MonoRTGS

证据

  1. 速度最快:1.80 FPS,比第二快快7.8倍

  2. 精度最高:ATE 1.47 cm,比MonoGS好5倍

  3. 质量最好:PSNR 25.80 dB,远超其他算法

  4. 效率最高:48.2分钟完成,是最快的算法

Q2: 论文声称的性能在边缘设备上是否可信?

答案大部分不可信

分析

  • MonoRTGS:论文声称>30 FPS(Desktop),实测1.80 FPS,比例合理

  • MonoGS:论文声称~1-2 FPS,实测0.056 FPS,差距18-36倍

  • SGAD-SLAM:论文未明确声称,实测0.232 FPS

  • SplaTAM :论文声称8-12 FPS,实测0.0083 FPS,差距1000倍

结论:大多数论文的性能数据来自高性能Desktop GPU,在边缘设备上严重崩塌。

Q3: 专门针对边缘设备的优化是否有效?

答案非常有效

证据

  • MonoRTGS针对边缘设备进行了自适应优化

  • 在速度、精度、质量三个维度全面领先

  • 内存占用控制良好(12.90 GB)

  • 运行稳定,无崩溃

8.2 关键发现

8.2.1 MonoRTGS 全面领先的原因
  1. 自适应剪枝策略

    • 根据场景复杂度动态调整高斯点数量

    • 避免不必要的计算开销

  2. 动态下采样机制

    • 在保持精度的前提下降低计算量

    • 平衡速度与质量

  3. 边缘设备内存优化

    • 高效的内存管理

    • 避免内存溢出和频繁交换

  4. ARM架构SIMD优化

    • 充分利用ARM处理器的SIMD指令

    • 提升计算效率

8.2.2 其他算法的问题

MonoGS

  • ❌ 单线程实现严重限制性能

  • ❌ 运行时间过长(6.57小时)

  • ✅ 位姿精度第二好(ATE 7.34 cm)

SGAD-SLAM

  • ❌ 子地图策略过于激进,精度差

  • ❌ 高斯球数量庞大(~89,000/帧)

  • ✅ 速度第二快(0.232 FPS)

SplaTAM

  • ❌ 迭代策略过于激进(200+30次/帧)

  • ❌ 速度完全不可接受(44.1小时)

  • ❌ 论文数据严重不符

  • ✅ SSIM、LPIPS指标最好

8.3 边缘设备3DGS-SLAM优化建议

8.3.1 算法设计层面
  1. 自适应优化策略

    • 根据场景复杂度动态调整计算资源

    • 避免固定的计算模式

  2. 内存高效管理

    • 及时清理无用的高斯点

    • 避免内存碎片化

  3. 多线程并行化

    • 充分利用ARM多核架构

    • GPU与CPU并行计算

  4. SIMD指令优化

    • 利用ARM NEON指令集

    • 提升向量化计算效率

8.3.2 工程实现层面
  1. 避免过度迭代

    • SplaTAM的200+30次/帧过于激进

    • 建议控制在50+10次/帧以内

  2. 合理的子地图策略

    • SGAD-SLAM的每1帧创建子地图过于频繁

    • 建议每10-20帧创建一个子地图

  3. 高效的高斯点管理

    • 动态调整高斯点数量

    • 避免高斯点无限增长

8.4 算法选择建议

8.4.1 边缘设备应用
应用场景 推荐算法 理由
实时SLAM MonoRTGS 唯一能接近实时的算法
离线建图 MonoGS 精度高,可接受慢速
AR/VR MonoRTGS 速度和质量兼顾
机器人导航 MonoRTGS 速度和精度最优
3D重建 SplaTAM 质量最好,但不推荐(太慢)
8.4.2 不推荐的算法

SGAD-SLAM

  • ❌ 精度太差(ATE 91.71 cm)

  • 虽然速度第二,但精度无法接受

SplaTAM

  • ❌ 速度太慢(44.1小时)

  • 边缘设备完全不可用

8.5 研究局限性

  1. 单数据集测试:仅测试了TUM freiburg1_room序列

  2. 单硬件平台:仅在Jetson AGX Orin上测试

  3. 部分指标缺失:MonoGS未提供PSNR、SSIM指标

8.6 未来工作

  1. 多数据集验证

    • 扩展到其他TUM序列(freiburg1_desk、freiburg2_xyz等)

    • 测试Replica数据集

    • 测试真实场景数据

  2. 更多硬件平台

    • Jetson Orin Nano

    • 树莓派

    • 其他边缘计算平台

  3. 算法优化

    • MonoGS多线程优化

    • 自适应参数调整

    • 混合精度计算

  4. 实时应用验证

    • 无人机实时避障

    • AR/VR实时定位

    • 移动机器人导航


9. 附录

9.1 实验配置文件

9.1.1 MonoRTGS配置
复制代码
# configs/rgbd/tum/fr1_room.yaml
Dataset:
  dataset_path: "/home/jetson/aaa-dataset/rgbd_dataset_freiburg1_room"
  Calibration:
    fx: 517.3
    fy: 516.5
    cx: 318.6
    cy: 255.3
    width: 640
    height: 480
    depth_scale: 5000.0
​
Training:
  iterations: 150
  lr: 0.01
  gaussian_reset: 2001
​
Mapping:
  map_every: 1
  new_submap_every: 1
9.1.2 MonoGS配置
复制代码
# configs/rgbd/tum/fr1_room.yaml
inherit_from: "configs/rgbd/tum/base_config.yaml"
​
Dataset:
  dataset_path: "/home/jetson/aaa-dataset/rgbd_dataset_freiburg1_room"
  single_thread: True  # Jetson必需
  Calibration:
    fx: 517.3
    fy: 516.5
    cx: 318.6
    cy: 255.3
    width: 640
    height: 480
    depth_scale: 5000.0
9.1.3 SGAD-SLAM配置
复制代码
python3 slam_single.py \
    --dataset_path /home/jetson/aaa-dataset/rgbd_dataset_freiburg1_room \
    --config configs/TUM/rgbd_dataset_freiburg1_room.txt \
    --output_path output/fr1_room_jetson \
    --save_results \
    --config_map_path configs_map/TUM_RGBD/rgbd_dataset_freiburg1_room.yaml
9.1.4 SplaTAM配置
复制代码
# configs/tum/splatam.py
scene_name = "freiburg1_room"  # 第9行
basedir = "/home/jetson/aaa-dataset"  # 第49行
​
# 迭代参数
tracking_iterations = 200
mapping_iterations = 30

9.2 运行命令

9.2.1 启动监控
复制代码
# 启动tegrastats监控
tegrastats --interval 1000 --logfile algo_name.log &
​
# 查看监控状态
tegrastats
9.2.2 运行算法
复制代码
# MonoRTGS
cd ~/aaa-new-rtgs/MonoRTGS
source rtgs_venv/bin/activate
python3 slam.py --config configs/rgbd/tum/fr1_room.yaml
​
# MonoGS
conda activate MonoGS
cd ~/aaa-Mono-GS/MonoGS-main
python ./slam.py --config configs/rgbd/tum/fr1_room.yaml
​
# SGAD-SLAM
conda activate sgadslam
cd ~/aaa-SGAD-SLAM-new/SGAD-SLAM-main
python3 slam_single.py --dataset_path /home/jetson/aaa-dataset/rgbd_dataset_freiburg1_room --config configs/TUM/rgbd_dataset_freiburg1_room.txt --output_path output/fr1_room_jetson --save_results --config_map_path configs_map/TUM_RGBD/rgbd_dataset_freiburg1_room.yaml
​
# SplaTAM
conda activate splatam
cd ~/aaa-SplaTAM-main/SplaTAM-main
python scripts/splatam.py configs/tum/splatam.py

9.3 结果文件位置

复制代码
运行结果/
├── RTGS-SLAM-tum-room1/
│   └── RTGS_20260515_140113.log (监控日志)
├── MonoGS-SLAM-tum-room1/
│   ├── 2026-05-15-16-05-38/
│   │   ├── plot/ (轨迹文件)
│   │   └── stats_final.json (评估结果)
│   └── MonoGS_20260515_160541.log (监控日志)
├── SGAD-SLAM-tum-room1/
│   ├── rendering_metrics.json
│   ├── psnr.txt
│   └── SGAD-20260512_183515.log (监控日志)
├── SplaTAM-tum-room1/
│   ├── eval/ (PSNR、SSIM、LPIPS等)
│   └── Splatam_20260513_163723.log (监控日志)
└── 监控数据可视化/
    ├── RTGS_监控数据.png
    ├── MonoGS_监控数据.png
    ├── SplaTAM_监控数据.png
    ├── SGAD-SLAM_监控数据.png
    ├── 四算法监控数据对比.png
    └── 运行时长对比.png

9.4 可视化图表说明

9.4.1 单算法监控图表

每个算法的监控图表包含:

  • RAM使用量和使用率

  • CPU平均使用率

  • GPU频率使用率

  • CPU、GPU、SOC温度

  • SWAP使用量

  • 统计摘要

9.4.2 对比图表

四算法监控数据对比

  • 归一化时间轴的资源使用对比

  • 内存、CPU、GPU、温度的多维度对比

  • 统计数据对比表

运行时长对比

  • 四算法运行时长柱状图

  • 直观显示效率差异

参考文献

  1. MonoRTGS: Real-Time Gaussian Splatting SLAM for Edge Devices, MICRO 2025

  2. MonoGS: MonoGS: SLAM with Gaussian Splatting for Monocular, RGB-D and Stereo, CVPR 2024 Highlight

  3. SGAD-SLAM: SLAM with Gaussian Abstraction and Differentiable Rendering for 3D Consistency, CVPR 2026

  4. SplaTAM: Splat-SLAM: Splatted Object Tracking and Mapping, CVPR 2024

  5. TUM RGB-D Dataset: J. Sturm et al., "A Benchmark for RGB-D Visual Odometry, 3D Reconstruction and SLAM", ICRA 2012


报告完成日期 : 2026年5月16日 实验地点 : NVIDIA Jetson AGX Orin 数据集: TUM RGB-D freiburg1_room


本报告详细记录了四种3DGS-SLAM算法在边缘设备上的性能对比实验,为边缘设备实时SLAM应用提供了算法选择指导和优化建议。

「2026 (MonoRTGS,MonoGS,SGAD-SLAM,SplaTAM)4算法运行结果」
/~72443Yb8hW~:/
链接:https://pan.quark.cn/s/6295f79fc01e

相关推荐
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题 第54题】【JVM篇】第14题:什么是可达性分析算法?
java·jvm·算法·面试
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题 第55题】【JVM篇】第15题:JVM有哪些垃圾收集算法?
java·jvm·算法·面试
Lucky_ldy1 小时前
C语言学习: 自定义类型—联合和枚举
c语言·学习·算法
gumichef1 小时前
栈和队列(2)
数据结构·算法·链表
进击的荆棘1 小时前
递归、搜索与回溯——综合(下)
c++·算法·leetcode·深度优先·dfs
不知名的忻2 小时前
归并排序(Java)
java·算法·排序算法
YUDAMENGNIUBI4 小时前
day20_逻辑回归
算法·机器学习·逻辑回归
澈2078 小时前
C++并查集:高效解决连通性问题
java·c++·算法
旖-旎10 小时前
深搜练习(单词搜索)(12)
c++·算法·深度优先·力扣