基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
橙露4 小时前
数据特征工程:缺失值、异常值、标准化一站式解决方案
人工智能·机器学习
小付同学呀4 小时前
C语言学习(五)——输入/输出
c语言·开发语言·学习
新加坡内哥谈技术4 小时前
OpenAI 的 Codex 团队如何工作并利用 AI
人工智能
星河耀银海4 小时前
人工智能大模型的安全与隐私保护:技术防御与合规实践
人工智能·安全·ai·隐私
love530love4 小时前
Scoop 完整迁移指南:从 C 盘到 D 盘的无缝切换
java·服务器·前端·人工智能·windows·scoop
njsgcs4 小时前
agentscope提取msg+llama_index 查询
人工智能
小和尚同志5 小时前
什么?oh-my-opencode 太重了?那试试 oh-my-opencode-slim
人工智能·aigc
学编程的闹钟5 小时前
E语言计算器开发全攻略
学习
薛定e的猫咪5 小时前
Claude Code 完整学习手册:安装配置、CCR、MCP、插件与 Superpowers开发框架
学习
一路往蓝-Anbo5 小时前
第 9 章:Linux 设备树 (DTS) ——屏蔽与独占外设
linux·运维·服务器·人工智能·stm32·嵌入式硬件