基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
嵌入式-老费4 分钟前
外壳3D结构设计(学习Freecad)
学习
诸葛务农6 分钟前
类脑智能技术与系统:类脑大模型架构(下)
人工智能·深度学习·架构
诸葛务农6 分钟前
类脑智能技术与系统:类脑大模型架构(上)
人工智能·深度学习·神经网络·架构
imbackneverdie7 分钟前
2025国自然资助率12.29%创新低!2026年如何用数据与AI“破局”?
数据库·人工智能·自然语言处理·aigc·ai写作·课题·国家自然科学基金
IT_陈寒7 分钟前
JavaScript性能优化:我用这7个V8引擎冷门技巧将页面加载速度提升了40%
前端·人工智能·后端
KOYUELEC光与电子请努力拼搏~15 分钟前
监测精度再升级,小米手环8 Pro内部采用OCN亚奇科技连接器~
人工智能·科技
YJlio18 分钟前
Sysinternals 文件工具学习笔记(12.12):常见踩坑场景、排障套路与面试问题
笔记·学习·面试
胡伯来了18 分钟前
19. Transformers - 文本领域的任务类
人工智能·transformer·多模态·transformers
Fabarta技术团队20 分钟前
枫清科技项目成功入选市科委、中关村管委会2025年重点应用场景项目名单
人工智能·科技
是店小二呀20 分钟前
出差忘带文件?我的急救方案节点小宝4.0
人工智能