基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
Java技术小馆4 分钟前
为什么你的 AI 效率没翻倍?避开这 5 个落地深坑
人工智能
xian_wwq7 分钟前
【学习笔记】变电保护、测控、安自、自动化系统概述
笔记·学习·保护
贫民窟的勇敢爷们9 分钟前
qBittorrent:37k 星的开源 BT 客户端,如何用 C++ 打造无广告的 P2P 下载神器】
人工智能
lizhihai_9912 分钟前
股市学习心得—商业航天10大核心材料供应商
大数据·人工智能·学习
Peter·Pan爱编程13 分钟前
第四篇:Cursor 深度评测 —— Composer 模式下的全栈 vibe 体验
人工智能·ai编程·composer
泰勒朗斯15 分钟前
rootflight学习笔记
笔记·学习
好运的阿财19 分钟前
OpenClaw工具拆解之memory_search+memory_get
人工智能·python·ai编程·openclaw·openclaw工具
crazy_wsp20 分钟前
使用AI从0到1上线微信小程序
人工智能·微信小程序·小程序
AI科技星23 分钟前
光子本源三元结构定理(《全域数学·物理原本》)【乖乖数学】
人工智能·机器学习·数学建模·数据挖掘·agi
逻辑君30 分钟前
认知神经科学研究报告【20260023】
人工智能·神经网络·机器学习