基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
初窺門徑几秒前
label studio安装和使用
人工智能·分类·数据挖掘
ZFSS2 分钟前
Producer Tasks API 的对接和使用
人工智能·ai·ai作画·ai编程
飞升不如收破烂~2 分钟前
AI会替代一部分人,但不会“替代人类”。更准确的说法是——重构工作结构。
人工智能
Joy T2 分钟前
【AI Agent入门】从RAG知识库到智能体架构:实质区分Coze、Dify与OpenClaw
人工智能·agent·dify·rag·coze·openclaw
Wu_Dylan2 分钟前
液态神经网络系列(六) | 数学求解器全景图:Euler、RK4、Dopri5、自适应步长怎么选?
人工智能·深度学习·神经网络
TYFHVB123 分钟前
2026六大主流CRM横评,五大核心维度深度解析
大数据·前端·数据结构·人工智能
on_pluto_3 分钟前
论文Heterogeneous Graph Transformer(HGT)阅读笔记
论文阅读·人工智能·笔记·深度学习·学习方法
新新学长搞科研4 分钟前
【绿色能源方向会议】第五届绿色能源与电力系统国际学术会议(ICGEPS 2026)
人工智能·能源·信号处理·材料工程·电力·电气自动化·绿色能源
苍何4 分钟前
腾讯版 OpenClaw 来了!无需部署,安装即用!
人工智能
Gorgous—l5 分钟前
数据结构算法学习:LeetCode热题100-贪心算法篇(数组中的第K个最大元素、 前 K 个高频元素、数据流的中位数)
数据结构·学习·算法