基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
枫叶林FYL几秒前
公开数据集类型汇总分类
人工智能·分类·数据挖掘
张驰咨询公司5 分钟前
电池制造进入“统计控制时代”:六西格玛如何解锁材料一致性的终极密码
人工智能·六西格玛培训·六西格玛绿带培训·精益六西格·六西格玛培训公司
FluxMelodySun8 分钟前
机器学习(二十六) 降维:流形学习
人工智能·机器学习
智算菩萨14 分钟前
OpenCV色彩空间转换实战:BGR转HSV/LAB的工业应用场景详解(含自动化脚本)
人工智能·python·opencv·计算机视觉·自动化·音视频
小马学嵌入式~19 分钟前
linux开发深度学习-时钟
linux·arm开发·嵌入式硬件·学习
毕设源码-钟学长20 分钟前
【开题答辩全过程】以 基于web的书法学习网站的设计与实现为例,包含答辩的问题和答案
学习
码农三叔20 分钟前
(11-3)感知-运动耦合与行为理解:行为识别与预测
人工智能·机器人·自动驾驶·agent·人形机器人
南啸天22 分钟前
Context Window:上下文窗口”“token 上限
人工智能·ai·状态模式
XMAIPC_Robot28 分钟前
基于RK3588 ARM+FPGA的电火花数控硬件平台总体设计(二)
运维·arm开发·人工智能·fpga开发·边缘计算
皮卡蛋炒饭.29 分钟前
学习IO基础
学习