基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
美狐美颜sdk6 小时前
Android/iOS/鸿蒙美颜SDK开发指南:实时美颜与推流
人工智能·直播美颜sdk·视频美颜sdk·美颜api·美狐美颜sdk
深兰科技6 小时前
深兰科技签约乌兹别克斯坦智慧城市项目,推动中国AI出海规模化
人工智能·beautifulsoup·numpy·智慧城市·fastapi·matplotlib·深兰科技
消晨消晨6 小时前
Pytorch初上手——模型构建
人工智能·深度学习
动物园猫6 小时前
交通事故车辆受损情况数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·分类
陈天伟教授6 小时前
图解人工智能(18)基于知识的人工智能
人工智能
jixunwulian6 小时前
AI边缘智能网关工业安全领域的边缘智能预警方案应用
网络·人工智能·安全
kcuwu.6 小时前
深度学习模型优化完全指南:从“下山“到“刷题“的通俗讲解
人工智能·深度学习
GitCode官方6 小时前
智能进化觉醒!openvela trunk-5.5 发布:端侧 AI Agent 开源和多方位升级
人工智能·开源
小江的记录本6 小时前
【AI大模型选型指南】《2026年5月(最新版)国内外主流AI大模型选型指南》(企业版)
前端·人工智能·后端·ai作画·aigc·ai编程·ai写作
北京华盛恒辉软件开发公司16 小时前
大模型运维深远海漂浮式风电系统已融合人工智能AI软件平台
运维·人工智能