基于三元组一致性学习的单目内窥镜里程计估计

文章目录

  • [TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope](#TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope)

TCL: Triplet Consistent Learning for Odometry Estimation of Monocular Endoscope

摘要

单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。

本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。
代码地址

方法

图1描述三元组一致性学习框架(TCL)的总体架构,包含两个模块:

  1. 几何一致性模块(GC):
  • 利用透视视图合成技术生成合成三元组
  • 通过深度一致性损失Ldc和姿态一致性损失Lpc来强制实现几何一致性
  1. 外观不一致模块(AiC):
  • 基于翘曲三元组生成三元组掩码
  • 将掩码应用于光度损失Lp,以减少外观不一致的影响

该框架可以轻松嵌入到无监督的结构从运动(SfM)方法中,无需增加额外的模型参数。这种设计旨在提高单目内窥镜里程计估计的精度,特别是在内窥镜数据集缺乏视觉变化和存在外观不一致的情况下。

实验结果




相关推荐
dajun18112345617 小时前
智能体在复杂工作流中的角色分配
大数据·运维·人工智能
yesyesido17 小时前
AI手办工坊:3D渲染级二次元写真生成、多风格角色定制与高清无损下载的一键创作平台
人工智能·3d
梦境虽美,却不长17 小时前
简单项目,天问ASR离线语音+esp8266的红外语音助手2026-1-2
人工智能·语音识别·红外遥控·arduino编程·天问编程
AI Echoes17 小时前
LangChain中的工具与工具包
人工智能·python·langchain·prompt·agent
航Hang*18 小时前
第九章:网络系统建设与运维(高级)—— 无线局域网
网络·笔记·学习·华为·ensp·交换机
源代码杀手18 小时前
Cloudflare 全球边缘节点:VoiceCraft 让 TTS/STT 请求实现全球近场极速响应
人工智能
WhereIsMyChair18 小时前
DPO 核心损失函数β调大可以控制不偏离ref模型太远
人工智能·算法·机器学习
彼岸花开了吗18 小时前
构建AI智能体:七十二、交叉验证:从模型评估的基石到大模型时代的演进
人工智能·python·llm
赵长辉18 小时前
AGI-rag学习: 实现了一个混合搜索系统,结合了 BM25 和 密集向量检索两种方法 【20251016课复习】
python·学习·agi
nvd1118 小时前
RAG Agent 响应策略:文档与分析
人工智能·python