Unsupervised Domain Adaptation for Anatomical Landmark Detection论文速读

文章目录

  • [Unsupervised Domain Adaptation for Anatomical Landmark Detection](#Unsupervised Domain Adaptation for Anatomical Landmark Detection)

Unsupervised Domain Adaptation for Anatomical Landmark Detection

摘要

最近,解剖学标志检测在单域数据上取得了进步,单域数据通常假设训练集和测试集来自同一域。然而,这种假设在实践中并不总是正确的,由于域偏移,这可能会导致性能显著下降。为了解决这个问题,我们提出了一种新的框架,用于在无监督域适应(UDA)下进行解剖学标志检测,该框架旨在将知识从标记的源域转移到未标记的靶域。

该框架利用自我训练和领域对抗学习来解决适应过程中的领域差距。具体而言,该文提出一种自训练策略,选择具有动态阈值的目标域数据可靠的地标级伪标签,使适应更加有效。此外,还设计了一个领域对抗性学习模块,通过对抗性训练学习领域不变特征,从而处理两个领域的不对齐数据分布。

本文方法

首先作者给出了源域和目标域的图像差别,分布式也有所不同

总共的模型结构

首先讲源域的和目标域的图像经过特征提取,然后源域在经过 Landmark Detection Model,如下图所示

首先利用transformer解码器得到坐标,landmark queries是利用卷积提取的特征,然后进行局部微调

局部微调模块通过 1 × 1 个卷积层输出分数图 yˆs 和 偏移图 yˆo(输入为landmark queries)。分数图表示每个网格成为目标地标的可能性,而偏移图表示相邻网格与目标的相对偏移量。分数图的标签由高斯核平滑,L2 损失用于损失函数 Lscore。由于偏移量是一个回归问题,因此 L1 用于损失 Loffset,并且仅应用于其 GT 分数大于零的区域。在推理过程中,最佳局部格网不是由yˆs的最大分数选择的,而是由全局定位的坐标投影来选择的。然后将相应的偏移值添加到最佳网格中进行细化。此外,通过投影可以很容易地从分数图中获得每个预测的置信度

Landmark-Aware Self-training策略,提出了 LAST,它在坐标级别选择可靠的伪标签

M为mask操作

然后结合Domain Adversarial Learning,特征 f 进一步通过全局平均池化 (GAP) 和全连接 (FC) 层,然后连接到域分类器 D 以区分输入 x 的来源。分类器可以使用二元交叉熵损失进行训练

d为域标签

总的损失函数如下

实验结果


相关推荐
CV实验室2 小时前
Meta引爆3D革命!SAM 3D 发布:单张图秒建3D模型,AR/VR、游戏圈炸锅!
计算机视觉·3d·meta·ar·vr
RFdragon2 小时前
分享本周所学——三维重建算法3D Gaussian Splatting(3DGS)
人工智能·线性代数·算法·机器学习·计算机视觉·矩阵·paddlepaddle
星河耀银海2 小时前
3D效果:HTML5 WebGL结合AI实现智能3D场景渲染
前端·人工智能·深度学习·3d·html5·webgl
balmtv6 小时前
2026年多模态AI文件处理与联网搜索完全教程:国内镜像方案实测
人工智能
2501_926978336 小时前
AI的三次起落发展分析,及未来预测----理论5.0的应用
人工智能·经验分享·笔记·ai写作·agi
前网易架构师-高司机6 小时前
带标注的瓶盖识别数据集,识别率99.5%,可识别瓶盖,支持yolo,coco json,pascal voc xml格式
人工智能·yolo·数据集·瓶盖
软件供应链安全指南6 小时前
以AI治理AI|问境AIST首家通过信通院大模型安全扫描产品能力评估!
人工智能·安全·ai安全·问境aist·aist·智能体安全
_爱明6 小时前
CUDA索引越界问题(Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions)
人工智能·深度学习
这张生成的图像能检测吗7 小时前
(论文速读)TCN:序列建模不一定需要 RNN
人工智能·深度学习·transformer·卷积·时序预测
大师影视解说7 小时前
基于Web端的AI电影解说自动化生产工具实测:4步完成从文案到成片的全流程
运维·人工智能·自动化·影视解说·电影解说工具·网页版电影解说·ai电影解说