交叉调制少样本图像生成用于结直肠组织分类

文章目录

  • [Cross-Modulated Few-Shot Image Generation for Colorectal Tissue Classification](#Cross-Modulated Few-Shot Image Generation for Colorectal Tissue Classification)

Cross-Modulated Few-Shot Image Generation for Colorectal Tissue Classification

摘要

  1. 提出问题

    • 针对罕见癌症组织的组织病理训练数据稀缺问题,他们提出了少样本结直肠组织图像生成方法。
  2. 方法介绍

    • 提出的方法名为XM-GAN,接受一个基准图像和一对参考组织图像作为输入,生成高质量且多样化的图像。
    • 在XM-GAN中,采用了一种新颖的可控融合块,通过密集聚合参考图像和基准图像中局部区域的相似性,产生局部一致的特征。
  3. 研究贡献

    • 他们是第一个研究结直肠组织图像中少样本生成的团队。
    • 通过广泛的定性、定量和专家(病理学家)评估,对其提出的方法进行评估。
  4. 评估结果

    • 在专家评估中,病理学家仅在55%的时间内能够区分XM-GAN生成的组织图像和真实图像。
    • 利用生成的图像作为数据增强,解决少样本组织图像分类任务,在平均准确率方面取得了4.4%的提升。

方法


Fig. 1 : XM-GAN由一个CNN编码器、一个基于Transformer的可控融合块(CFB)和一个用于组织图像生成的CNN解码器组成。对于K-shot设置,一个共享编码器 F E F_E FE接受一个基准组织图像 x b x^b xb 以及 K − 1 K-1 K−1 个参考组织图像 x i r e f i = 1 K − 1 {x^{ref}i}^{K-1}{i=1} xirefi=1K−1,分别输出视觉特征 h b h^b hb 和 h i r e f h^{ref}_i hiref。在CFB中,一个映射网络计算元权重,用于在交叉注意力期间生成特征重新加权的调制权重。交叉注意力得到的特征 f i f_i fi 被融合并输入到解码器 (FD) 中,生成一幅图像 x ^ \hat{x} x^。


z z z为噪声, α \alpha α为控制参数

实验结果

相关推荐
梦想三三15 小时前
OpenCV银行卡数字识别项目(图像预处理与字符分割)
人工智能·opencv·计算机视觉
m0_6346667315 小时前
Anthropic Fable/Mythos 被紧急暂停:前沿模型商业化开始碰到真正的政策墙
人工智能·ai·ai编程
程序员cxuan15 小时前
LobsterAI 快把职业门槛打没了
人工智能·程序员
cqbzcsq15 小时前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
AndrewHZ15 小时前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
生成论实验室15 小时前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Godspeed Zhao15 小时前
现代智能汽车系统——智驾SoC之框架版图
人工智能·机器学习·自动驾驶·汽车·soc
薛定猫AI15 小时前
【技术干货】OpenRouter Fusion复合API实战:多模型协同调用如何突破单模型性能瓶颈
人工智能·agi
dayuOK630715 小时前
写作卡壳怎么办?我的“5分钟启动法”
人工智能·职场和发展·自动化·新媒体运营·媒体
大山佬15 小时前
边缘 AI 部署实战:从模型量化到 MCU 推理的端到端工程方案
人工智能