8.10论文阅读

文章目录

The multimodal MRI brain tumor segmentation based on AD-Net

摘要

基于磁共振成像(MRI)的多模态胶质瘤图像提供了肿瘤边界的不同特征,其中多模态特征的提取对于深度学习分割方法来说往往具有挑战性。不同模态特征之间的干扰是制约多模态学习的重要因素。为了有效地提取多模态特征,我们提出了一种自动加权扩张卷积网络(AD-Net),通过通道特征分离学习来学习多模态脑肿瘤特征。

其中,自加权扩张卷积单元(AD单元)利用双尺度卷积特征映射获取信道分离特征。我们在编码层中采用两个可学习参数融合双尺度卷积特征映射,并随着梯度的反向传播自动调整两个可学习参数。我们采用Jensen-Shannon散度来约束其特征映射的分布,进而正则化整个下采样的权值。此外,我们采用深度监督训练技术来实现快速拟合。我们提出的方法在BraTS20数据集上对整个肿瘤(WT)、肿瘤核心(TC)和增强肿瘤(ET)的骰子得分分别为0.90、0.80和0.76。实验结果表明,该算法在AD-Net网络下具有良好的性能。

本文方法



这篇文章是基于输入融合的

损失函数



实验结果


max-vit - unet:多轴注意力医学图像分割

摘要

卷积神经网络(cnn)近年来在医学图像分析方面取得了重大进展。然而,卷积算子的局部性质可能会对cnn中捕获全局和远程相互作用造成限制。最近,transformer由于能够有效地处理全局特征而在计算机视觉社区和医学图像分割中得到了广泛的应用。自关注机制的可扩展性问题和缺乏类似cnn的归纳偏差可能限制了它们的采用。因此,利用卷积和自关注机制的优点的混合视觉变压器(CNN-Transformer)变得越来越重要。

在这项工作中,我们提出了maxviti - unet,一种基于编码器-解码器的混合视觉转换器(CNN-Transformer),用于医学图像分割。

所提出的混合解码器,基于maxviti -block,设计利用卷积和自注意机制的力量,在每个解码阶段的计算负担很小。

在每个解码阶段中加入多轴自关注,显著增强了目标和背景区域的区分能力,从而有助于提高分割效率。

在混合解码器块中,融合过程开始于将通过转置卷积获得的上采样低电平解码器特征与从混合编码器获得的跳过连接特征进行整合。

随后,通过利用多轴注意机制对融合的特征进行细化。所提出的解码器块被重复多次以逐步分割核区域。在MoNuSeg18和MoNuSAC20数据集上的实验结果证明了该方法的有效性。我们的maxviti -UNet在两个标准数据集上都比之前基于cnn (UNet)和基于transformer (swan -UNet)的技术有相当大的优势。代码地址

本文方法


实验结果

相关推荐
传说故事4 小时前
【论文阅读】See Once, Then Act:基于单次视频演示任务学习的VLA模型
论文阅读·人工智能·具身智能·vla
Julyers4 小时前
【论文阅读】Line-Mod算法
论文阅读·人工智能
薛定e的猫咪14 天前
【AAAI 2025】基于扩散模型的昂贵多目标贝叶斯优化
论文阅读·人工智能·算法
YMWM_14 天前
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“
论文阅读·vla
m0_6501082414 天前
VLN-Zero:零样本机器人导航的神经符号视觉语言规划框架
论文阅读·零样本·机器人导航·视觉语言导航·未知环境快速适配·符号化场景图·vlm推理
晓山清15 天前
【论文阅读】Self-supervised Learning of Person-specific Facial Dynamics for APR
论文阅读
张较瘦_15 天前
[论文阅读] AI + 教育 | 不是单纯看视频!软件工程培训的游戏化融合之道
论文阅读·人工智能·软件工程
张较瘦_15 天前
[论文阅读] AI + 软件工程 | 用统计置信度破解AI功能正确性评估难题——SCFC方法详解
论文阅读·人工智能·软件工程
Matrix_1116 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(二)
论文阅读·人工智能
万里鹏程转瞬至16 天前
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times
论文阅读·深度学习·aigc