5.28.1 使用卷积神经网络检测乳腺癌

深度学习技术正在彻底改变医学图像分析领域,因此在本研究中,我们提出了卷积神经网络 (CNN) 用于乳腺肿块检测,以最大限度地减少手动分析的开销。CNN 架构专为特征提取阶段而设计,并采用了更快的 R-CNN 的**区域提议网络 (RPN)**和感兴趣区域 (ROI) 部分,以实现乳腺肿块异常的自动检测。

模型可检测乳房 X 光检查 (MG) 图像中的肿块区域,并一次性将其分类为良性或恶性异常。对于所提出的模型,MG 图像是从本地的不同医院收集的。图像经过不同的预处理阶段,例如高斯滤波器、中值滤波器、双边滤波器,并从 MG 图像的背景中提取乳房区域。

1. 介绍

微钙化和肿块是乳腺癌的最早迹象,只能使用成像方式检测到。根据乳腺异常的侵袭阶段,异常可能是良性的或恶性的。与检测微钙化相比,检测乳房组织中的肿块更具挑战性。

Organization 等人 (2006) 的研究表明,种族、地理位置和其他风险因素会决定乳腺癌的发展。在这项工作中,我们提出了基于卷积神经网络 (CNN) 的乳腺肿块检测方法,以同时定位肿块并将其分类为良性或恶性异常。为了训练、验证和测试该方法,我们从不同站点收集了数据集。

2. 方法论

2.1 数据集

这项工作仅考虑了收集的 MG 图像中的肿块异常,即 1588 张具有肿块异常的完整乳房 X 射线图像,这些图像由专业放射科医生使用 labelMe Russell et al (2008) 注释工具进行注释。

2.2 方法

开发了基于 CNN 的乳腺肿块异常检测模型,该模型可自动检测肿块异常的感兴趣区域,并将其分类为 MG 图像中的良性或恶性。

对 INbreast Moreira 等人(2012 年)拍摄的 116 张完整 MG 图像和 CBIS-DDSM Lee 等人(2017 年)拍摄的 1380 张完整 MG 图像进行了预处理和增强,以便为训练我们的模型和本地收集的数据集提供初始权重。

2.2.1 数据收集

表 1 中描述的数据集是从埃塞俄比亚的不同医院收集的

2.2.2 MG图像预处理

为了提高数据质量并以适合深度学习训练的方式准备数据,对数据进行了预处理。为了消除图像中的噪声,应用了高斯滤波、中值滤波和双边滤波。随后使用对比度限制自适应直方图均衡化 (CLAHE) 增强图像,然后进行形态学操作和 OTSU 阈值处理,以从背景中提取乳房区域,并从 MG 中去除非乳房区域部分,例如伪影、标签、患者资料等。

2.2.3 模型训练

Bounding box regressor(边框回归器)在计算机视觉和目标检测中用于预测目标物体的边界框(Bounding Box)的位置和大小。其目标是从给定的物体位置(通常是一个初始边界框)开始,通过学习和预测修正值,使得模型能够准确地预测物体的边界框。这些修正值通常是相对于初始边界框的偏移量,包括水平偏移、垂直偏移、宽度缩放和高度缩放。

特征提取部分有一系列五个卷积层,每个卷积层分别有 (64, 128, 256, 512,512) 数量的卷积核。每个卷积层后面都是 Relu 激活层、批量归一化层、最大池化层和 dropout,但第二层除外,它既没有 dropout 也没有最大池化。

通过调整 Faster R-CNN Ren et al (2015) 的 ROI Pooling 部分的锚点边界框尺度、RPN 和最大池化的比率,它被用于检测肿块异常。我们使用了 9 个锚点,锚点框尺度分别为 32 × 32、64 × 64 和 128 × 128 像素,锚点框宽高比为 [1, 1]、[, ] 和 [, ],ROI 最大池化大小为 (5,5)。

使用 0.9 动量、500 个 epoch、0.00001 学习率、RPN 的 Adam 和整个模型的随机梯度下降 (SGD) 作为优化器。所提出的模型是使用 Python 和 Keras 实现的,其中 Tensorflow 用作后端。

3. 结果与讨论

描述了一种基于 CNN 的方法,用于检测肿块区域并将其分为良性和恶性。研究了在本地多中心 MG 数据集中一次性检测、定位肿块异常并将其分类为良性或恶性。很难将我们的检测结果与以前的本地研究直接进行比较。因此,我们对基于 VGG 的更快 R-CNN Ren et al (2015) 架构进行了训练、验证和测试,以便使用收集到的数据集与我们模型的性能进行比较。在收集到的所有图像中,选择了 1588 张包含肿块异常的完整 MG 图像,然后由专业放射科医生使用 labelMeRussell et al (2008) 注释工具对其进行注释。在 1588 张 MG 图像中,有 1683 个乳腺肿块异常。数据集被随机分成 80% 用于训练、10% 用于验证和 10% 用于测试。

对 INbreast Moreira 等人(2012 年)、CBIS-DDIS Lee 等人(2017 年)执行了相同的流水线预处理,并为所提出的模型和基于 VGG 的Faster R-CNN 收集了本地 MG 数据集。

在预处理阶段:将不同的成像格式(例如 DICOM 医学图像格式)转换为 .png 图像格式,去除噪音,从背景中提取乳房区域,删除患者信息,清除伪影和其他不需要的物体。分别使用 3×3 和 5×5 大小的高斯、中等和横向滤波器进行降噪,并使用 MSE 评估去噪结果。在考虑的两种卷积核尺寸中,最终使用了 3×3 大小的卷积核。此外,使用 CLAHE 增强去噪后的 MG 图像,然后提取乳房区域并使用 OTSU 和形态学操作去除不需要的伪影。

相关推荐
Alluxio27 分钟前
选择Alluxio来解决AI模型训练场景数据访问的五大理由
大数据·人工智能·分布式·ai·语言模型
AIPaPerPass写论文34 分钟前
写论文去哪个网站?2024最佳五款AI毕业论文学术网站
人工智能·深度学习·chatgpt·powerpoint·ai写作
唯创知音35 分钟前
电子烟智能化创新体验:WTK6900P语音交互芯片方案,融合频谱计算、精准语音识别与流畅音频播报
人工智能·单片机·物联网·音视频·智能家居·语音识别
5pace1 小时前
PyTorch深度学习快速入门教程【土堆】基础知识篇
人工智能·pytorch·深度学习
aWty_1 小时前
机器学习--卷积神经网络(包括python实现)
人工智能·机器学习·cnn
wx7408513261 小时前
小琳AI课堂:大语言模型如何符合伦理限制
人工智能·语言模型·自然语言处理
5pace2 小时前
机器学习(西瓜书)第 14 章 概率图模型
人工智能·机器学习
Linux猿2 小时前
828华为云征文 | 云服务器Flexus X实例:部署 AgentOps,全方位监测智能体
人工智能·华为云·agent·autogen·flexus云服务器x实例·华为云服务器·agentops
Rense12 小时前
开源RK3588 AI Module7,并与Jetson Nano生态兼容的低功耗AI模块
人工智能·开源
FL16238631292 小时前
[数据集][目标检测]不同颜色的安全帽检测数据集VOC+YOLO格式7574张5类别
人工智能·yolo·目标检测