5.28.1 使用卷积神经网络检测乳腺癌

深度学习技术正在彻底改变医学图像分析领域,因此在本研究中,我们提出了卷积神经网络 (CNN) 用于乳腺肿块检测,以最大限度地减少手动分析的开销。CNN 架构专为特征提取阶段而设计,并采用了更快的 R-CNN 的**区域提议网络 (RPN)**和感兴趣区域 (ROI) 部分,以实现乳腺肿块异常的自动检测。

模型可检测乳房 X 光检查 (MG) 图像中的肿块区域,并一次性将其分类为良性或恶性异常。对于所提出的模型,MG 图像是从本地的不同医院收集的。图像经过不同的预处理阶段,例如高斯滤波器、中值滤波器、双边滤波器,并从 MG 图像的背景中提取乳房区域。

1. 介绍

微钙化和肿块是乳腺癌的最早迹象,只能使用成像方式检测到。根据乳腺异常的侵袭阶段,异常可能是良性的或恶性的。与检测微钙化相比,检测乳房组织中的肿块更具挑战性。

Organization 等人 (2006) 的研究表明,种族、地理位置和其他风险因素会决定乳腺癌的发展。在这项工作中,我们提出了基于卷积神经网络 (CNN) 的乳腺肿块检测方法,以同时定位肿块并将其分类为良性或恶性异常。为了训练、验证和测试该方法,我们从不同站点收集了数据集。

2. 方法论

2.1 数据集

这项工作仅考虑了收集的 MG 图像中的肿块异常,即 1588 张具有肿块异常的完整乳房 X 射线图像,这些图像由专业放射科医生使用 labelMe Russell et al (2008) 注释工具进行注释。

2.2 方法

开发了基于 CNN 的乳腺肿块异常检测模型,该模型可自动检测肿块异常的感兴趣区域,并将其分类为 MG 图像中的良性或恶性。

对 INbreast Moreira 等人(2012 年)拍摄的 116 张完整 MG 图像和 CBIS-DDSM Lee 等人(2017 年)拍摄的 1380 张完整 MG 图像进行了预处理和增强,以便为训练我们的模型和本地收集的数据集提供初始权重。

2.2.1 数据收集

表 1 中描述的数据集是从埃塞俄比亚的不同医院收集的

2.2.2 MG图像预处理

为了提高数据质量并以适合深度学习训练的方式准备数据,对数据进行了预处理。为了消除图像中的噪声,应用了高斯滤波、中值滤波和双边滤波。随后使用对比度限制自适应直方图均衡化 (CLAHE) 增强图像,然后进行形态学操作和 OTSU 阈值处理,以从背景中提取乳房区域,并从 MG 中去除非乳房区域部分,例如伪影、标签、患者资料等。

2.2.3 模型训练

Bounding box regressor(边框回归器)在计算机视觉和目标检测中用于预测目标物体的边界框(Bounding Box)的位置和大小。其目标是从给定的物体位置(通常是一个初始边界框)开始,通过学习和预测修正值,使得模型能够准确地预测物体的边界框。这些修正值通常是相对于初始边界框的偏移量,包括水平偏移、垂直偏移、宽度缩放和高度缩放。

特征提取部分有一系列五个卷积层,每个卷积层分别有 (64, 128, 256, 512,512) 数量的卷积核。每个卷积层后面都是 Relu 激活层、批量归一化层、最大池化层和 dropout,但第二层除外,它既没有 dropout 也没有最大池化。

通过调整 Faster R-CNN Ren et al (2015) 的 ROI Pooling 部分的锚点边界框尺度、RPN 和最大池化的比率,它被用于检测肿块异常。我们使用了 9 个锚点,锚点框尺度分别为 32 × 32、64 × 64 和 128 × 128 像素,锚点框宽高比为 [1, 1]、[, ] 和 [, ],ROI 最大池化大小为 (5,5)。

使用 0.9 动量、500 个 epoch、0.00001 学习率、RPN 的 Adam 和整个模型的随机梯度下降 (SGD) 作为优化器。所提出的模型是使用 Python 和 Keras 实现的,其中 Tensorflow 用作后端。

3. 结果与讨论

描述了一种基于 CNN 的方法,用于检测肿块区域并将其分为良性和恶性。研究了在本地多中心 MG 数据集中一次性检测、定位肿块异常并将其分类为良性或恶性。很难将我们的检测结果与以前的本地研究直接进行比较。因此,我们对基于 VGG 的更快 R-CNN Ren et al (2015) 架构进行了训练、验证和测试,以便使用收集到的数据集与我们模型的性能进行比较。在收集到的所有图像中,选择了 1588 张包含肿块异常的完整 MG 图像,然后由专业放射科医生使用 labelMeRussell et al (2008) 注释工具对其进行注释。在 1588 张 MG 图像中,有 1683 个乳腺肿块异常。数据集被随机分成 80% 用于训练、10% 用于验证和 10% 用于测试。

对 INbreast Moreira 等人(2012 年)、CBIS-DDIS Lee 等人(2017 年)执行了相同的流水线预处理,并为所提出的模型和基于 VGG 的Faster R-CNN 收集了本地 MG 数据集。

在预处理阶段:将不同的成像格式(例如 DICOM 医学图像格式)转换为 .png 图像格式,去除噪音,从背景中提取乳房区域,删除患者信息,清除伪影和其他不需要的物体。分别使用 3×3 和 5×5 大小的高斯、中等和横向滤波器进行降噪,并使用 MSE 评估去噪结果。在考虑的两种卷积核尺寸中,最终使用了 3×3 大小的卷积核。此外,使用 CLAHE 增强去噪后的 MG 图像,然后提取乳房区域并使用 OTSU 和形态学操作去除不需要的伪影。

相关推荐
golang学习记13 分钟前
免费解锁 Cursor AI 全功能:4 种开发者私藏方案揭秘
人工智能
图扑软件21 分钟前
热力图可视化为何被广泛应用?| 图扑数字孪生
大数据·人工智能·信息可视化·数字孪生·可视化·热力图·电力能源
qq_4369621823 分钟前
AI驱动数据分析革新:奥威BI一键生成智能报告
人工智能·信息可视化·数据分析
卓码软件测评33 分钟前
借助大语言模型实现高效测试迁移:Airbnb的大规模实践
开发语言·前端·javascript·人工智能·语言模型·自然语言处理
小白狮ww35 分钟前
dots.ocr 基于 1.7B 参数实现多语言文档处理,性能达 SOTA
人工智能·深度学习·机器学习·自然语言处理·ocr·小红书·文档处理
hrrrrb36 分钟前
【机器学习】无监督学习
人工智能·学习·机器学习
IT_陈寒39 分钟前
SpringBoot 3.0实战:这套配置让我轻松扛住百万并发,性能提升300%
前端·人工智能·后端
阿烦大大@1 小时前
探索Perplexity:当AI遇上搜索引擎的革命性突破
人工智能·搜索引擎
chenchihwen8 小时前
AI代码开发宝库系列:Function Call
人工智能·python·1024程序员节·dashscope
FreeBuf_8 小时前
微软Copilot被用于窃取OAuth令牌,AI Agent成为攻击者帮凶
人工智能·microsoft·copilot