TPAMI | Revisiting Computer-Aided Tuberculosis Diagnosis

尽管2020年全球爆发了COVID-19,但结核病(TB)仍然影响着1000万人,并每年导致140万人死亡,成为仅次于COVID-19的第二大致命传染病。TB主要影响呼吸系统,由结核分枝杆菌引起,通过打喷嚏、严重的咳嗽或其他传播传染性细菌的方式传播。因此,TB通常通过呼吸道在肺部发生。免疫力低下的个体,包括那些患有HIV和在发展中国家营养不良的人,加剧了这一问题。

在没有适当治疗的情况下,TB患者的死亡率仍然极高。然而,TB的早期诊断可以显著提高恢复率,通过给予相应的抗生素治疗。由于TB传播迅速,早期诊断在控制感染传播中也起着关键作用。多药耐药TB的出现强调了及时准确诊断方法的紧迫需求,以监控临床治疗的进展。然而,TB诊断仍然是一个重大挑战。具体来说,TB诊断的黄金标准包括对痰液样本和细菌培养的显微镜检查,以识别结核分枝杆菌。为确保检查过程的安全,培养结核分枝杆菌需要生物安全级别-3(BSL-3)实验室。这个程序通常需要几个月的时间。此外,许多发展中国家和资源受限社区的医院缺乏建立BSL-3设施的必要基础设施。

另一方面,X光成像是目前医学影像检查中最普遍和数据密集的筛查方法。胸部X光(CXR)能迅速检测出由肺结核引起的肺部异常,使其成为TB筛查的广泛使用工具。世界卫生组织也推荐CXR作为TB筛查的初始步骤。通过CXR进行早期诊断显著有助于早期发现TB、治疗和预防疾病的传播。然而,即使是经验丰富的放射科医生也可能无法在CXR图像中识别TB感染,因为人眼难以辨识CXR图像中的TB区域,这是由于其对许多细节的敏感度有限。我们的人类研究表明,与黄金标准相比,顶级医院的经验丰富的放射科医生的准确率仅为68.7%。

由于深度学习在各个领域,如人脸识别、图像分类、物体识别等的杰出表示学习能力,深度学习已经超越了人类。

在边缘检测、物体检测以及医学影像分析等领域,深度学习已经展现了其卓越的性能。因此,可以合理预期将深度学习的强大潜力应用于使用胸部X光片(CXR)进行的结核病(TB)诊断。深度学习可以自动定位确切的TB感染部位,全天候工作,不像人类会感到疲劳。然而,深度学习依赖于大量的训练数据,现有的TB数据集无法提供,如表I所示。由于收集大规模TB CXR数据的高成本和隐私考虑,现有的TB数据集只有几百张CXR图像。公开可用的CXR数据的稀缺限制了深度学习在改善计算机辅助结核病诊断(CTD)性能方面的成功应用。

为了在全球范围内部署CTD系统以协助TB患者,首先需要解决数据不足的问题。在本文中,我们通过与主要医院的长期合作,为社区贡献了一个大规模的结核病X光(TBX11K)数据集。这个新的TBX11K数据集在几个方面超越了以前的CTD数据集:i) 与之前只包含几十或几百张CXR图像的公共数据集不同,TBX11K包含11,200张CXR图像,约比现有最大的数据集,即深圳数据集大17倍,使得训练深度网络成为可能;ii) 与先前数据集中的图像级标注不同,TBX11K采用了TB感染区域的边界框标注,允许未来的CTD方法识别TB表现并检测TB区域,以协助放射科医生进行明确诊断;iii) TBX11K包含四个类别:健康、生病但非TB、活动性TB和潜在性TB,与先前数据集的二元分类(即TB或非TB)相对,使得未来的CTD系统能够适应更复杂的现实世界场景,并为人们提供更详细的疾病分析。TBX11K数据集中的每张CXR图像都使用TB诊断的黄金标准(即诊断微生物学)进行测试,并由主要医院的经验丰富的放射科医生标注。TBX11K数据集已由数据提供者去标识,并由相关机构免除,使其能够公开可用,以促进未来的CTD研究。

基于我们的TBX11K数据集,我们提出了一个简单而有效的CTD框架,称为SymFormer。受CXR图像中固有的双边对称性属性的启发,SymFormer利用这一属性来增强CXR图像的解释。双边对称性属性指的是胸部左右两侧的相似性或相同外观,表示一种对称模式。这一属性在改进CXR图像的解释中非常有价值。例如,如果胸部的一侧存在肿块或固体,而另一侧则没有,这可能表明那个区域存在问题。为了解决这一属性,SymFormer加入了新颖的对称搜索注意力(SymAttention),用于从CXR图像中学习具有区分性的特征。

我们建立了一个大规模的计算机辅助结核病诊断(CTD)数据集,TBX11K,它比以往的TB数据集更大、标注更好、更贴近现实,使得深度神经网络能够同时进行多类别的胸部X光图像(CXR)分类和TB感染区域检测,而不仅仅是以往TB数据集中的二元CXR分类。

我们提出了一种简单而有效的CTD框架,称为SymFormer,它包含了新颖的对称搜索注意力(SymAttention)和对称位置编码(SPE),以利用CXR图像的双边对称性属性,显著改善CTD性能,超越基线模型。

我们在TBX11K数据集上构建了一个CTD基准,通过引入评估指标,评估从现有物体检测器改进而来的几个基线模型,并举办在线挑战赛,这预期为未来的研究设定了一个良好的开端。

方法

相关推荐
jndingxin40 分钟前
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector
人工智能·opencv·算法
秋说1 小时前
【PTA数据结构 | C语言版】阶乘的递归实现
c语言·数据结构·算法
小指纹1 小时前
巧用Bitset!优化dp
数据结构·c++·算法·代理模式·dp·bitset
爱Java&Java爱我3 小时前
数组:从键盘上输入10个数,合法值为1、2或3,不是这三个数则为非法数字,试编辑统计每个整数和非法数字的个数
java·开发语言·算法
是店小二呀4 小时前
【算法-BFS 解决最短路问题】探索BFS在图论中的应用:最短路径问题的高效解法
算法·图论·宽度优先
qq_513970444 小时前
力扣 hot100 Day46
算法·leetcode
满分观察网友z5 小时前
递归与迭代的优雅之舞:我在评论区功能中悟出的“树”之道(104. 二叉树的最大深度)
后端·算法
m0_535064605 小时前
类模版的相关案例
算法
Chirp5 小时前
手撕ultralytics,换用Lightning训练yolo模型
算法
2301_801821716 小时前
机器学习-线性回归模型和梯度算法
python·算法·线性回归