案例分享|中山三院医学影像报告辅助生成案例分析

背景与目标

在医院的计算机断层扫描(CT)影像科,放射科技师利用先进的医疗成像设备进行患者身体结构扫描,快速生成描述器官尺寸、形态和功能状态的影像学文本。临床医师将根据这些影像学文本,结合患者的临床症状和体征,进行综合分析,生成临床印象诊断。在传统的印象诊断流程中,医师通常依赖于标准化模板,对模板内容进行个性化调整,这一过程通常需要至少花费5分钟的时间。

为了提高临床印象诊断的生成效率,科室期望利用大型预训练语言模型的微调技术,来辅助医师生成初步的诊断意见。通过训练模型学习大量的医学影像文本和临床数据,模型能够提供更加精准和个性化的诊断建议。这些建议将作为医师进行最终审核和修改的基础,从而显著提高诊断流程的整体速度和质量。

该院日常样本分析及处理
数据样本

该科室在日常的临床检查和诊断工作中,积累了丰富的诊断报告资源。报告包含了病人的基本信息、检查信息、检查及诊断结果,为大模型微调的奠定了坚实的数据基础,避免了了数据采集和数据标注的成本。客户首次提供了科室1个月的报告数据,总计超2500条记录。

数据清洗

课题专家讨论,过滤冗余字段,只保留与印象诊断生成相关的辅助信息,如年龄、性别、检查部位、临床诊断等。

数据质量分析

人信息真实、报告内容研究、文本质量高,无缺失值、重复值。

数据拼接

在本次大模型的微调任务中,数据以单轮对话形式存在,因此需要对任务指令、输入和输出格式进行定义。由于实际应用为接口方式,而非人机对话模式,单一指令即可满足需求

样本均衡性

与课题专家共同对样本中不同器官正常样本、不用疾病类型的样本数量展开估算,并对性别、年龄等辅助信息是否全面覆盖展开分析,最后补充样本记录至4000多条

数据划分

·采用随机抽样形式划分整体数据体;

·按照7.5:1.5:1比例划分训练集、验证集合合测试集

针对目前这种情况,进行模型优化,主要有以下几个点

模型部署:试运行阶段,工程师采用VLLM框架对微调后大模型进行部署,并发布流式生成接口,能够支持五个并发(在5台设备上试用)的请求处理。

模型应用:在客户开发的医疗成像设备系统中,诊断报告生成子系统将集成一项创新功能,即"AI诊断"。此功能旨在通过调用本API接口,实现诊断意见自动生成。

持续优化:系统还具备高级的记录和反馈机制,系统将保存修改和审核诊断报告记录,形成后续微调或基于人类的反馈学习的基础数据样本,实现模型持续优化。

针对优化的结果,主要表现在以下几个方面:

在医学影像诊断:通过使用"生成式AI大模型"学习医学影像数据,辅助医生快速识别病变部位,提供初步的诊断建议,在影像诊断方面的准确率超80%,每张影像报告诊断意见生成时间节省一半以上。减轻医生的工作负担,降低漏诊率。

在科研与教学:放射科作为一个重要的医学科研和教学领域,需要大量的数据支持和智能分析。"生成式AI大模型"通过对海量数据进行深度挖掘和分析,为科研人员提供有价值的数据发现,同时也为教学和科研提供丰富的案例和资料。

中山三院感谢信

相关推荐
CNRio2 小时前
空间智能:中国数字基建的新引擎与产业变革的深层逻辑
人工智能·科技
viperrrrrrrrrr72 小时前
Prompt Tuning
人工智能·深度学习·prompt
志凌海纳SmartX3 小时前
AI知识科普丨什么是 MaaS?
人工智能
落798.3 小时前
Bright Data AI Scraper Studio:用Prompt秒建企业级爬虫,让数据采集进入AI时代
人工智能·亮数据
德卡先生的信箱3 小时前
深度学习图像处理(3)----二阶段目标检测
图像处理·深度学习·目标检测
AI_56783 小时前
TensorFlow损失函数的“隐形坑”
大数据·人工智能
七宝大爷3 小时前
CUDA与cuDNN:深度学习加速库
人工智能·深度学习·cuda·cudnn
CoovallyAIHub3 小时前
复杂工业场景如何实现3D实例与部件一体化分割?多视角贝叶斯融合的分层图像引导框架
深度学习·算法·计算机视觉
2401_841495643 小时前
【自然语言处理】单字与双字字频统计算法设计
人工智能·python·算法·自然语言处理·单字·双字·字频统计