2023华为杯研究生数学建模竞赛E题思路分析+代码+论文

如下为C君撰写的2023华为杯研究生数学建模竞赛E题思路分析,代码论文见文末。

E题思路 出血性脑卒中临床智能诊疗建模

一、 背景介绍

出血性脑卒中指非外伤性脑实质内血管破裂引起的脑出血,占全部脑卒中发病率的10-15%。其病因复杂,通常因脑动脉瘤破裂、脑动脉异常等因素,导致血液从破裂的血管涌入脑组织,从而造成脑部机械性损伤,并引发一系列复杂的生理病理反应。出血性脑卒中起病急、进展快,预后较差,急性期内病死率高达45-50%,约80%的患者会遗留较严重的神经功能障碍,为社会及患者家庭带来沉重的健康和经济负担。因此,发掘出血性脑卒中的发病风险,整合影像学特征、患者临床信息及临床诊疗方案,精准预测患者预后,并据此优化临床决策具有重要的临床意义。

**背景分析:**第一段就是在说题目需要解决什么问题。发掘发病风险可能需要我们去建立数学建模来判断,整合特征可能需要用到特征工程的相关算法,而预测患者预后,可能需要使用机器学习算法对数据进行预测。

出血性脑卒中后,血肿范围扩大是预后不良的重要危险因素之一。在出血发生后的短时间内,血肿范围可能因脑组织受损、炎症反应等因素逐渐扩大,导致颅内压迅速增加,从而引发神经功能进一步恶化,甚至危及患者生命。因此,监测和控制血肿的扩张是临床关注的重点之一。 此外,血肿周围的水肿作为脑出血后继发性损伤的标志,在近年来引起了临床广泛关注。血肿周围的水肿可能导致脑组织受压,进而影响神经元功能,使脑组织进一步受损,进而加重患者神经功能损伤。综上所述,针对出血性脑卒中后的两个重要关键事件,即血肿扩张和血肿周围水肿的发生及发展,进行早期识别和预测对于改善患者预后、提升其生活质量具有重要意义。

**背景分析:**这一段很明显,最后一句话是重点,也就是血肿扩张和血肿周围水肿的发生及发展,进行早期识别和预测对于改善患者预后、提升其生活质量具有重要意义。他告诉我们,在进行识别和预测时,我们需要对扩张和水肿分别建立相应的数学建模,量化这两者的严重程度,然后做一个综合模型,将两者融合在一起,这一步也就是模型融合的过程。综合后的模型,就可以做早期识别和预测了。

医学影像技术的飞速进步,为无创动态监测出血性脑卒中后脑组织损伤和演变提供了有力手段。近年来,迅速发展并广泛应用于医学领域的人工智能技术,为海量影像数据的深度挖掘和智能分析带来了全新机遇。期望能够基于本赛题提供的影像信息,联合患者个人信息、治疗方案和预后等数据,构建智能诊疗模型 ,**明确导致出血性脑卒中预后不良的危险因素,实现精准个性化的疗效评估和预后预测。**相信在不久的将来,相关研究成果及科学依据将能够进一步应用于临床实践,为改善出血性脑卒中患者预后作出贡献。

**背景分析:**这一段就点明了我们需要做的事情,根据影像信息,联合患者个人信息、治疗方案和预后等数据,构建智能诊疗模型,明确导致出血性脑卒中预后不良的危险因素,实现精准个性化的疗效评估和预后预测。下面来看题目吧

左图脑出血患者CT平扫,右图红色为血肿,黄色为血肿周围水肿

一、 数据集介绍及建模目标

赛题提供了160例(100例训练数据集+60例独立测试数据集)出血性脑卒中患者的个人史、疾病史、发病及治疗相关信息、多次重复的影像学检查(CT平扫)结果及患者预后评估,该部分信息可在"表1-患者列表及临床信息" 中查询。如图1为脑出血患者CT平扫,红色为血肿区域,黄色为水肿区域。赛题提供影像学检查数据,包括各个时间点血肿/水肿的体积、位置、形状特征及灰度分布等信息。体积及位置信息可在"表2-患者影像信息血肿及水肿的体积及位置" 中查询。形状及灰度分布信息可在"**表3-患者影像信息血肿及水肿的形状及灰度分布"**中查询。

赛题目标:通过对真实临床数据的分析,研究出血性脑卒中患者血肿扩张风险、血肿周围水肿发生及演进规律,最终结合临床和影像信息,预测出血性脑卒中患者的临床预后。

目标变量:

Ø 发病48小时内是否发生血肿扩张:1是;0否。

Ø 发病后90天 mRS:0-6,有序等级变量。其中mRS是评估卒中后患者功能状态的重要工具,详见附件2相关概念。

临床信息:相关信息在"表1-患者列表及临床信息"中获取。

Ø ID:患者ID。

n 训练数据集:sub001至sub100,共计100例。包含:患者信息、首次及所有随访影像数据及90天mRS。

n 测试数据集1:sub101至sub130,共计30例。包含:患者信息、首次影像数据。不包含:随访影像数据及90天mRS。

n 测试数据集2:sub131至sub160,共计30例。包含:患者信息、首次及所有随访影像数据。不包含:90天mRS。

Ø 入院首次影像检查流水号:一个14位数字编码。前8位代表年月日,后6位为顺序编号(注意:++不是时分秒++ )。流水号是影像检查的唯一编码,具体影像检查时间点可通过对应流水号在"++附表1-检索表格-流水号vs时间"++中检索。

Ø 年龄: 岁

Ø 性别:男/女

Ø 脑出血前mRS评分:0-6,有序等级变量

Ø 高血压病史:1是0否

Ø 卒中病史:1是0否

Ø 糖尿病史:1是0否

Ø 房颤史:1是0否

Ø 冠心病史:1是0否

Ø 吸烟史:1是0否

Ø 饮酒史:1是0否

发病相关特征,共计2字段。

Ø 血压:收缩压/舒张压。单位: 毫米汞柱

Ø 发病到首次影像检查时间间隔:单位:小时

治疗相关特征,共计7字段。

Ø 脑室引流:1是0否

Ø 止血治疗:1是0否

Ø 降颅压治疗:1是0否

Ø 降压治疗:1是0否

Ø 镇静、镇痛治疗:1是0否

Ø 止吐护胃:1是0否

Ø 营养神经:1是0否

影像相关特征,共计84字段/时间点。

Ø 血肿及水肿的体积和位置信息在"表2-患者影像信息血肿及水肿的体积及位置" 中获取,包含了:每个时间点血肿(Hemo)总体积及水肿(ED)总体积及不同位置的占比。体积占比定义:血肿/水肿在该位置的体积占总体积大小的比例,取值范围为:0-1。如:0代表该区域没有发生血肿/水肿,1则代表该患者所有血肿/水肿均发生在该区域,可通过占比换算出该位置绝对体积。本赛题采用通用模板,区分左右侧大脑前动脉(ACA_L, ACA_R),左右侧大脑中动脉(MCA_L,MCA_R),左右侧大脑后动脉(PCA_L,PCA_R),左右侧脑桥/延髓(Pons_Medulla_L,Pons_Medulla_R),左右侧小脑(Cerebellum_L,Cerebellum_R)共十个不同位置,具体位置和参考文献见附件2-相关概念。综上,总体积:2个字段(单位:10-3ml),位置:20个字段。在每个时间点,体积及位置特征共计22个字段。

Ø 血肿及水肿的形状及灰度分布在"**表3-患者影像信息血肿及水肿的形状及灰度分布"**的两个不同标签页存放,可通过流水号检索对应数据。每个时间点血肿及水肿的形状及灰度特征,反映目标区域内体素信号强度的分布(17个字段)及三维形状的描述(14个字段),因此,在每个时间点,血肿及水肿的形状+灰度分布特征共62字段。

注:重复影像数据根据临床真实情况提供,重复时间个体间可能存在差异。

三、请建模回答如下问题

1 血肿扩张风险相关因素探索建模。

a) 请根据"表1"(字段:入院首次影像检查流水号,发病到首次影像检查时间间隔),"表2"(字段:各时间点流水号及对应的HM_volume),判断患者sub001至sub100发病后48小时内是否发生血肿扩张事件。

++结果填写规范++:1是0否,填写位置:"表4"C字段(是否发生血肿扩张)。

如发生血肿扩张事件,请同时记录血肿扩张发生时间。

++结果填写规范++:如10.33小时,填写位置:"表4"D字段(血肿扩张时间)。

l 是否发生血肿扩张可根据血肿体积前后变化,具体定义为:后续检查比首次检查绝对体积增加≥6 mL或相对体积增加≥33%。

注:可通过流水号至"附表1-检索表格-流水号vs时间"中查询相应影像检查时间点,结合发病到首次影像时间间隔和后续影像检查时间间隔,判断当前影像检查是否在发病48小时内。

问题一a分析:问题需要根据表1表2来判断100名患者发病后48小时内是否发生血肿扩张事件,这道题目相对而言很简单。首先需要对两个表进行数据清洗操作,也就是数据预处理,清理完异常数据后。就可以进行预测了,我这里推荐利用一些机器学习算法进行预测,比如:Xgboost、随机森林、SVM等算法。是否出现血肿扩张是有明确说明的,题目说到要结合发病到首次影像时间间隔和后续影像检查时间间隔,所以这些需要纳入到指标当中。这里要注意做的是分类模型,那么最后需要指定一个阈值,比如你的预测结果是0.7(这里要是0-1间的),那么,你可以选择0.65作为阈值,超过的则判断为1,也就是发生了血肿扩张事件,这也有利于做下一小问。

最后需要对模型进行评估,评估准确率这些,这里可以画ROC曲线等,来可视化你模型的准确率。

这里给大家提示一下第一问一开始特征工程该如何做吧,有以下几步:

1 数据清洗:这是最基础的一步,它包括处理丢失值、异常值和错误的数据。

2 特征编码:将分类数据转换为适合模型使用的格式。例如,对于线性回归模型,需要将类别变量进行独热编码(One-Hot Encoding)。

3 特征缩放:这包括标准化和归一化等操作,可以保证不同规模或单位的特征在模型训练时具有相同的影响力。

4 特征选择:对于高维数据,我们需要选择最有意义的子集。常用的方法有过滤法(Filter Method)、包装法(Wrapper Method)和嵌入法(Embedded Method)。

5 特征构造:这涉及到创造新的特征,例如,根据已存在的特征进行数学运算(如加、减、乘、除等)生成新特征,或者基于领域知识创造特征。

6 降维:当特征维度非常大的时候,我们可能需要降低数据的维度。常用的降维技术有主成分分析(PCA)和t-分布随机邻域嵌入(t-SNE)等。

b请以是否发生血肿扩张事件为目标变量,基于"表1" 前100例患者(sub001至sub100)的个人史,疾病史,发病相关(字段E至W)、"表2"中其影像检查结果(字段C至X)及"表3"其影像检查结果(字段C至AG,注:只可包含对应患者首次影像检查记录)等变量,构建模型预测所有患者(sub001至sub160)发生血肿扩张的概率。

注:该问只可纳入患者首次影像检查信息。

++结果填写规范++:记录预测事件发生概率(取值范围0-1,小数点后保留4位数);填写位置:"表4"E字段(血肿扩张预测概率)。

问题一b分析:这道题目很简单,a已经建立了分类模型,也就是它做的分类是是否发生,在上一题用机器学习算法做分类模型的时候,比如你机器学习算法做出来的数是0.7,你在分类时,0.7归为了发生血肿扩张事件,前面告诉大家要选择合适的阈值,比如是0.6。那么这里计算概率的式子就是等比例缩放,0.5+0.5*(0.7-0.6)/1-0.6 = 0.5 + 0.125 = 0.625,也就是62.5%的概率。

2 血肿周围水肿的发生及进展建模,并探索治疗干预和水肿进展的关联关系。

a) 请根据"表2"前100个患者(sub001至sub100)的水肿体积(ED_volume)和重复检查时间点,构建一条全体患者水肿体积随时间进展曲线(x轴:发病至影像检查时间,y轴:水肿体积,y=f(x)),计算前100个患者(sub001至sub100)真实值和所拟合曲线之间存在的残差。

++结果填写规范++:记录残差,填写位置"表4"F字段(残差(全体))。

b) 请探索患者水肿体积随时间进展模式的个体差异,构建不同人群(分亚组:3-5个)的水肿体积随时间进展曲线,并计算前100个患者(sub001至sub100)真实值和曲线间的残差。

++结果填写规范++:记录残差,填写位置"表4"G字段(残差(亚组)),同时将所属亚组填写在H段(所属亚组)。

c) 请分析不同治疗方法("表1"字段Q至W)对水肿体积进展模式的影响。

d) 请分析血肿体积、水肿体积及治疗方法("表1"字段Q至W)三者之间的关系。

2-3问思路、代码、论文见文末

3 出血性脑卒中患者预后预测及关键因素探索。

a) 请根据前100个患者(sub001至sub100)个人史、疾病史、发病相关("表1"字段E至W)及首次影像结果(表2,表3中相关字段)构建预测模型,预测患者(sub001至sub160)90天mRS评分。

注:该问只可纳入患者首次影像检查信息。

++结果填写规范++:记录预测mRS结果,0-6,有序等级变量。填写位置"表4"I字段(预测mRS(基于首次影像))。

b) 根据前100个患者(sub001至sub100)所有已知临床、治疗(表1字段E到W)、表2及表3的影像(首次+随访)结果,预测所有含随访影像检查的患者(sub001至sub100,sub131至sub160)90天mRS评分。

++结果填写规范++:记录预测mRS结果,0-6,有序等级变量。填写位置"表4"J字段(预测mRS)。

c) 请分析出血性脑卒中患者的预后(90天mRS)和个人史、疾病史、治疗方法及影像特征(包括血肿/水肿体积、血肿/水肿位置、信号强度特征、形状特征)等关联关系,为临床相关决策提出建议。

四、附件

ü 表1-患者列表及临床信息.xlsx

ü 表2-患者影像信息血肿及水肿的体积及位置.xlsx

ü 表3-患者影像信息血肿及水肿的形状及灰度分布.xlsx

ü 表4-答案文件.xlsx

ü 附表1-检索表格-流水号vs时间.xlsx

ü 附件2-相关概念.docx

其中各题目思路、代码、讲解视频、论文及其他相关内容,可以点击下方卡片扫描二维码哦

相关推荐
桃子酱紫君1 小时前
华为配置篇-RSTP/MSTP实验
开发语言·华为·php
陈苏同学4 小时前
MPC控制器从入门到进阶(小车动态避障变道仿真 - Python)
人工智能·python·机器学习·数学建模·机器人·自动驾驶
C灿灿数模4 小时前
2025数维杯数学建模B题完整限量论文:马拉松经济的高质量发展思路探索
数学建模
雪芽蓝域zzs4 小时前
鸿蒙Next开发 获取APP缓存大小和清除缓存
缓存·华为·harmonyos
Robot2518 小时前
「华为」人形机器人赛道投资首秀!
大数据·人工智能·科技·microsoft·华为·机器人
鸿蒙布道师8 小时前
鸿蒙NEXT开发动画案例5
android·ios·华为·harmonyos·鸿蒙系统·arkui·huawei
小诸葛的博客16 小时前
华为ensp实现跨vlan通信
网络·华为·智能路由器
python算法(魔法师版)1 天前
.NET 在鸿蒙系统上的适配现状
华为od·华为·华为云·.net·wpf·harmonyos
枫叶丹41 天前
【HarmonyOS Next之旅】DevEco Studio使用指南(二十二)
华为·harmonyos·deveco studio·harmonyos next
人大博士的交易之路1 天前
今日行情明日机会——20250512
大数据·数学建模·数据挖掘·缠论·缠中说禅·涨停回马枪