2023华数杯数学建模C题完整5问代码思路分析

目前已经写出2023华数杯C题母亲身心健康对婴儿成长的影响全部5问的完整代码和42页论文(正文30页,论文部分摘要如下:

本文共解决了五个问题,涉及婴儿行为特征、睡眠质量与母亲的身体指标和心理指标的关系,以及如何优化婴儿的行为特征和睡眠质量。

对于问题1,我们对数据进行了预处理,处理婴儿行为特征数据,并将其转换为数值型数据,然后使用皮尔逊相关系数来研究母亲的身体指标和心理指标与婴儿行为特征和睡眠质量之间的关系。

对于问题2,我们将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。为了建立婴儿的行为特征与母亲的身体指标和心理指标的关系模型,我们建立了多种分类模型,如逻辑回归、支持向量机、决策树、随机森林、XGBoost模型等。然后,我们使用这些模型来预测那些行为特征信息被删除的婴儿属于哪种类型,判断数据表中最后20组(编号391-410号)婴儿的行为特征信息。预测结果表明,.......

对于问题3,我们利用提供的数据建立治疗费用与降低分数之间的线性模型,计算了当前行为特征为矛盾型的婴儿(编号238)的最大治疗费用。然后,使用第二问建立的XGBoost分类模型预测该婴儿在不同CBTS、EPDS和HADS得分下的行为特征,从而找到使治疗费用最小的降低得分方案。求解结果为:使行为特征变为中等型的最少治疗费用: ,调整方案:;使行为特征变为安静型的最少治疗费用: ,调整方案:.......。

对于问题4,我们通过基于熵权法的TOPSIS综合评价方法对婴儿的睡眠质量进行分类评价,利用熵权法确定指标权重避免了专家赋权带来的主观性,使用数据标准化和正向化方法构建了评分模型。之后利用评级结果建立回归模型预测综合睡眠质量评级。对于问题5,我们在问题3基础上,调整婴儿的睡眠质量评级为优,并重新预测睡眠质量。求解结果为:使睡眠质量变为4.0(优)的最少治疗费用: ......,调整方案:......

综上所述,本文的研究为了理解母亲与婴儿之间的关系,优化婴儿行为特征和睡眠质量提供了重要的见解和解决方案。

全部5问的代码如下

一、 问题重述... 4

二、 问题分析... 5

2.1 问题一分析... 5

2.2 问题二分析... 6

2.3 问题三分析... 6

2.4 问题四分析... 6

2.5 问题五分析... 6

三、 模型假设... 7

四、 符号说明... 7

五、 模型的建立和求解... 8

5.1 问题一模型的建立和求解... 8

5.1.1 数据预处理... 8

5.1.2 皮尔逊相关系数分析... 8

5.2 问题二模型的建立和求解... 10

5.2.1 逻辑分类模型的建立... 11

5.2.2 支持向量机分类模型的建立... 12

5.2.3 决策树分类模型的建立... 12

5.2.4 随机森林分类模型的建立... 13

5.2.5 XGBoost分类模型的建立... 13

5.2.6 预测结果对比与分析... 14

5.3 问题三模型的建立和求解... 15

5.3.1 治疗费用与分数的线性模型... 15

5.3.2 最小治疗费用优化求解模型... 16

5.3.3 治疗方案求解结果与分析... 18

5.4 问题四模型的建立和求解... 19

5.4.1 基于熵权法的TOPSIS评价模型... 19

5.4.2 数据正向化... 19

5.4.3 数据标准化... 21

5.4.4 熵权法确定权重... 21

5.4.5 评分模型构建... 23

5.4.6 睡眠质量综合评价得分... 24

5.4.7 睡眠质量XGBoost关联模型建立... 24

5.4.8 综合睡眠质量预测结果... 25

5.5 问题五模型的建立和求解... 26

5.5.1 睡眠质量调整治疗方案... 26

5.5.2 问题五治疗策略... 28

六、 模型的评价与推广... 28

七、 参考文献... 30

八、 附录... 31

一、 问题重述

2023华数杯数学建模竞赛C题题目:

母亲是婴儿生命中最重要的人之一,她不仅为婴儿提供营养物质和身体保护,还为婴儿提供情感支持和安全感。母亲心理健康状态的不良状况,如抑郁、焦虑、压力等,可能会对婴儿的认知、情感、社会行为等方面产生负面影响。压力过大的母亲可能会对婴儿的生理和心理发展产生负面影响,例如影响其睡眠等方面。

附件给出了包括390名3 至12 个月婴儿以及其母亲的相关数据。这些数据涵盖各种主题,母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式,以及产妇心理指标CBTS(分娩相关创伤后应激障碍问卷)、EPDS (爱丁堡产后抑郁量表)、HADS(医院焦虑抑郁量表)和婴儿睡眠质量指标包括整晚睡眠时间、睡醒次数和入睡方式。

请查阅相关文献,了解专业背景,根据题目数据建立数学模型,回答下列问题。

  1. 许多研究表明,母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量有影响,请问是否存在这样的规律,根据附件中的数据对此进行研究。

  2. 婴儿行为问卷是一个用于评估婴儿行为特征的量表,其中包含了一些关于婴儿情绪和反应的问题。我们将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。请你建立婴儿的行为特征与母亲的身体指标与心理指标的关系模型。

数据表中最后有20组(编号391-410号)婴儿的行为特征信息被删除,请你判断他们是属于什么类型。

  1. 对母亲焦虑的干预有助于提高母亲的心理健康水平,还可以改善母婴交互质量,促进婴儿的认知、情感和社交发展。CBTS、EPDS、HADS的治疗费用相对于患病程度的变化率均与治疗费用呈正比,经调研,给出了两个分数对应的治疗费用,详见表1。现有一个行为特征为矛盾型的婴儿,编号为238。请你建立模型,分析最少需要花费多少治疗费用,能够使婴儿的行为特征从矛盾型变为中等型?若要使其行为特征变为安静型,治疗方案需要如何调整?

  1. 婴儿的睡眠质量指标包含整晚睡眠时间、睡醒次数、入睡方式。请你对婴儿的睡眠质量进行优、良、中、差四分类综合评判,并建立婴儿综合睡眠质量与母亲的身体指标、心理指标的关联模型,预测最后20组(编号391-410号)婴儿的综合睡眠质量。

  2. 在问题三的基础上,若需要让238号婴儿的睡眠质量评级为优,请问问题三的治疗策略是否需要调整?如何调整?

二、 问题分析

2.1 问题一分析

问题1:分析母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量的影响。这是一个相关性分析问题。首先,对数据进行预处理,包括数据清洗和转换。然后使用皮尔逊相关系数来衡量母亲的身体指标和心理指标与婴儿行为特征和睡眠质量之间的相关性。

方法:皮尔逊相关系数分析

python 复制代码
import numpy as np
from scipy.stats import pearsonr, spearmanr
import statsmodels.api as sm
import seaborn as sns
import matplotlib.pyplot as plt

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 设置负数的符号
plt.rcParams['axes.unicode_minus'] = False

# 建立新的变量,取data的前391行数据
data_analysis = data.head(391)

# 进行皮尔逊相关系数分析
correlation_matrix = data_analysis.corr(method='pearson')
print(correlation_matrix)

# 可视化绘图
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=0.5)
plt.title('Pearson Correlation Heatmap')
plt.show()

2.2 问题二分析

问题2:建立婴儿的行为特征与母亲的身体指标和心理指标的关系模型。这是一个多分类问题。通过建立分类模型,将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。

方法:使用多种分类模型(如决策树、随机森林、XGBoost等)建立模型,然后对婴儿的行为特征进行分类预测。

部分代码如下:

python 复制代码
# 选择母亲的身体指标和心理指标,以及婴儿的行为特征作为数据分析的子集
subset_columns = ['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式', '婴儿行为特征']
data_analysis = data.loc[:, subset_columns]

# 划分训练集和测试集,其中删除的婴儿信息为测试集
train_data = data_analysis.loc[1:390, :]
test_data = data_analysis.loc[391:411, :]

# 将婴儿的行为特征作为目标变量
y_train = train_data['婴儿行为特征']
y_test = test_data['婴儿行为特征']

# 将母亲的身体指标和心理指标作为特征变量
X_train = train_data[['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式']]
X_test = test_data[['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式']]

2.3 问题三分析

问题3:建立模型,分析最少需要花费多少治疗费用,能够使婴儿的行为特征从矛盾型变为中等型;若要使其行为特征变为安静型,治疗方案需要如何调整。

方法:首先需要计算当前行为特征为矛盾型的婴儿(编号238)的最大治疗费用。然后,使用第二问建立的XGBoost分类模型预测该婴儿在不同CBTS、EPDS和HADS得分下的行为特征,从而找到使治疗费用最小的降低得分方案。

2.4 问题四分析

问题4:对婴儿的睡眠质量进行优、良、中、差四分类综合评判,并建立婴儿综合睡眠质量与母亲的身体指标和心理指标的关联模型,预测最后20组婴儿的综合睡眠质量。

方法:使用TOPSIS方法进行综合评判,对婴儿的睡眠质量进行分类。然后建立XGBoost回归模型,将母亲的身体指标和心理指标作为特征,婴儿的综合睡眠质量评级作为目标变量,进行回归分析。

2.5 问题五分析

问题5:在问题3的基础上,调整婴儿的睡眠质量评级为优,然后重新建立模型预测最后20组婴儿的综合睡眠质量。

方法:根据问题3中得到的模型,调整问题3中的睡眠质量评级为优,并重新建立XGBoost回归模型。预测最后20组婴儿的综合睡眠质量评级。

三、 模型假设

四、符号说明

五、 模型的建立和求解

5.1 问题一模型的建立和求解

问题1需要进行数据分析来探究母亲的身体指标和心理指标是否对婴儿的行为特征和睡眠质量有影响。在这种情况下,可以使用统计学和机器学习技术进行相关性和回归分析,以确定指标之间的关系。步骤如下:

  1. 数据预处理:首先,对数据进行清洗和预处理。这可能涉及处理缺失值、转换分类数据为数值数据、标准化数据等步骤。

  2. 相关性分析:使用相关性分析来了解指标之间的相关性。可以通过计算皮尔逊相关系数或斯皮尔曼等级相关系数来衡量变量之间的线性或非线性关系。

  3. 回归分析:如果有足够的数据,可以使用回归分析来建立模型,以预测婴儿行为特征和睡眠质量与母亲身体指标和心理指标之间的关系。可以尝试多元线性回归或其他适合的回归方法。

  4. 统计显著性检验:在回归分析中,需要对模型进行统计显著性检验,以确定模型的预测效果是否显著。

  5. 结果解释:根据分析的结果,解释母亲的身体指标和心理指标对婴儿行为特征和睡眠质量的影响程度。需要注意,相关性并不意味着因果关系,因此需要谨慎解释结果。

5.1.1 数据预处理

我们需要处理婴儿行为特征数据,并将其转换为数值型数据。

5.1.2 皮尔逊相关系数分析

当我们想要了解两个变量之间的相关性时,可以使用皮尔逊相关系数分析。它是一种用于衡量两个连续变量之间线性相关程度的统计方法。简单来说,皮尔逊相关系数可以告诉我们这两个变量是正相关、负相关还是没有相关性。

皮尔逊相关系数的原理基于协方差和标准差的概念。它通过计算两个变量的协方差来衡量它们的共变动程度,再除以各自的标准差,从而得到一个介于-1和1之间的值,表示两个变量之间的相关性。

文档和代码下载方式:

python 复制代码
https://mbd.pub/o/bread/mbd-ZJyXkppx
相关推荐
阿斯卡码1 小时前
jupyter添加、删除、查看内核
ide·python·jupyter
passer__jw7671 小时前
【LeetCode】【算法】3. 无重复字符的最长子串
算法·leetcode
passer__jw7671 小时前
【LeetCode】【算法】21. 合并两个有序链表
算法·leetcode·链表
sweetheart7-71 小时前
LeetCode22. 括号生成(2024冬季每日一题 2)
算法·深度优先·力扣·dfs·左右括号匹配
埃菲尔铁塔_CV算法4 小时前
图像算法之 OCR 识别算法:原理与应用场景
图像处理·python·计算机视觉
封步宇AIGC4 小时前
量化交易系统开发-实时行情自动化交易-3.4.2.Okex行情交易数据
人工智能·python·机器学习·数据挖掘
封步宇AIGC4 小时前
量化交易系统开发-实时行情自动化交易-2.技术栈
人工智能·python·机器学习·数据挖掘
景鹤4 小时前
【算法】递归+回溯+剪枝:78.子集
算法·机器学习·剪枝
_OLi_4 小时前
力扣 LeetCode 704. 二分查找(Day1:数组)
算法·leetcode·职场和发展
丶Darling.4 小时前
Day40 | 动态规划 :完全背包应用 组合总和IV(类比爬楼梯)
c++·算法·动态规划·记忆化搜索·回溯