【2025年认证杯数学中国数学建模网络挑战赛】C题 数据预处理与问题一二求解

目录

【2025年认证杯数学建模挑战赛】C题

数据预处理与问题一求解

三、数据预处理及分析

3.1 数据可视化

首先对题目所给数据进行可视化,如下图所示:

  • 图1 多参数可视化图

由上图可知,数据并无明显的异常值。且输入气体2和气体4的数据分布一致性较高,气体1和气体3的数据分布一致性较高。对这两组数据进一步进行进一步的耦合分析。

3.2 滑动窗口相关系数统计与动态置信区间耦合分析模型

本文基于滑动窗口相关系数统计与动态置信区间估计结合分析两组气体的耦合关系。通过局部时域特征提取和统计推断,分析气体浓度序列间关联性的时变规律及突变特征。

首先,对于给定的两列气体浓度时间序列和 X ( t ) = { x 1 , x 2 , ... , x N } X(t) = \{x_1, x_2, \ldots, x_N\} X(t)={x1,x2,...,xN},滑动窗口算法将其划分为若干重叠的子序列段。设窗口宽度为w,滑动步长为s,则第个窗口k对应的子序列为:
W k ( X ) = { x k , x k + 1 , ... , x k + w − 1 } W k ( Y ) = { y k , y k + 1 , ... , y k + w − 1 } \begin{aligned} W_k(X) &= \{x_k, x_{k+1}, \ldots, x_{k+w-1}\} \\ W_k(Y) &= \{y_k, y_{k+1}, \ldots, y_{k+w-1}\} \end{aligned} Wk(X)Wk(Y)={xk,xk+1,...,xk+w−1}={yk,yk+1,...,yk+w−1}

其中 k k k的取值为 1 , s + 1 , 2 s + 1 , ... , N − w + 1 1, s+1, 2s+1, \ldots, N-w+1 1,s+1,2s+1,...,N−w+1,确保窗口在时间轴上连续覆盖。窗口中心点时间 t k t_k tk取窗口中间位置的时间戳,即 t k = k + ⌊ w 2 ⌋ t_k = k + \left\lfloor\frac{w}{2}\right\rfloor tk=k+⌊2w⌋,以反映窗口内数据的代表性时刻。

在每个窗口内,采用Pearson相关系数量化气体浓度间的线性关联强度。对于第 k k k个窗口,相关系数 ρ k \rho_k ρk的计算公式为:
ρ k = ∑ i = k k + w − 1 ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = k k + w − 1 ( x i − x ˉ ) 2 ∑ i = k k + w − 1 ( y i − y ˉ ) 2 \rho_k = \frac{\sum_{i=k}^{k+w-1}(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=k}^{k+w-1}(x_i - \bar{x})^2 \sum_{i=k}^{k+w-1}(y_i - \bar{y})^2}} ρk=∑i=kk+w−1(xi−xˉ)2∑i=kk+w−1(yi−yˉ)2 ∑i=kk+w−1(xi−xˉ)(yi−yˉ)

其中 x ‾ k \overline{x}_k xk和 y ‾ k \overline{y}_k yk分别为窗口内 X X X和 Y Y Y的值。 ρ k \rho_k ρk的取值范围为 [ − 1 , 1 ] [-1,1] [−1,1],其绝对值越大表明窗口内两气体的浓度变化趋势越一致。

为评估相关系数的统计显著性,引入t检验。构造t统计量:
t k = ρ k w − 2 1 − ρ k 2 t_k = \rho_k \sqrt{\frac{w - 2}{1 - \rho_k^2}} tk=ρk1−ρk2w−2

该统计量服从自由度为 ν = w − 2 \nu=w-2 ν=w−2的t分布。通过计算p值 p k = P ( T > ∣ t k ∣ ) p_k = P(T > |t_k|) pk=P(T>∣tk∣),并与显著性水平 α = 0.05 \alpha=0.05 α=0.05比较,可判断窗口内相关性是否显著。

动态置信区间的构建进一步量化了相关系数的不确定性。基于t分布的 100 ( 1 − α ) % 100(1-\alpha)\% 100(1−α)%置信区间为:
C I k = [ ρ k − t α / 2 , w − 2 ⋅ S E k , ρ k + t α / 2 , w − 2 ⋅ S E k ] CI_k = [\rho_k - t_{\alpha/2,w-2} \cdot SE_k, \rho_k + t_{\alpha/2,w-2} \cdot SE_k] CIk=[ρk−tα/2,w−2⋅SEk,ρk+tα/2,w−2⋅SEk]

其中标准误 S E k = ( 1 − ρ k 2 ) ( w − 2 ) SE_k = \sqrt{\frac{(1 - \rho_k^2)}{(w - 2)}} SEk=(w−2)(1−ρk2) , t α / 2 , w − 2 t_{\alpha/2,w-2} tα/2,w−2为t分布的双侧临界值。置信区间不包含零时,表明该窗口内的相关性具有统计意义。

针对关联性突变的检测,采用滑动方差法。定义滑动窗口方差序列:

σ m 2 = 1 m ∑ i = k k + m − 1 ( ρ i − ρ ˉ m ) 2 \sigma_m^2 = \frac{1}{m} \sum_{i=k}^{k+m-1} (\rho_i - \bar{\rho}_m)^2 σm2=m1i=k∑k+m−1(ρi−ρˉm)2

其中 m m m为方差计算窗口大小 m m m, ρ ˉ m \bar{\rho}_m ρˉm为局部均值。通过设定阈值 θ = η ⋅ std ( σ 2 ) \theta = \eta \cdot \text{std}(\sigma^2) θ=η⋅std(σ2),当 σ m 2 > θ \sigma_m^2 > \theta σm2>θ时判定为关联性突变点。

多尺度分析则通过改变窗口宽度 w w w实现不同时间分辨率的特征捕捉。短窗口( w = 100 w=100 w=100)侧重瞬态波动,长窗口( w = 400 w=400 w=400)反映稳态关联,多尺度相关系数序列KaTeX parse error: Expected 'EOF', got '}' at position 15: \{\rho_k^{(w)}}̲的对比可揭示气体相互作用机制的尺度依赖性。

3.3 耦合关系分析结果

  • 图2 气体组间动态相关系数演化
  • 图3 Gas1-Gas3

四、问题一

代码

数据预处理

问题一

国奖学姐的认证杯C题完整论文与代码,今天下午写完全部的~

相关推荐
How_doyou_do5 小时前
项目实战-25年美赛MCM/ICM-基于数学建模与数据可视化的动态系统模型
python·数学建模·数据可视化
瑞雪兆丰年兮6 小时前
数学实验(Matlab语言环境和线性代数实验)
算法·数学建模·matlab·数学实验
灏瀚星空1 天前
深度学习之LSTM时序预测:策略原理深度解析及可视化实现
python·深度学习·神经网络·算法·机器学习·数学建模·lstm
lynne2331 天前
计算广告-广告智能出价原理-出价的数学建模
数学建模
人大博士的交易之路1 天前
今日行情明日机会——20250507
大数据·数学建模·数据挖掘·缠论·缠中说禅·涨停回马枪
灏瀚星空1 天前
深度学习之LSTM时序预测入门指南:从原理到实战
人工智能·python·深度学习·神经网络·机器学习·数学建模·lstm
homelook2 天前
4电池_基于开关电容的均衡
数学建模
数据系的公考小白2 天前
2025五一杯数学建模C题代码分享
python·数学建模·pandas·五一杯
小文数模3 天前
2025深圳杯东三省数学建模竞赛B题完整分析论文(共27页)(含模型、可运行代码、求解结果)
python·数学建模·matlab
smppbzyc3 天前
2025年深圳杯数学建模(东三省)B题【颜色转换】原论文讲解(含完整python代码)
数学建模·深圳杯数学建模·东三省数学建模·2025深圳杯数学建模·2025东三省数学建模