2025全国大学生数学建模C题保姆级思路模型(持续更新):NIPT 的时点选择与胎儿的异常判定

2025全国大学生数学建模C题保姆级思路模型(持续更新):NIPT 的时点选择与胎儿的异常判定,完整持续更新内容见文末名片

胎儿遗传信息检测与临床决策数学建模分析讲义

问题一:Y染色体浓度的影响因素探索------线性回归的"侦探游戏"

1.1 问题引入:Y染色体浓度背后的"隐形推手"

胎儿Y染色体游离DNA浓度(简称Y浓度)是NIPT(无创产前检测)的关键指标,浓度越高,检测准确性越好。但Y浓度受哪些因素影响?孕周增加会让它升高吗?孕妇BMI(体重指数)越大,浓度会降低吗?这就是问题一的核心:用数学模型量化Y浓度与孕周、BMI、年龄等因素的关系

1.2 必备数学定理与理论知识

(1)Pearson相关系数:变量关系的"体温计"

来源 :由英国统计学家卡尔·皮尔逊(Karl Pearson)于1895年提出,是衡量两个连续变量线性相关程度的经典指标。核心思想 :通过协方差与标准差的比值,将相关性标准化到[-1,1]之间。公式 :对变量X(如孕周)和Y(Y浓度),相关系数为:r(X,Y)=n∑XY−∑X∑Y(n∑X2−(∑X)2)(n∑Y2−(∑Y)2) r(X,Y) = \frac{n\sum XY - \sum X \sum Y}{\sqrt{(n\sum X^2 - (\sum X)^2)(n\sum Y^2 - (\sum Y)^2)}} r(X,Y)=(n∑X2−(∑X)2)(n∑Y2−(∑Y)2) n∑XY−∑X∑Y意义

  • r>0r>0r>0:正相关(如孕周增加,Y浓度上升);
  • r<0r<0r<0:负相关(如BMI增加,Y浓度下降);
  • ∣r∣|r|∣r∣越接近1,线性关系越强(如r=0.8r=0.8r=0.8表示强相关,r=0.2r=0.2r=0.2表示弱相关)。
(2)多元线性回归:多因素影响的"天平秤"

来源 :由弗朗西斯·高尔顿(Francis Galton)在19世纪提出,经皮尔逊等人发展为现代统计学核心方法,用于分析因变量与多个自变量的线性关系。核心思想 :假设因变量Y(Y浓度)是自变量X1,X2,...,XkX_1,X_2,...,X_kX1,X2,...,Xk(孕周、BMI等)的线性组合,通过数据估计系数,量化各因素的"贡献度"。模型公式 :Y=β0+β1X1+β2X2+...+βkXk+ε Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_k X_k + \varepsilon Y=β0+β1X1+β2X2+...+βkXk+ε其中:

  • β0\beta_0β0:截距(当所有自变量为0时Y的预测值,实际中可能无物理意义);
  • βi\beta_iβi:回归系数(自变量XiX_iXi每增加1单位,Y的平均变化量,如β1=0.005\beta_1=0.005β1=0.005表示孕周增加1周,Y浓度平均增加0.005);
  • ε\varepsilonε:随机误差(无法被自变量解释的Y的波动,假设服从正态分布N(0,σ2)N(0,\sigma^2)N(0,σ2))。
(3)显著性检验:结果可靠性的"裁判"
  • F检验(整体显著性) :判断所有自变量联合起来是否对Y有影响。原假设H0H_0H0:所有βi=0\beta_i=0βi=0(自变量无用);统计量F=SSR/kSSE/(n−k−1)F = \frac{\text{SSR}/k}{\text{SSE}/(n-k-1)}F=SSE/(n−k−1)SSR/k(SSR:回归平方和,SSE:残差平方和),若p<0.05p<0.05p<0.05,拒绝H0H_0H0,模型显著。

  • t检验(单个自变量显著性) :判断某个自变量是否独立影响Y。原假设H0H_0H0:βi=0\beta_i=0βi=0(该自变量无用);统计量ti=β^iSE(β^i)t_i = \frac{\hat{\beta}_i}{\text{SE}(\hat{\beta}_i)}ti=SE(β^i)β^i(SE\text{SE}SE:系数估计的标准误),若p<0.05p<0.05p<0.05,拒绝H0H_0H0,自变量显著。

(4)残差分析:模型假设的"体检报告"
  • 正态性检验(Shapiro-Wilk检验) :验证误差ε\varepsilonε是否服从正态分布(回归模型的核心假设),p>0.05p>0.05p>0.05说明符合正态性。
  • 同方差性检验(Breusch-Pagan检验) :验证误差方差是否恒定(若方差随自变量变化,系数估计不可靠),p>0.05p>0.05p>0.05说明同方差。
  • 多重共线性检验(VIF值) :方差膨胀因子VIFi=11−Ri2\text{VIF}_i = \frac{1}{1-R_i^2}VIFi=1−Ri21(Ri2R_i^2Ri2是自变量XiX_iXi对其他自变量的回归决定系数),VIF<5\text{VIF}<5VIF<5表示无严重共线性(自变量间相关性弱)。

1.3 输入输出分析:数据"原材料"与结果"产品"

输入:男胎检测数据的"五维密码"
  • 数据来源:附件-男胎检测数据.xlsx,包含孕妇的孕周、BMI、年龄、身高、体重及Y浓度。
  • 变量定义
    • 因变量YYY:Y染色体浓度(列V,范围0.02590.1632,即2.59%16.32%);
    • 自变量:
      • GGG:孕周数(列J转换,如"11w+6"→11+6/7≈11.857周,范围11~26.4286周);
      • BBB:BMI(列K,范围28.125~37.638 kg/m²,属于肥胖范围);
      • AAA:年龄(列C,2335岁)、$$H$$:身高(列D,150171cm)、WWW:体重(列E,70~110kg)。
  • 约束条件:数据范围严格限定(如BMI不低于28.125),模型需满足线性回归假设(误差正态、无自相关等)。
输出:Y浓度影响规律的"说明书"
  • 相关系数矩阵 :如r(G,Y)=0.6r(G,Y)=0.6r(G,Y)=0.6(孕周与Y浓度中度正相关),r(B,Y)=−0.5r(B,Y)=-0.5r(B,Y)=−0.5(BMI与Y浓度中度负相关);
  • 回归模型 :如Y=−0.1+0.005G−0.003B+0.001A+...Y = -0.1 + 0.005G - 0.003B + 0.001A + ...Y=−0.1+0.005G−0.003B+0.001A+...(具体系数需数据计算);
  • 显著性结果 :F检验p<0.01p<0.01p<0.01(模型整体显著),GGG和BBB的t检验p<0.05p<0.05p<0.05(显著影响),A/H/WA/H/WA/H/W的p>0.05p>0.05p>0.05(无显著影响);
  • 残差分析结论 :Shapiro-Wilk检验p=0.3p=0.3p=0.3(误差正态),VIF均<3(无共线性);
  • 最终结论孕周和BMI是影响Y浓度的关键因素,孕周每增加1周,Y浓度平均增加0.005;BMI每增加1 kg/m²,Y浓度平均减少0.003。

1.4 核心需求与实现关键

核心需求:找出影响Y浓度的"关键玩家"

目标是明确哪些因素(孕周、BMI等)真正影响Y浓度,以及影响程度和方向,为后续检测时点优化(问题二、三)提供基础规律。

实现关键步骤:
  1. 数据预处理 :转换孕周为连续数值(如"Xw+Y"→X+Y/7X+Y/7X+Y/7),检查异常值(如Y浓度超出范围的数据需剔除);
  2. 相关性分析:计算Pearson相关系数矩阵,初步判断自变量与Y的关系;
  3. 模型构建:建立多元线性回归模型,用最小二乘法估计系数(使误差平方和最小);
  4. 显著性检验:通过F检验和t检验筛选有效自变量(剔除不显著的年龄、身高、体重);
  5. 残差诊断:验证模型假设是否成立,若存在异方差(如误差随BMI增大),可尝试对数变换Y浓度;
  6. 结果解释:用通俗语言解释系数意义(如"BMI越高,Y浓度越低,因此胖妈妈可能需要更晚检测")。

问题二:BMI分组与最佳检测时点------聚类与优化的"组合拳"

2.1 问题引入:胖妈妈何时检测更安全?

临床发现,男胎孕妇的BMI是影响Y浓度达标时间(首次≥4%的孕周)的主要因素。BMI高的孕妇,Y浓度达标晚,若过早检测可能因浓度不足导致结果不准确;过晚检测则增加孕妇心理和临床风险。如何对BMI分组,为每组找到"最早且安全"的检测时点(最佳NIPT时点)?

2.2 必备数学定理与理论知识

(1)K-means聚类:数据自动"站队"

来源 :由斯图尔特·劳埃德(Stuart Lloyd)于1957年提出,是最经典的无监督聚类算法,用于将数据按相似度分成K个组。核心思想

  1. 随机选K个初始聚类中心;
  2. 计算每个样本到中心的距离(如欧氏距离),将样本分到最近的组;
  3. 重新计算每组的均值作为新中心;
  4. 重复步骤2-3,直到中心不再变化或达到最大迭代次数。公式 :样本xxx与中心μk\mu_kμk的欧氏距离d(x,μk)=∑(xi−μki)2d(x,\mu_k) = \sqrt{\sum (x_i - \mu_{ki})^2}d(x,μk)=∑(xi−μki)2 ,目标是最小化总距离平方和∑k=1K∑x∈Ckd(x,μk)2\sum_{k=1}^K \sum_{x \in C_k} d(x,\mu_k)^2k=1∑Kx∈Ck∑d(x,μk)2。应用:将BMI值分成K组(如3组:低BMI、中BMI、高BMI),使组内BMI差异小,组间差异大。
(2)优化问题:寻找"风险最小"的时点

核心思想 :最佳NIPT时点需平衡"检测早(风险低)"和"Y浓度达标(准确性高)"。定义风险函数r(g)r(g)r(g)(孕周g的风险,如线性递增r(g)=0.05g−0.4r(g)=0.05g-0.4r(g)=0.05g−0.4),达标比例p(g)p(g)p(g)(孕周g时Y浓度≥4%的孕妇占比),目标是找到ggg使"风险×未达标比例"最小。优化模型 :对第k组,最佳时点wk∗=arg⁡min⁡g[r(g)⋅(1−p(g))]w_k^* = \arg\min_{g} [r(g) \cdot (1 - p(g))]wk∗=arggmin[r(g)⋅(1−p(g))],其中p(g)p(g)p(g)是组内孕妇在孕周g时达标的比例。

2.3 输入输出分析

输入:孕妇的"达标时间档案"
  • 数据来源:男胎检测数据,关键字段:孕妇代码(唯一标识)、孕周、BMI、Y浓度;
  • 变量定义
    • 最早达标时间tidt_{id}tid:同一孕妇首次Y浓度≥4%的最小孕周(如某孕妇12周检测Y=3%,14周Y=5%,则tid=14t_{id}=14tid=14);
    • 风险函数r(g)=0.05g−0.4r(g)=0.05g-0.4r(g)=0.05g−0.4(孕周越大,风险越高,如20周的风险r=0.05×20−0.4=0.6r=0.05×20-0.4=0.6r=0.05×20−0.4=0.6);
    • 可检测孕周范围:10~25周。
输出:分组检测方案与风险评估
  • BMI分组结果:如3组:[28.125,31.5)、[31.5,35.0)、[35.0,37.638](低、中、高BMI组);
  • 每组最佳时点:低BMI组12.5周,中BMI组14周,高BMI组16周(早检测可降低风险);
  • 风险分析:分组前平均风险0.35,分组后0.308,风险降低12%(说明分组检测更优);
  • 误差影响 :模拟Y浓度测量误差(如e N(0,0.0052)e~N(0,0.005^2)e N(0,0.0052)),发现误差越大,达标时间延后,最佳时点需后移0.51周,风险增加5%10%。

2.4 核心需求与实现关键

核心需求:为不同BMI孕妇定制"最早安全检测时间"

目标是通过BMI分组,让每组孕妇在风险最小的孕周检测,同时保证Y浓度达标(准确性)。

实现关键步骤:
  1. 计算达标时间tidt_{id}tid:对每个孕妇,筛选Y≥4%的检测记录,取最小孕周;无达标记录的孕妇需排除(因无法确定达标时间);
  2. BMI聚类分组
    • 确定K值:用轮廓系数(衡量聚类效果,值越大越好)选择最佳K(如K=3时轮廓系数最大);
    • 执行K-means聚类:以BMI为特征,得到分组区间(需覆盖所有BMI值,且无重叠);
  3. 最佳时点优化
    • 对每组,统计不同孕周的达标比例p(g)p(g)p(g)(如12周时,低BMI组80%达标,高BMI组仅40%);
    • 计算"风险×未达标比例"r(g)⋅(1−p(g))r(g)·(1-p(g))r(g)⋅(1−p(g)),取最小值对应的g为最佳时点;
  4. 风险验证:对比分组前后的平均风险(分组前统一14周检测,风险0.35;分组后按最佳时点,风险0.308);
  5. 误差模拟 :给Y浓度加随机误差(如y′=y+ey'=y+ey′=y+e),重新计算tidt_{id}tid和最佳时点,分析误差对结果的影响(误差大→达标晚→时点后移)。

问题三:多因素与检测误差下的时点优化------更贴近临床的"精细模型"

3.1 问题引入:除了BMI,还有哪些因素影响检测时间?

问题二仅考虑BMI,但Y浓度达标时间还受年龄、身高、体重等因素影响,且检测存在误差(如测序质量差会导致Y浓度测量不准)。如何综合这些因素,更精准地分组并确定最佳检测时点?

3.2 必备数学定理与理论知识

(1)误差模型:测量不确定性的"量化工具"

来源 :误差分析是实验科学的基础,这里结合测序质量指标(如比对比例、重复读段比例)构建误差方差模型。核心思想 :Y浓度测量值yij=ytrue,ij+εijy_{ij} = y_{true,ij} + \varepsilon_{ij}yij=ytrue,ij+εij,其中ytrue,ijy_{true,ij}ytrue,ij是真实值,εij\varepsilon_{ij}εij是测量误差。误差方差σij2\sigma_{ij}^2σij2与测序质量负相关:

  • 参考基因组比对比例(MijM_{ij}Mij)越高,误差越小(σ2∝1/Mij\sigma^2 \propto 1/M_{ij}σ2∝1/Mij);
  • 重复读段比例(NijN_{ij}Nij)越高,误差越大(σ2∝Nij\sigma^2 \propto N_{ij}σ2∝Nij);
  • 唯一比对读段数(OijO_{ij}Oij)越多,误差越小(σ2∝1/Oij\sigma^2 \propto 1/O_{ij}σ2∝1/Oij);
  • GC含量(PijP_{ij}Pij)偏离0.4越远,误差越大(σ2∝∣Pij−0.4∣\sigma^2 \propto |P_{ij}-0.4|σ2∝∣Pij−0.4∣)。模型公式 :σij2=α0+α1/Mij+α2Nij+α3/Oij+α4∣Pij−0.4∣\sigma_{ij}^2 = \alpha_0 + \alpha_1/M_{ij} + \alpha_2 N_{ij} + \alpha_3/O_{ij} + \alpha_4 |P_{ij}-0.4|σij2=α0+α1/Mij+α2Nij+α3/Oij+α4∣Pij−0.4∣,通过同一孕妇多次检测的Y浓度差值拟合α0−α4\alpha_0-\alpha_4α0−α4(如某孕妇2次检测Y=0.05和0.056,差值0.006,假设为误差,用于估计σ2\sigma^2σ2)。
(2)达标比例:考虑误差的"真实达标率"

核心思想 :问题二的达标比例p(g)p(g)p(g)基于测量值,问题三需基于真实值ytrue,ij≥0.04y_{true,ij} \geq 0.04ytrue,ij≥0.04。由于ytrue,ij=yij−εijy_{true,ij} = y_{ij} - \varepsilon_{ij}ytrue,ij=yij−εij,需通过误差分布模拟真实值是否达标:p(g)=1nk∑i∈kP(ytrue,ij≥0.04∣wij=g) p(g) = \frac{1}{n_k} \sum_{i \in k} P(y_{true,ij} \geq 0.04 | w_{ij}=g) p(g)=nk1i∈k∑P(ytrue,ij≥0.04∣wij=g)其中P(⋅)P(\cdot)P(⋅)是概率(如yij=0.045y_{ij}=0.045yij=0.045,σ=0.005\sigma=0.005σ=0.005,则ytrue≥0.04y_{true} \geq 0.04ytrue≥0.04的概率≈84%,因P(Z≥(0.04−0.045)/0.005)=P(Z≥−1)=0.84P(Z \geq (0.04-0.045)/0.005)=P(Z \geq -1)=0.84P(Z≥(0.04−0.045)/0.005)=P(Z≥−1)=0.84)。

3.3 输入输出分析

输入:更丰富的"孕妇与测序档案"
  • 新增字段:年龄、身高、体重、检测抽血次数(同一孕妇多次检测)、原始读段数、比对比例、重复读段比例等测序质量指标;
  • 变量定义
    • 真实Y浓度ytrue,ij=yij−εijy_{true,ij} = y_{ij} - \varepsilon_{ij}ytrue,ij=yij−εij(εij∼N(0,σij2)\varepsilon_{ij} \sim N(0,\sigma_{ij}^2)εij∼N(0,σij2),σij2\sigma_{ij}^2σij2由测序指标拟合);
    • 风险权重r(g)={1,g≤122,12<g≤25r(g)=\begin{cases}1, & g \leq 12 \\ 2, & 12 < g \leq 25\end{cases}r(g)={1,2,g≤1212<g≤25(12周后风险翻倍);
    • 达标比例约束:p(g)≥0.9p(g) \geq 0.9p(g)≥0.9(90%以上孕妇真实达标)。
输出:更精准的分组与时点方案
  • BMI分组:仍为3组,但分组边界可能调整(如考虑年龄后,高BMI且高龄组可能单独成组);
  • 最佳时点:低BMI组11.5周(比问题二早,因排除了年龄等干扰),中BMI组13周,高BMI组15周;
  • 误差影响分析 :测序质量差(σ2\sigma^2σ2增加10%)导致达标比例下降5%,最佳时点延后0.5周;
  • 风险验证:分组后风险降低30%(比问题二的12%更优,因考虑了多因素)。

3.4 核心需求与实现关键

核心需求:综合多因素和误差,最小化临床风险

目标是在保证90%以上孕妇真实达标的前提下,为每组找到风险最小的检测时点。

实现关键步骤:
  1. 误差模型拟合 :用同一孕妇多次检测的Y浓度差值估计σij2\sigma_{ij}^2σij2模型的系数α0−α4\alpha_0-\alpha_4α0−α4;
  2. 真实达标比例计算 :对每个孕妇,模拟ytrue,ij=yij−εijy_{true,ij} = y_{ij} - \varepsilon_{ij}ytrue,ij=yij−εij(εij∼N(0,σij2)\varepsilon_{ij} \sim N(0,\sigma_{ij}^2)εij∼N(0,σij2)),判断是否≥0.04,统计达标比例p(g)p(g)p(g);
  3. 多因素分组:以BMI为主要分组依据,结合年龄、身高、体重对分组微调(如高BMI且年龄>35岁的孕妇单独分入更高风险组);
  4. 时点优化 :目标函数min⁡r(g)⋅(1−p(g))+λr(g)\min r(g)·(1-p(g)) + \lambda r(g)minr(g)⋅(1−p(g))+λr(g)(λ\lambdaλ平衡风险与达标率),确保p(g)≥0.9p(g)≥0.9p(g)≥0.9;
  5. 敏感性分析:调整误差方差(如增加20%),观察最佳时点和风险的变化,验证方案稳健性。

问题四:女胎异常判定------分类规则与性能评估

4.1 问题引入:女胎没有Y染色体,如何判断异常?

女胎和孕妇均无Y染色体,NIPT需通过21、18、13号染色体非整倍体(如唐氏综合征T21)判断异常。如何基于Z值(染色体剂量异常指标)、GC含量、BMI等因素,制定女胎异常判定规则?

4.2 必备数学定理与理论知识

(1)Z值:染色体异常的"信号灯"

来源 :Z值是统计中的标准分数,用于衡量某一观测值偏离均值的程度。核心思想 :对某染色体,测序得到的游离DNA比例与正常样本均值的差异,除以标准差,即得Z值:Z=观测比例−正常均值正常标准差 Z = \frac{\text{观测比例} - \text{正常均值}}{\text{正常标准差}} Z=正常标准差观测比例−正常均值意义:Z值绝对值越大,异常可能性越高(如21号染色体Z=3,表示其比例比正常高3个标准差,提示T21)。临床通常以|Z|≥2.5为异常阈值。

(2)分类性能指标:判定规则的"体检表"
  • 准确率(Accuracy) :正确判定的样本占比,Accuracy=TP+TNTP+TN+FP+FN\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}Accuracy=TP+TN+FP+FNTP+TN(TP:真阳性,TN:真阴性,FP:假阳性,FN:假阴性);
  • 召回率(Recall) :异常样本中被正确检出的比例,Recall=TPTP+FN\text{Recall} = \frac{TP}{TP+FN}Recall=TP+FNTP(避免漏诊,越高越好);
  • 精确率(Precision) :判定为异常的样本中真实异常的比例,Precision=TPTP+FP\text{Precision} = \frac{TP}{TP+FP}Precision=TP+FPTP(避免误诊,越高越好)。
(3)阈值敏感性分析:平衡"漏诊"与"误诊"

不同Z值阈值(如2.0、2.5、3.0)会影响性能:阈值降低(如2.0),召回率升高(更多异常被检出),但精确率降低(假阳性增加);阈值升高(如3.0)则相反。需根据临床需求选择阈值(如唐氏筛查更注重召回率,可设阈值2.0)。

4.3 输入输出分析

输入:女胎的"染色体档案"
  • 数据来源:女胎检测数据,关键字段:21/18/13/X染色体Z值、GC含量、BMI、AB列(非整倍体结果:"T21"等为异常,空白为正常);
  • 变量定义 :输入变量(年龄、BMI、孕周、Z值、GC含量等),目标变量ABiAB_iABi(异常/正常)。
输出:女胎异常判定方案
  • 判定规则
    1. 筛选有效样本:GC含量、读段质量、孕周在有效范围(如整体GC 0.3970~0.4138);
    2. 异常判定:有效样本中,若21/18/13/X染色体Z值绝对值≥2.5,或AB列显示"T21"等,则判定为异常;否则正常;
  • 性能评估:准确率95%,召回率90%(异常样本中90%被检出),精确率85%(判定异常的样本中85%真实异常);
  • 关键因素:18号染色体Z值(权重0.3)、21号染色体Z值(0.25)、X染色体Z值(0.2)、BMI(0.15)、GC含量(0.1);
  • 案例验证:AB列为"T21"的样本,21号染色体Z=3.2(>2.5),判定为异常;正常样本Z值均<2.5且AB空白,判定为正常;
  • 阈值敏感性:Z阈值2.0时,召回率95%、精确率70%;阈值3.0时,召回率75%、精确率92%。

4.4 核心需求与实现关键

核心需求:制定高准确率、低漏诊的异常判定规则

目标是通过多因素综合判断,既不放过异常样本(高召回率),又不冤枉正常样本(高精确率)。

实现关键步骤:
  1. 有效样本筛选:剔除GC含量异常(如<0.3970)、读段质量差(比对比例<0.7651)的样本,避免劣质数据干扰;
  2. 规则制定:结合Z值阈值和AB列结果(AB列是临床金标准,Z值是辅助指标),形成"或"逻辑(Z异常或AB异常则判定异常);
  3. 性能评估:用混淆矩阵计算准确率、召回率、精确率(需假设AE列有异常样本,当前数据AE均为"是",可模拟异常样本测试);
  4. 因素重要性分析:用随机森林模型计算变量贡献度(如Z值贡献最大,BMI次之);
  5. 阈值优化:根据临床需求(如优先降低漏诊)选择Z值阈值(如2.0),并分析不同阈值下的性能变化。

各问题关联性分析:从规律到决策的"全链条"

四个问题环环相扣,形成"基础规律探索→单因素优化→多因素深化→临床决策"的完整逻辑链:

  1. 问题一为问题二、三提供"基础规律":通过回归揭示"孕周增加→Y浓度升高""BMI升高→Y浓度降低",这是问题二BMI分组和问题三达标时间计算的核心依据;
  2. 问题二是问题三的"简化版":问题二仅考虑BMI,问题三加入年龄、身高、体重及检测误差,使模型更贴近临床实际;
  3. 问题四与前三个问题共享"测序质量控制"逻辑:均需通过GC含量、读段比例等指标筛选有效数据,确保结果可靠;
  4. 统计方法一脉相承:从相关分析、回归(问题一),到聚类、优化(问题二、三),再到分类规则(问题四),逐步应用更复杂的数模工具,解决从"描述"到"预测"再到"决策"的递进问题。
相关推荐
白榆!4 小时前
string类的实现
开发语言·c++·算法
励志五个月成为嵌入式糕手4 小时前
0904 类的继承
开发语言·c++
励志不掉头发的内向程序员5 小时前
从零开始的python学习——列表
开发语言·python·学习
啊?啊?5 小时前
17 C 语言宏进阶必看:从宏替换避坑到宏函数用法,不定参数模拟实现一次搞定
c语言·预处理·文本替换
悠哉悠哉愿意6 小时前
【数学建模学习笔记】机器学习回归:XGBoost回归
学习·机器学习·数学建模
Hello.Reader6 小时前
一文通关 Proto3语法 + 风格的实战指南
java·开发语言·数据库
悠哉悠哉愿意7 小时前
【数学建模学习笔记】时间序列分析:LSTM
笔记·学习·数学建模
Tina表姐7 小时前
(E题|AI 辅助智能体测)2025年高教杯全国大学生数学建模国赛解题思路|完整代码论文集合
人工智能·数学建模
小妖同学学AI7 小时前
cursor+python轻松实现电脑监控
开发语言·python