2025全国大学生电工数学建模(电工杯)选题建议+初步分析
提示:C君认为的难度和开放度评级如下:

难度:A=B,开放度:A>B。原因如下:A题需要需处理时序数据、多源数据融合、复杂气象建模,数据来源需自行查找,模型选择和场景划分有较大自由度。B题需要大规模组合优化、多目标权衡、复杂约束建模,问题结构明确,但需设计高效算法和灵活处理多阶段优化
以下为AB题选题建议及初步分析:(要注意的是,本次选题建议会给出每道题目的题目分析、第一问建模过程和推荐算法,然后根据学生不同的专业,针对性给出选题建议)。
专业选择:
- 计算机科学/统计学:优先选A题,适合时序预测和机器学习建模。
- 电气工程/环境科学:选A题,直接关联可再生能源场景分析。
- 工业工程/运筹学:优先选B题,适合路径优化和约束建模。
- 应用数学:根据兴趣选择,A题侧重算法调优,B题侧重组合优化。
A题:光伏电站发电功率日前预测问题

A题聚焦于基于历史功率和气象数据(NWP)建立光伏发电功率的预测模型,涉及时空数据建模、多源数据融合和不确定性分析。难点在于:1 长周期与短周期特性耦合:需同时建模季节变化(太阳高度角)、日内波动(云层遮挡)和气象突变(雾霾)。2 NWP数据降尺度:传统气象预报空间分辨率不足(千米级),需通过空间插值或深度学习提升至光伏电站尺度(百米级)。3 白昼时段误差约束:仅统计白昼误差要求模型具备动态时间窗口感知能力。
C君建议的建模过程为:

推荐算法:
前沿算法1:时空图卷积网络(ST-GCN)
将光伏电站地理分布建模为图结构,节点属性包含历史功率和气象参数,通过图卷积捕获相邻电站的空间相关性。
前沿算法2:Transformer with Time2Vec
用Time2Vec编码时间周期性,多头注意力机制建模长序列依赖,适合捕捉辐照度的突变模式。
传统算法:XGBoost with SHAP解释
特征工程加入滞后项(lag=96,24小时历史窗口)和气象交叉特征,SHAP值分析NWP各因素贡献度。
可视化可以使用T-SNE降维聚类 和动态热力图(用Matplotlib绘制光伏电站全年的功率-辐照度-时间三维热力图,叠加理论功率曲线对比)
第一问前大家需要对数据进行分析和数值化处理,也就是EDA(探索性数据分析)。对于数值型数据,大家用归一化、去除异常值等方式就可以进行数据预处理。而对于非数值型数据进行量化,大家可以使用以下方法:
1标签编码
标签编码是将一组可能的取值转换成整数,从而对非数值型数据进行量化的一种方法。例如,在机器学习领域中,对于一个具有多个类别的变量,我们可以给每个类别赋予一个唯一的整数值,这样就可以将其转换为数值型数据。
2独热编码onehot
独热编码是将多个可能的取值转换成二进制数组的一种方法。在独热编码中,每个可能取值对应一个长度为总共可能取值个数的二进制数组,其中只有一个元素为1,其余元素均为0。例如,对于一个性别变量,可以采用独热编码将"男"和"女"分别转换为[1, 0]和[0, 1]。
3分类计数
分类计数是将非数值型数据转换为数值型数据的一种简单方法。在分类计数中,我们根据某些特定属性(比如学历、职业等)来对数据进行分类,然后统计每个类别的数量或频率。例如,在调查问卷中,我们可以对某个问题的回答按照"是"、"否"和"不确定"三个类别进行分类,并计算每个类别的数量或频率。
4主成分分析
主成分分析是将多维数据转换为低维度表示的一种方法。在主成分分析中,我们通过找到最能解释数据变异的主成分来对原始数据进行降维处理。这样就可以将非数值型数据转换为数值型数据。
而第一问建议大家使用一些可视化方法,可以使用常见的EDA可视化方法:
- 直方图和密度图:展示数值变量的分布情况。
- 散点图:展示两个连续变量之间的关系。
- 箱线图:展示数值变量的分布情况和异常值。
- 条形图和饼图:展示分类变量的分布情况。
- 折线图:展示随时间或顺序变化的趋势。
- 热力图:展示不同变量之间的相关性。
- 散点矩阵图:展示多个变量之间的散点图矩阵。
- 地理图:展示地理位置数据和空间分布信息。
建议有物理学、数学基础的同学可以进行选择。这道题目可能有最优解,大家可以最后在网络上对对答案,答案的正确性将对结果产生较大影响。适合理论扎实的团队。
B题:城市垃圾分类运输的路径优化与调度

这道题就是很多同学在训练的时候经常做的题目类型了,属于大数据、数据分析类题目,同时也是团队擅长的题目。需要一定的建模能力,和其他赛事赛题类型类似,建议大家(各个专业均可)进行选择。
B题要求在多约束(载重、时间窗口、碳排放)下优化垃圾分类运输路径,本质是多目标组合优化问题,挑战在于:1 多车辆协同调度:四类垃圾需专用车辆,任务拆分需避免路径重叠。2 动态约束建模:中转站容量限制与车辆时间窗口需实时更新路径。3 非对称路网影响:单行道和禁行时段导致距离矩阵非对称,传统启发式算法失效。
C君推荐的建模过程为:

推荐算法有:
- 前沿算法1:深度强化学习(PPO)
定义状态为车辆位置、剩余载重、未访问节点,动作选择下一节点,奖励函数为负距离+惩罚超载。 - 前沿算法2:图注意力网络(GAT)
将收集点编码为图节点,注意力机制学习节点间运输成本关联,输出路径优先级。 - 传统算法:改进遗传算法(NSGA-II)
染色体编码为车辆-路径序列,适应度函数融合距离和碳排放,非支配排序处理多目标优化。
可视化方法:1 3D路径轨迹动态仿真(用PyVista或Three.js绘制车辆在城区的实时移动轨迹,颜色编码垃圾类型,气泡大小表示载重量。)
2 甘特图调度分析(用Plotly绘制每辆车的出发-返回时间轴,标注中转站停留窗口和任务分配。)
推荐运筹学相关专业的同学进行选择,该题以运筹学导向,适合擅长数学建模和算法设计的团队。由于这篇是选题建议,就不赘述具体思路了。数据集怎么分析,可视化代码什么的,后续会更新。这道题目开放度较高,难度较适中。推荐所有专业同学选择门槛较低且开放度也相对较高。
总体而言,A题适合数据科学团队:需熟练处理时空数据,掌握PyTorch/TensorFlow框架,推荐时空Transformer+SHAP解释。
B题适合运筹学团队:需熟悉组合优化和强化学习,推荐GAT+PPO组合,配合动态仿真增强结果说服力。
可视化优先级:A题侧重气象-功率关联的可解释性,B题需动态展示路径优化效果。
其中更详细的思路,各题目思路、代码、讲解视频、成品论文及其他相关内容,可以点击下方群名片哦!