2024年妈杯MathorCup大数据竞赛赛题浅析——助攻快速选题

一图流:

赛题难度 A:B=2:3

选题人数 A:B=2:2.5

2024年妈杯大数据竞赛初赛整体难度约为0.6个国赛。A题为台风中心路径相关问题,为评价+预测问题;B题为库存和销量的预测+优化问题。B题难度稍大于A题,可以根据自己队伍情况进行选择。26日早六点之前发布AB两题相关解题代码+论文。

A:台风的分类与预测

问题1:台风分类评价模型

任务:分析台风特征(强度、等级、风速等)与气温、气压、季风等气象因素之间的关系,构建分类模型来划分台风的类别。

思路:你可以考虑使用多变量分析(例如主成分分析PCA、聚类分析等)来分析这些气象因素与台风特征之间的相关性,并依据这些特征构建分类标准。可以将监督学习(如决策树、随机森林)或无监督学习(如K-means聚类)用于模型的训练。

问题2:台风路径预测模型

任务:利用气温、气压、洋流、风场等因素预测台风路径,并采用动态时间规整算法(DTW)与实际路径进行比较。

思路:可使用时间序列模型(如ARIMA或LSTM等神经网络模型)来预测台风的轨迹,并结合DTW算法对模型的预测路径与实际路径进行对比分析,以评估预测的准确性。

问题3:台风登陆后的风速与降水量预测模型

任务:构建模型,描述台风登陆后风速和降水量的衰减过程,以及降水量与距台风中心的距离关系。

思路:可以基于物理模型(如衰减函数模型或指数衰减模型)来描述台风登陆后风速和降水的变化规律,或者通过统计模型(如线性回归、非线性回归)分析历史数据中台风强度、降水量与距离的关系。

赛道B:电商品类货量预测及品类分仓规划

问题1:货量预测模型

任务:预测350个品类在未来三个月的库存量(按月)和销量(按日)。

思路:可以基于时间序列分析模型(如指数平滑、ARIMA、Prophet等)对每个品类的库存量和销量进行预测。使用的模型需要能够捕捉到历史趋势和季节性变化。

问题2:"一品一仓"分仓方案

任务:基于问题1的预测结果,制定"一品一仓"分仓方案,在仓容和产能限制下,规划每个品类应存放的仓库。

思路:这个问题可以看作一个经典的线性规划或整数规划问题,约束条件包括每个仓库的仓容和产能。可以采用线性规划算法(如单纯形法)或启发式算法(如遗传算法、模拟退火算法)来求解最优的分仓方案。

问题3:"一品多仓"分仓方案

任务:允许每个品类最多分配到3个仓库,考虑品类关联度、仓库容量和产能的限制,制定新的分仓方案。

思路:这需要建立多目标优化模型,平衡品类关联度、仓库容量、产能等多个约束。可以考虑混合整数规划模型(MILP),或者使用多目标优化算法(如Pareto优化)来得到最优解。

相关推荐
Raink老师3 小时前
【AI面试临阵磨枪-70】Agent 系统如何做分布式调度、跨服务协作、故障恢复?
人工智能·面试·职场和发展
mnasd3 小时前
python常用模块
大数据
步里软件3 小时前
2611.某音 MCN 运营效率提升指南:从手动重复到自动化全流程
大数据·自动化·抖音关注·抖音评论
tedcloud1233 小时前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr
Raink老师3 小时前
【AI面试临阵磨枪-71】如何用 AI 优化推荐系统、内容审核、广告创意、搜索体验?
人工智能·面试·职场和发展
AI医影跨模态组学3 小时前
Biomarker Res(IF=11.5)安徽医科大学第一医院:基于机器学习的放射组学模型:子宫内膜癌患者的预后预测及机制探索
人工智能·深度学习·论文·医学·医学影像·影像组学
ftpeak3 小时前
Mooncake:以 KVCache 为中心的分离式 LLM 服务架构
人工智能·ai·架构·ai编程·ai开发
Terrence Shen3 小时前
Hermes agent的tools是怎么落地应用的系列
人工智能·llm·agent·hermes
Raink老师4 小时前
【AI面试临阵磨枪-72】电商全场景 AI Agent 设计(商品咨询 / 订单 / 物流 / 售后 / 退款)
人工智能·面试·职场和发展
仙女修炼史4 小时前
CNN更看重Texture还是shape:imagenet-trained cnns are biased
论文阅读·人工智能·cnn