2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析

比赛时长为期7天的妈杯大数据挑战赛如期开赛,为了帮助大家更好的选题,首先给大家带来赛题浅析,为了方便大家更好的选题。

赛道 A:基于计算机视觉的坑洼道路检测和识别

A题,图像处理类题目。这种题目的难度数模独一档,有图像处理经验的可以尝试。正常并不推荐直接选择A题。本次比赛,本平台也会主要侧重B题的助攻。

赛道B:电商零售商家需求预测及库存优化问题

由于竞赛赛题分初赛、复赛。因此本次比赛的B题仅仅涉及需求预测部分,因此关于库存优化,大家可以都不用进行考虑。因此,对于B题而言,该赛题仅仅属于预测范畴。下面我们简要的分析B题,

首先,就是数据预处理问题。对于这么大的数据集,异常值缺失值问题一定是存在的。例如对于需求量最大的这几个数据。上万的库存量我们应该如何处理呢?这是否是异常值,大家都需要进行考虑。

还有一种情况就是在进阶版课程里面一直给大家强调的逻辑异常,对于这次题目给出的数据,会不会存在逻辑异常呢?例如,一个电脑、办公的商家售卖了宠物 ,这种情况算不算异常值么?也需要大家进行讨论处理。

之后的问题一二三,则是预测模型的。根据题目不不同的要求,引入不同的自变量进行约束即可。例如。对于问题一而言,即需要我们根据附件一-附件四的数据对各商家在各仓库的商品2023-05-16 至 2023-05-30 的需求量进行预测。并进行相似度分析,这里的相似度简单来讲,我认为可以使用相关性分析里面的最简单的person进行分析即可。选择相似度高的指标,作为问题二预测模型的指标进行预测即可。

问题三,即需要我们引入去年双十一期间的需求量数据进行分析关联性等,建立对应的预测模型即可。

对于预测模型的选取,大家可以参考我之前讲过的第七八课时预测课时进行选择即可。

相关推荐
大大大大晴天36 分钟前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康2 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康3 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP4 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库4 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟4 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长4 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城4 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark