2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题

赛道B:电商零售商家需求预测及库存优化问题

电商平台存在着上千个商家,他们会将商品货物放在电商配套的仓库,电商平台会对这些货物进行统一管理。通过科学的管理手段和智能决策,大数据智能驱动的供应链可以显著降低库存成本,同时保证商品的按时履约。一般来说,以上供应链优化问题会包含以下方面:

需求预测

预测往往是智能供应链的决策基础,它可以让管理者提前预知各地的需求,从而将库存提前放在靠近需求的仓库中,此时的预测任务为:根据历史一段时间的需求量,预测各仓库中各商品未来需求,"预测维度"即为不同商家在各仓库中存放的各种商品每天的数量。一般来说,企业会首先根据数据的历史情况,分析出需求量序列的数理特征,对相似的需求量序列进行归类,并根据分类结果做到更加精准的预测。预测准确率有很多评价指标,较常用的指标为1-wmape,定义如下:

然而,在实际的电商供应链预测任务中,常常会出现多种不同的问题。 例如,部分商品的销售时间过短、仓库存在新增或切换等情况,导致该预 测维度下历史数据过少;另外,部分大型促销期间货量的陡增并由此带来 的不规律性,也给需求量的精准预测带来了不小的难度。此时便需要通过 算法得到历史一般规律,找出相似的历史情况(如相似的仓或商品),从而 实现精准预测

库存优化

为了有效管理库存水平,企业通常会制定各种库存策略来控制商品的 补货频次和补货量。定期盘点库存策略(s,S)是一种常见的库存策略,其中s 表示该种策略下的库存下限,S 为库存上限。在这种策略中,企业会每隔 一段固定时间查看库存水平,盘点之间的间隔设为盘点周期(NRT)。如果 在盘点时库存水平 T 低于最小库存水平 s,则会将库存补充至 S,此时的补 货量 Q = S − T,如果在盘点时库存水平高于 s,则不进行补充,直到下一 次库存盘点。同时需要考虑到,在每次发起补货后,补充的货物会经过一 定时间后才能到达当前仓库,这个时间间隔为提前期(LT)。

使用以上的库存策略,管理者需要对两个方面进行权衡取舍。一方面, 为了及时满足用户订单,公司需要保有大量库存以防止缺货;另一方面, 库存水位升高带来了过高的库存成本。库存优化的目标主要为:

1)降低库存总持有成本,可由单位持有成本 h 得到(一件商品存储一 天产生的成本);

2)满足服务水平:确保有足够的产品可以及时满足客户需求,降低总 缺货成本,可由缺货成本得到(每天每缺一件商品产生的成本);

3)降低库存周转天数:库存周转天数越小,表示库存的流动性越好, 企业的库存管理效率越高。

初赛问题:

**问题一:**使用附件 1-4 中的数据,预测出各商家在各仓库的商品 2023-05-16 至 2023-05-30 的需求量,请将预测结果填写在结果表 1 并上传至竞赛平台,并对你们模型的预测性能进行评价。另外请讨论:根据数据 分析及建模过程,这些由商家、仓库、商品形成的时间序列如何分类,使 同一类别在需求上的特征最为相似?

**问题二:**现有一些新出现的商家+仓库+商品维度(附件 5),导致这种 情况出现的原因可能是新上市的商品,或是改变了某些商品所存放的仓库。 请讨论这些新出现的预测维度如何通过历史附件 1 中的数据进行参考,找 到相似序列并完成这些维度在 2023-05-16 至 2023-05-30 的预测值。请把预 测结果填写在结果表 2,并上传至竞赛平台

**问题三:**每年 6 月会出现规律性的大型促销,为需求量的精准预测以 及履约带来了很大的挑战。附件 6 给出了附件 1 对应的商家+仓库+商品维 度在去年双十一期间的需求量数据,请参考这些数据,给出 2023-06-01 至 2023-06-20 的预测值。请把预测结果填写在结果表 3,并上传至竞赛平台。

相关推荐
武子康1 天前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
SelectDB2 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康2 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes2 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康3 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台4 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康4 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台5 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术5 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康5 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive