3. 需求随机变量的聚合与分解及变异系数

1. 聚合与分解

在供应链管理中,需求是一个随机变量,会对应某一特定时间尺度,例如月度或周度。但在实际应用时,需要将其转换为其他时间尺度,比如日度或季度。这就需要对需求这个随机变量进行聚合或分解操作。

  • 聚合 :将更短时间尺度的需求数据整合为更长时间尺度的数据。例如,将日度需求汇总为周度需求或月度需求。
  • 分解 :将更长时间尺度的需求数据拆分至更短时间尺度。例如,将季度需求或月度需求拆解为日度需求或周度需求。

聚合的例子:

定义 D i D_i Di 为第 i i i 天的日度需求,且满足以下条件:

  1. 所有 D i D_i Di 均为 独立同分布(IID) 的随机变量;-- 意味着今天的需求不受前一天需求的影响,具体使用时要特别注意。
  2. 日度需求服从正态分布,其均值为 μ D \mu_D μD,标准差为 σ D \sigma_D σD。

也就是说,每一天的需求 D i D_i Di 都是一个随机变量,且它们都来自同一个均值为 μ D \mu_D μD、标准差为 σ D \sigma_D σD 的正态分布。

现在我们定义一个新的随机变量 m m m,用来表示月度需求

这里我们假设一个月的工作日为20天,因此月度需求 m m m 可表示为20天的日度需求之和,即:
M = ∑ i = 1 20 D i M=\sum_{i=1}^{20}D_i M=i=1∑20Di

接下来,我们需要推导月度需求 m m m 的均值和标准差。

1.1. 月度需求的均值 μ M \mu_M μM

假设一个月按20天计算,则月度需求的均值为日度需求均值的20倍:
μ M = 20 μ d \mu_M=20\mu_d μM=20μd

1.2. 月度需求的标准差 σ m \sigma_m σm

月度需求的标准差为:
σ M = 20 σ D 2 = 20 σ D \sigma_M=\sqrt{20\sigma_D^2}=\sqrt{20}\sigma_D σM=20σD2 =20 σD

1.3. 相互转换:

  • 已知日度需求的均值 μ D \mu_D μD 和标准差 σ D \sigma_D σD,可以直接计算出月度需求的均值 μ m \mu_m μm 和标准差 σ M \sigma_M σM;
  • 反之,若已知月度需求的均值 μ M \mu_M μM 和标准差 σ M \sigma_M σM,也可以反推出日度需求的均值和标准差:
    μ D = μ M 20 \mu_D=\frac{\mu_M}{20} μD=20μM
    σ D = σ M 20 \sigma_D=\frac{\sigma_M}{\sqrt{20}} σD=20 σM

这一转换逻辑可以推广到任意时间尺度 的需求聚合计算中。

一般来说,若将 n n n 个时间周期的需求进行聚合,得到的聚合需求仍服从正态分布,其均值和标准差满足以下公式:
μ a g g = n μ D \mu_{agg}=n\mu_D μagg=nμD
σ a g g = n σ D \sigma_{agg}=\sqrt{n}\sigma_D σagg=n σD

其中, μ a g g \mu_{agg} μagg 表示聚合后的需求均值, σ a g g \sigma_{agg} σagg 表示聚合后的需求标准差。

并非所有需求的分布都是正态分布,计算的时间粒度越小,则越有可能不是正态分布,此时可以使用大数定律,将数据叠加通常就符合正态分布了。比如日需求可能不符合正态分布,但是周需求基本就符合正态分布了。

2. 变异系数

变异系数是用于衡量数据的离散程度 的指标。其最基础的定义为:变异系数等于随机变量的标准差与其均值的比值

变异系数常被用于对比不同对象的离散特性,例如两种不同产品的需求波动情况。通过比较二者的变异系数,能够判断它们的特征相似或差异程度。

2.1. 不同时间尺度下随机变量的离散特征。

假设月度随机变量 m m m 服从正态分布,均值 μ M = 20 \mu_M=20 μM=20,标准差 σ M = 10 \sigma_M=10 σM=10。

根据上述换算公式,对应的日度随机变量 D D D 服从正态分布,其均值与标准差分别为:
μ D = 20 20 = 1 \mu_D=\frac{20}{20}=1 μD=2020=1
σ D = 10 20 ≈ 2.24 \sigma_D=\frac{10}{\sqrt{20}}\approx2.24 σD=20 10≈2.24

分别计算月度和日度随机变量的变异系数:

  1. 月度随机变量的变异系数
    C V M = σ M μ M = 10 20 = 0.5 CV_M=\frac{\sigma_M}{\mu_M}=\frac{10}{20}=0.5 CVM=μMσM=2010=0.5
  2. 日度随机变量的变异系数
    C V D = σ D μ D = 2.24 1 = 2.24 CV_D=\frac{\sigma_D}{\mu_D}=\frac{2.24}{1}=2.24 CVD=μDσD=12.24=2.24

日度需求随机变量与月度需求随机变量的变异系数存在显著差异

二者描述的是同一类需求,仅是时间尺度不同------日度需求是月度需求的分解,月度需求是日度需求的聚合,但是差距巨大。

本质原因:不同时间尺度下需求的波动性存在差异 。日度需求的波动程度远高于月度需求,这种现象可被称为时间聚合效应

月度随机变量是对20个日度随机变量的聚合,在求和过程中,单日需求的高峰与低谷会相互抵消 ,使得月度需求的稳定性显著提升;而单日需求缺乏这种抵消效应,因此波动性更大。

这也提示我们:在分析变异系数时,必须明确其对应的时间尺度,这是解读数据离散程度的关键前提。

变异系数也常被用作判断随机变量稳定性的指标。

经验法则:当变异系数小于0.5时,认为该产品的需求处于稳定状态

强调:这一稳定性判断标准有明确的时间尺度前提 。它绝不适用于日度随机变量的分析,而是针对月度随机变量提出的经验规则。

大数定律开始起作用了。

上一篇: 2. 供应链管理的核心难点与有效前沿衡量体系

下一篇: 4. 供应链与工业工程中的库存核算

关注本专栏,第一时间获取干货博文

相关推荐
CryptoPP2 小时前
对接API库 获取印度股票历史数据
金融·数据挖掘·数据分析·区块链
rgb2gray2 小时前
论文深度解析:基于大语言模型的城市公园多维度感知解码与公平性提升
大数据·人工智能·机器学习·语言模型·自然语言处理·数据分析·可解释
少林码僧17 小时前
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤
人工智能·ai·数据分析·大模型
SelectDB17 小时前
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验
数据库·数据分析·apache
沐墨染1 天前
敏感词智能检索前端组件设计:树形组织过滤与多维数据分析
前端·javascript·vue.js·ui·数据挖掘·数据分析
YangYang9YangYan1 天前
2026大专计算机专业学数据分析的实用性与前景分析
数据挖掘·数据分析
Carl_奕然1 天前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
数据智研2 天前
【数据分享】(2005–2016年)基于水资源承载力的华北地区降水与地下水要素数据
大数据·人工智能·信息可视化·数据分析
UrbanJazzerati2 天前
解码数据分布:茎叶图和箱形图初学者指南
面试·数据分析