5. 制造过程随机建模的解析概率模型：核心理论与典型分布

在制造过程的随机过程分析中，将离散的直方图特征转化为解析概率模型是实现过程量化分析、工程决策的核心步骤。

解析概率模型以连续概率分布为基础，通过期望算子提取分布的核心特征参数，定义了制造过程纯随机效应的母体概率分布，成为统计过程控制与试验设计的理论基础。

本文将系统阐述制造过程随机建模的解析概率模型核心理论，包括母体概率分布、期望算子、平稳/非平稳随机过程的界定，同时详细介绍制造工程中最常用的均匀分布与正态分布模型，以及非标准正态分布的标准化转化方法，为制造过程随机效应的精准建模提供完整的解析框架。

一、解析概率模型的核心基础：母体概率分布

解析概率模型的建立，以母体概率分布（Parent Probability Distribution） 为核心假设------制造过程的纯随机输出由一个潜在的、连续的概率规律所支配，这一规律即为母体概率分布，过程的每一次测量都是对该分布的随机抽样。

对于输出为连续随机变量 x x x的制造随机过程，其母体概率分布由概率分布函数 p ( x ) p(x) p(x)（概率密度函数）定义，该函数表征了随机变量在某一区间内取值的概率密度，是描述过程随机行为的根本模型。需要明确的是，实际工程中我们无法精准获取真实的母体概率分布，只能通过样本数据对其进行近似估计，而解析概率模型的价值，正是为这种近似提供标准化的数学框架。

制造过程的随机变量分为连续型 与离散型两类，解析概率模型也对应分为两种形式：

连续型概率模型：适用于描述产品几何尺寸、硬度、电性能等连续变化的过程输出，是制造过程随机建模的主流形式，也是本文的核心研究对象；
离散型概率模型：适用于描述缺陷数、不合格品数等离散的过程输出，将在半导体加工等缺陷分析场景中应用。

在连续型解析概率模型中，概率分布函数 p ( x ) p(x) p(x)与累积概率函数 P ( x ) P(x) P(x)是两个核心概念，二者通过微分与积分相互转化： p ( x ) = d P ( x ) d x p(x)=\frac{dP(x)}{dx} p(x)=dxdP(x)， P ( x 0 ) = ∫ − ∞ x 0 p ( x ) d x P(x_0)=\int_{-\infty}^{x_0}p(x)dx P(x0)=∫−∞x0p(x)dx。在实际建模中，概率分布函数因能直观反映随机变量的分布形态、便于特征参数提取，成为解析概率模型的主要研究对象。

二、解析概率模型的核心工具：期望算子

期望算子（Expectation Operator） 是从概率分布函数中提取理论特征参数的核心数学工具，通过对随机变量及其函数的积分运算，可推导出能表征母体概率分布核心特征的标量参数，如均值、方差等，是连接概率分布与工程实际应用的关键。

2.1 随机变量的数学期望

对于连续型随机变量 x x x，其数学期望（理论均值）是期望算子对变量本身的积分运算，代表随机变量的最可能取值 ，也是母体概率分布的中心位置特征，其数学定义为：
E [ x ] = ∫ − ∞ + ∞ x ⋅ p ( x ) d x E[x]=\int_{-\infty}^{+\infty}x\cdot p(x)dx E[x]=∫−∞+∞x⋅p(x)dx

若制造过程的输出为随时间变化的随机变量 x ( t ) x(t) x(t)，则其期望为 E [ x ( t ) ] = ∫ − ∞ + ∞ x ( t ) ⋅ p ( x , t ) d x E[x(t)]=\int_{-\infty}^{+\infty}x(t)\cdot p(x,t)dx E[x(t)]=∫−∞+∞x(t)⋅p(x,t)dx，此时概率分布函数 p ( x , t ) p(x,t) p(x,t)可能随时间 t t t变化，对应的数学期望也为时间的函数。

2.2 平稳与非平稳随机过程的界定

根据概率分布函数是否随时间变化，制造过程的随机过程可分为平稳随机过程 与非平稳随机过程，这一界定是制造过程解析概率建模的重要前提：

非平稳随机过程 ：概率分布函数 p ( x , t ) p(x,t) p(x,t)随时间变化，数学期望 E [ x ( t ) ] E[x(t)] E[x(t)]为时间的函数，意味着过程的随机变异特征随时间改变。这类过程在制造中不受欢迎，因其表明过程存在未识别的扰动，难以控制和分析；
平稳随机过程 ：概率分布函数与时间无关，即 p ( x , t ) = p ( x ) p(x,t)=p(x) p(x,t)=p(x)，数学期望 E [ x ] E[x] E[x]为常数，代表过程的随机变异特征在时间维度上保持稳定。这是制造过程解析概率建模的基本假设，也是统计过程控制的前提条件。

本文后续所有解析模型均基于平稳随机过程假设展开。

2.3 随机变量函数的数学期望

期望算子可拓展至随机变量的任意函数，若 g ( x ) g(x) g(x)为平稳随机变量 x x x的函数，则其数学期望为：
E [ g ( x ) ] = ∫ − ∞ + ∞ g ( x ) ⋅ p ( x ) d x E[g(x)]=\int_{-\infty}^{+\infty}g(x)\cdot p(x)dx E[g(x)]=∫−∞+∞g(x)⋅p(x)dx

这一拓展形式为推导母体概率分布的方差、偏度、峰度等高阶特征参数提供了通用方法，是解析概率模型的重要数学基础。

2.4 理论方差的定义与推导

方差是表征随机变量波动程度 的核心参数，其本质是随机变量偏离数学期望的平方的数学期望。令 g ( x ) = ( x − E [ x ] ) 2 g(x)=(x-E[x])^2 g(x)=(x−E[x])2，代入随机变量函数的期望公式，可得母体概率分布的理论方差 定义：
σ x 2 = V a r ( x ) = E [ ( x − E [ x ] ) 2 ] = ∫ − ∞ + ∞ ( x − E [ x ] ) 2 ⋅ p ( x ) d x \sigma_x^2=Var(x)=E[(x-E[x])^2]=\int_{-\infty}^{+\infty}(x-E[x])^2\cdot p(x)dx σx2=Var(x)=E[(x−E[x])2]=∫−∞+∞(x−E[x])2⋅p(x)dx

对于平稳随机过程，理论方差 σ x 2 \sigma_x^2 σx2为常数。方差还可通过简便公式推导： V a r ( x ) = E [ x 2 ] − ( E [ x ] ) 2 Var(x)=E[x^2]-(E[x])^2 Var(x)=E[x2]−(E[x])2，其中 E [ x 2 ] = ∫ − ∞ + ∞ x 2 ⋅ p ( x ) d x E[x^2]=\int_{-\infty}^{+\infty}x^2\cdot p(x)dx E[x2]=∫−∞+∞x2⋅p(x)dx，该公式大幅简化了方差的计算过程。

数学期望与方差共同构成了解析概率模型的核心特征参数 ，分别描述了制造过程随机输出的中心位置 与波动范围，是后续过程分析、质量判定的关键量化指标。

三、制造过程的典型解析概率分布模型

在制造工程的平稳随机过程建模中，均匀分布 与正态分布是最常用的两类解析概率分布模型，二者分别适用于不同的随机变异特征场景，其中正态分布因与多数制造过程的随机效应特征高度契合，成为应用最广泛的核心模型。

3.1 均匀分布

均匀分布表征随机变量在某一有限区间 [ x 1 , x 2 ] [x_1,x_2] [x1,x2]内等概率取值的随机特征，即随机变量在区间内任意位置的概率密度均为常数，区间外的概率密度为0，是制造过程中少数均匀变异场景的理想模型。

3.1.1 概率密度函数

设均匀分布的取值区间为 [ x 1 , x 2 ] [x_1,x_2] [x1,x2]，区间长度 r = x 2 − x 1 r=x_2-x_1 r=x2−x1，根据概率密度函数的归一性 （全域积分等于1），其概率密度函数为：
p ( x ) = { 1 r , x 1 ≤ x ≤ x 2 0 , 其他 p(x)= \begin{cases} \frac{1}{r}, & x_1\leq x\leq x_2 \\ 0, & \text{其他} \end{cases} p(x)={r1,0,x1≤x≤x2其他

3.1.2 核心特征参数

基于期望算子可推导出均匀分布的理论均值与方差，均由区间边界唯一确定：

理论均值： E [ x ] = x 1 + x 2 2 E[x]=\frac{x_1+x_2}{2} E[x]=2x1+x2
理论方差： V a r ( x ) = r 2 12 = ( x 2 − x 1 ) 2 12 Var(x)=\frac{r^2}{12}=\frac{(x_2-x_1)^2}{12} Var(x)=12r2=12(x2−x1)2

均匀分布的特征参数无额外可调项，仅由取值区间决定，工程应用中适用于如均匀误差、等概率抽样等简单随机场景。

3.2 正态分布

正态分布（高斯分布）是连续型随机变量的经典分布，其概率密度函数为钟形曲线，具有关于均值对称、中间高两侧低 的特征，与制造过程消除确定性效应后，纯随机输出的"中心聚集、两侧衰减"特征高度匹配，是注塑、车削、热成型等绝大多数制造过程的核心解析概率模型。

3.2.1 概率密度函数

正态分布的概率密度函数由**理论均值 μ \mu μ与理论方差 σ 2 \sigma^2 σ2**两个参数唯一确定，其数学形式为：
p ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 p(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} p(x)=σ2π 1e−2σ2(x−μ)2

其中， μ = E [ x ] \mu=E[x] μ=E[x]为分布的中心位置，决定了曲线的平移； σ = V a r ( x ) \sigma=\sqrt{Var(x)} σ=Var(x) 为标准差，决定了曲线的陡峭程度------ σ \sigma σ越小，曲线越陡峭，随机变量的波动越小，反之则波动越大。

这一特性使正态分布的工程应用性极强：只需通过样本数据估计出 μ \mu μ与 σ 2 \sigma^2 σ2两个参数，即可完全确定整个概率分布模型，实现对制造过程随机效应的精准表征。

3.2.2 核心分布特征

正态分布具有两个对制造工程至关重要的特征：

3σ准则 ：随机变量在 [ μ − 3 σ , μ + 3 σ ] [\mu-3\sigma,\mu+3\sigma] [μ−3σ,μ+3σ]区间内的取值概率约为99.73%，超出该区间的概率仅为0.27%，这一准则成为统计过程控制中控制限设定的核心依据；
参数唯一性 ：任意正态分布均由 μ \mu μ和 σ 2 \sigma^2 σ2唯一确定，记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2)，表示随机变量 X X X服从均值为 μ \mu μ、方差为 σ 2 \sigma^2 σ2的正态分布。

3.2.3 标准正态分布

为简化正态分布的概率计算，通过标准化变换 将一般正态分布转化为标准正态分布，即均值为0、方差为1的正态分布。

定义标准化无量纲变量 z z z，其计算公式为：
z = x − μ σ z=\frac{x-\mu}{\sigma} z=σx−μ

标准化后， z z z服从标准正态分布，记为 Z ∼ N ( 0 , 1 ) Z \sim N(0,1) Z∼N(0,1)，其概率密度函数简化为：
ϕ ( z ) = 1 2 π e − z 2 2 \phi(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} ϕ(z)=2π 1e−2z2

标准正态分布是正态分布的规范形式，其累积概率值可通过标准正态分布表直接查询，无需复杂积分计算，大幅简化了制造过程中的概率分析与工程决策。

3.2.4 累积标准正态分布

累积标准正态分布是标准正态分布概率密度函数的积分形式，表征随机变量 z z z取值小于某一数值的累积概率，其数学形式为：
Φ ( z ) = ∫ − ∞ z ϕ ( t ) d t = 1 2 π ∫ − ∞ z e − t 2 2 d t \Phi(z)=\int_{-\infty}^{z}\phi(t)dt=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{z}e^{-\frac{t^2}{2}}dt Φ(z)=∫−∞zϕ(t)dt=2π 1∫−∞ze−2t2dt

其曲线为经典的S型曲线，与累积频率直方图的特征高度一致，是快速查询制造过程输出在某一范围内取值概率的重要工具。

四、解析概率模型的建模流程与工程应用

制造过程解析概率模型的建立遵循**"数据预处理→分布识别→参数估计→模型验证"**的标准化流程，其核心是将制造过程的纯随机输出数据与解析概率分布进行匹配，最终实现对过程的量化分析与预测。

4.1 标准化建模流程

固定加工条件，

消除所有确定性效应，

获得纯随机输出数据
绘制频率/累积频率直方图，

识别随机分布形态特征
根据直方图特征选择

解析概率分布（正态/均匀）
通过期望算子推导模型

特征参数（均值/方差）
验证模型与样本数据的

拟合度，用于工程决策

4.2 核心工程应用

解析概率模型作为制造过程随机建模的核心理论，是后续所有统计分析与工程决策的基础，其主要应用场景包括：

样本统计量估计：基于母体概率分布的理论均值与方差，推导样本均值、样本方差等样本统计量的特征，为样本数据的分析提供理论依据；
统计过程控制（SPC）：基于正态分布的3σ准则设定过程控制限，判断过程是否处于统计稳定状态，及时识别过程中的异常扰动；
过程能力分析 ：通过正态分布模型计算过程能力指数 C p C_p Cp、 C p k C_{pk} Cpk，量化过程满足产品质量标准的能力；
试验设计与参数优化：在正交试验、响应面试验中，基于解析概率模型量化随机误差的影响，精准识别可控输入对过程输出的显著效应；
质量可靠性分析：通过累积概率函数计算过程输出满足质量标准的概率，开展产品质量的可靠性预测与管控。

五、总结

解析概率模型是制造过程随机过程分析的核心理论框架 ，其以平稳随机过程 为基本假设，以母体概率分布 为核心基础，通过期望算子提取均值、方差等核心特征参数，实现了对制造过程纯随机效应的精准数学表征。在制造工程中，均匀分布与正态分布是最常用的解析概率模型，其中正态分布因与多数制造过程的随机变异特征高度契合，成为统计过程控制与工程决策的核心工具，而标准正态分布的标准化变换则大幅简化了实际工程中的概率计算。

需要明确的是，解析概率模型是对制造过程潜在母体概率分布的标准化近似 ，实际工程中需通过样本数据对模型参数进行估计与验证。但这一模型的建立，成功将制造过程中原本无规律的随机噪声数据转化为可量化、可预测、可决策的数学工具，规避了不同制造过程内部机制的复杂性，为注塑、车削、热成型等各类制造过程的随机效应分析提供了统一的标准化框架，是现代制造质量管控与过程优化的重要理论基础。

上一篇: 4. 制造过程数据的概率建模与随机效应分析

下一篇: 6. 基于概率分布函数的置信区间分析与正态分布区间概率计算