Neyman因子分解定理

内容来源
数理统计学导论(原书第7版) 机械工业出版社


因为要计算统计量的 p d f pdf pdf ,一般情况下,用定义直接验证一个统计量的充分性是困难的。

幸运的是,有一个判别充分统计量的充要条件: N e y m a n Neyman Neyman 因子分解定理

定理

设 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 是来自分布 f ( x ; θ ) f(x;\theta) f(x;θ) 的随机样本

统计量 Y 1 = u 1 ( X 1 , X 2 , ⋯   , X n ) Y_1=u_1(X_1,X_2,\cdots,X_n) Y1=u1(X1,X2,⋯,Xn) 是 θ \theta θ 的一个充分统计量的充要条件为:

存在两个非负函数 k 1 , k 2 k_1,k_2 k1,k2 ,使得

f ( x 1 , x 2 , ⋯   , x n ; θ ) = k 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] k 2 ( x 1 , x 2 , ⋯   , x n ) f(x_1,x_2,\cdots,x_n;\theta)=k_1[u_1(x_1,x_2,\cdots,x_n);\theta] k_2(x_1,x_2,\cdots,x_n) f(x1,x2,⋯,xn;θ)=k1[u1(x1,x2,⋯,xn);θ]k2(x1,x2,⋯,xn)

其中 k 2 k_2 k2 不依赖于 θ \theta θ

证明

假定因子分解成立

做一一变换

y 1 = u 1 ( x 1 , x 2 , ⋯   , x n ) y 2 = u 2 ( x 1 , x 2 , ⋯   , x n ) ⋮ y n = u n ( x 1 , x 2 , ⋯   , x n ) y_1=u_1(x_1,x_2,\cdots,x_n)\\ y_2=u_2(x_1,x_2,\cdots,x_n)\\ \vdots\\ y_n=u_n(x_1,x_2,\cdots,x_n)\\ y1=u1(x1,x2,⋯,xn)y2=u2(x1,x2,⋯,xn)⋮yn=un(x1,x2,⋯,xn)

它们的逆函数为

x 1 = w 1 ( y 1 , y 2 , ⋯   , y n ) x 2 = w 2 ( y 1 , y 2 , ⋯   , y n ) ⋮ x 3 = w 3 ( y 1 , y 2 , ⋯   , y n ) x_1=w_1(y_1,y_2,\cdots,y_n)\\ x_2=w_2(y_1,y_2,\cdots,y_n)\\ \vdots\\ x_3=w_3(y_1,y_2,\cdots,y_n)\\ x1=w1(y1,y2,⋯,yn)x2=w2(y1,y2,⋯,yn)⋮x3=w3(y1,y2,⋯,yn)

对应的雅可比行列式为 J J J

这个一一变换的作用跟画辅助线差不多,没什么特殊要求,怎么简单就怎么构造

于是,统计量 Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,⋯,Yn 的 p d f pdf pdf 为

g ( y 1 , y 2 , ⋯   , y n ; θ ) = f ( w 1 , w 2 , ⋯   , w n ; θ ) ∣ J ∣ = k 1 ( y 1 ; θ ) k 2 ( w 1 , w 2 , ⋯   , w n ) ∣ J ∣ \begin{align*} g(y_1,y_2,\cdots,y_n;\theta)&=f(w_1,w_2,\cdots,w_n;\theta)|J|\\ &=k_1(y_1;\theta)k_2(w_1,w_2,\cdots,w_n)|J| \end{align*} g(y1,y2,⋯,yn;θ)=f(w1,w2,⋯,wn;θ)∣J∣=k1(y1;θ)k2(w1,w2,⋯,wn)∣J∣

那么

f Y 1 ( y 1 ; θ ) = ∫ ⋯ ∫ g ( y 1 , y 2 , ⋯   , y n ; θ ) d y 2 ⋯ d y n = k 1 ( y 1 ; θ ) ∫ ⋯ ∫ ∣ J ∣ k 2 ( w 1 , w 2 , ⋯   , w n ) d y 2 ⋯ d y n \begin{align*} f_{Y_1}(y_1;\theta)&=\int\cdots\int g(y_1,y_2,\cdots,y_n;\theta) \mathrm{d}y_2\cdots\mathrm{d}y_n\\ &=k_1(y_1;\theta)\int\cdots\int|J|k_2(w_1,w_2,\cdots,w_n) \mathrm{d}y_2\cdots\mathrm{d}y_n \end{align*} fY1(y1;θ)=∫⋯∫g(y1,y2,⋯,yn;θ)dy2⋯dyn=k1(y1;θ)∫⋯∫∣J∣k2(w1,w2,⋯,wn)dy2⋯dyn

上式中的积分不是不定积分,积分区域应该是 y 2 y_2 y2 到 y n y_n yn 各自的定义域,不知道怎么表示就在这里提一下

上式右端, k 2 k_2 k2 不依赖于 θ \theta θ ,雅可比行列式 J J J 和积分也不涉及 θ \theta θ 。因此,上式右端的 n − 1 n-1 n−1 重积分仅仅是 y 1 y_1 y1 的函数,表示为 m ( y 1 ) m(y_1) m(y1) 。而且是非负的

那么

f Y 1 ( y 1 ; θ ) = k 1 ( y 1 ; θ ) m ( y 1 ) f_{Y_1}(y_1;\theta)=k_1(y_1;\theta)m(y_1) fY1(y1;θ)=k1(y1;θ)m(y1)

若 m ( y 1 ) = 0 m(y_1)=0 m(y1)=0 ,则 f Y 1 ( y 1 ; θ ) = 0 f_{Y_1}(y_1;\theta)=0 fY1(y1;θ)=0

若 m ( y 1 ) > 0 m(y_1)>0 m(y1)>0 ,则

k 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] = f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k_1[u_1(x_1,x_2,\cdots,x_n);\theta]=\frac {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]} {m[u_1(x_1,x_2,\cdots,x_n)]} k1[u1(x1,x2,⋯,xn);θ]=m[u1(x1,x2,⋯,xn)]fY1[u1(x1,x2,⋯,xn);θ]

将 k 1 k_1 k1 带入因子分解中,得

f ( x 1 , x 2 , ⋯   , x n ; θ ) = f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k 2 ( x 1 , x 2 , ⋯   , x n ) f(x_1,x_2,\cdots,x_n;\theta)=\frac {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]} {m[u_1(x_1,x_2,\cdots,x_n)]}k_2(x_1,x_2,\cdots,x_n) f(x1,x2,⋯,xn;θ)=m[u1(x1,x2,⋯,xn)]fY1[u1(x1,x2,⋯,xn);θ]k2(x1,x2,⋯,xn)

f ( x 1 , x 2 , ⋯   , x n ; θ ) f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] = m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k 2 ( x 1 , x 2 , ⋯   , x n ) \frac{f(x_1,x_2,\cdots,x_n;\theta)} {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]}= \frac{m[u_1(x_1,x_2,\cdots,x_n)]}{k_2(x_1,x_2,\cdots,x_n)} fY1[u1(x1,x2,⋯,xn);θ]f(x1,x2,⋯,xn;θ)=k2(x1,x2,⋯,xn)m[u1(x1,x2,⋯,xn)]

根据定义, Y 1 Y_1 Y1 是参数 θ \theta θ 的充分统计量

反之,如果 Y 1 Y_1 Y1 是 θ \theta θ 的一个充分统计量,那么通过将函数 k 1 k_1 k1 取成 Y 1 Y_1 Y1 的 p d f pdf pdf ,即可实现因子分解。这就完成了定理证明。

设 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 表示来自分布 N ( θ , σ 2 ) N(\theta,\sigma^2) N(θ,σ2) 的随机样本,方差 σ 2 \sigma^2 σ2 已知

如果 x ‾ = 1 n ∑ x i \overline{x}=\frac{1}{n}\sum x_i x=n1∑xi ,那么

∑ ( x i − θ ) 2 = ∑ [ ( x i − x ‾ ) − ( x ‾ − θ ) ] 2 = ∑ ( x i − x ‾ ) 2 + n ( x ‾ − θ ) 2 \sum(x_i-\theta)^2=\sum[(x_i-\overline{x})-(\overline{x}-\theta)]^2= \sum(x_i-\overline{x})^2+n(\overline{x}-\theta)^2 ∑(xi−θ)2=∑[(xi−x)−(x−θ)]2=∑(xi−x)2+n(x−θ)2

因为

2 ∑ ( x i − x ‾ ) ( x ‾ − θ ) = 2 ( x ‾ − θ ) ∑ ( x i − x ‾ ) = 0 2\sum(x_i-\overline{x})(\overline{x}-\theta)= 2(\overline{x}-\theta)\sum(x_i-\overline{x})=0 2∑(xi−x)(x−θ)=2(x−θ)∑(xi−x)=0

所以, X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 的联合 p d f pdf pdf 就可以写成

( σ 2 π ) − n exp ⁡ [ − ∑ ( x i − θ ) 2 / 2 σ 2 ] = ( σ 2 π ) − n exp ⁡ [ − n ( x ‾ − θ ) 2 / 2 σ 2 ] exp ⁡ [ − ∑ ( x i − x ‾ ) 2 / 2 σ 2 ] \begin{align*} &(\sigma\sqrt{2\pi})^{-n}\exp\left[-\sum(x_i-\theta)^2/2\sigma^2\right]\\ &=(\sigma\sqrt{2\pi})^{-n}\exp[-n(\overline{x}-\theta)^2/2\sigma^2] \exp\left[-\sum(x_i-\overline{x})^2/2\sigma^2\right] \end{align*} (σ2π )−nexp[−∑(xi−θ)2/2σ2]=(σ2π )−nexp[−n(x−θ)2/2σ2]exp[−∑(xi−x)2/2σ2]

其中

k 1 = exp ⁡ [ − n ( x ‾ − θ ) 2 / 2 σ 2 ] , k 2 = ( σ 2 π ) − n exp ⁡ [ − ∑ ( x i − x ‾ ) 2 / 2 σ 2 ] k_1=\exp[-n(\overline{x}-\theta)^2/2\sigma^2], k_2=(\sigma\sqrt{2\pi})^{-n}\exp\left[-\sum(x_i-\overline{x})^2/2\sigma^2\right] k1=exp[−n(x−θ)2/2σ2],k2=(σ2π )−nexp[−∑(xi−x)2/2σ2]

所以,样本均值是正态分布的均值的充分统计量

相关推荐
西岸行者5 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意5 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码5 天前
嵌入式学习路线
学习
毛小茛5 天前
计算机系统概论——校验码
学习
babe小鑫5 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms5 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下5 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。5 天前
2026.2.25监控学习
学习
大江东去浪淘尽千古风流人物5 天前
【SLAM】GenRobot / IO-AI / Scale / Appen 能力对比表(机器人数据与闭环视角)
人工智能·机器学习·机器人·大模型·概率论·端侧部署·巨身智能
im_AMBER5 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode