引言
很早以前就学过这个概念,但是一直对这个定义抱有疑问:
为什似然函数是用乘积的方式进行构建?
在似然函数的定义中说似然函数是联合概率密度函数,联合概率密度函数就是要区分连续型和非连续型,为什么用联合概率密度函数定义似然函数,又给了他超越定义(连续或者离散)的统一形式呢(乘积)?
理解似然函数、最大似然函数前提知识:
1.概率函数VS.概率密度函数
2.联合概率密度VS.联合概率
|----------------|---------|---------------------------------------------------------------------------|--------|
| | 适用对象 | 含义 | |
| 概率函数P(x) | 离散型随机变量 | 概率函数用于描述离散型随机变量取某个特定值的概率。 | 联合概率 |
| 概率密度函数f(x) | 连续性随机变量 | 概率密度函数用于描述连续型随机变量在某个区间内取值的概率,它不是某个点的概率(连续型随机变量在某一点的概率为),而是通过积分来计算某一区间的概率。 | 联合概率密度 |
接下来说明
似然函数的概率:
就是说,存在一个来自X中的样本x1,,,,,Xn,通过计算它们的连乘L(θ)可以得到它们的联合概率密度函数,称之为似然函数。
似然函数的作用:
- 似然函数的一个主要作用是进行参数估计。通过寻找使似然函数达到最大值的参数值,我们可以得到参数的最大似然估计(Maximum Likelihood Estimation,MLE)。
- 似然函数可用于比较不同的统计模型。对于给定的数据集,我们可以计算不同模型下的似然值。例如,比较线性回归模型和多项式回归模型对同一组数据的拟合程度,我们可以分别计算两个模型下的似然函数值。
回答前面两个问题:
实际上是一个问题,如果不说是联合概率密度函数,就不会问为什么是连乘。
简单来说,就是说联合概率密度函数没有什么问题,是我理解的狭义了,积分用于计算概率(涉及区域),连乘用于构建似然函数(基于独立同分布样本的联合概率密度 / 概率)。这两种计算方式是根据不同的应用场景来使用的。
这些样本是独立同分布的(i.i.d),根据独立事件概率的乘法规则,样本的联合概率:
最大似然函数就比较好理解了,就是找到一个参数θ,使得的概率值最大。