似然函数与概率密度函数的区别

我叫杨傲天2024-05-24 15:53

似然函数（Likelihood function）是统计学中一个核心概念，用于量化观测数据在给定模型参数下的可能性。它是概率论框架在统计推断中的逆向应用。具体来说，如果有一个概率模型，其中参数为θ，而我们观测到了一些数据D，似然函数L(θ|D)定义为在参数θ下观测数据D出现的概率（或者对于离散情况，是概率质量函数；对于连续情况，则是概率密度函数）：

L(θ|D) = P(D|θ)

这里，P(D|θ) 表示在参数θ下数据集D的联合概率分布。需要注意的是，似然函数是参数θ的函数，它衡量的是根据观测数据，模型参数θ有多大的合理性或"似然性"。换句话说，似然函数表达了数据给定（固定）时，不同参数值的适应程度。

似然函数与概率密度函数（Probability Density Function, PDF）有密切的关系，实际上两者在数学形式上可能相同，但它们有着不同的解释和用途。概率密度函数是关于随机变量的函数，描述的是在给定参数下，随机变量取某个值或处于某个区间内的相对可能性；而似然函数则是固定了观测值后，关于参数的函数，它关注的是在观测到的数据下，模型参数取不同值的合理性。

似然函数的一个典型应用是在最大似然估计（Maximum Likelihood Estimation, MLE）中，通过寻找使似然函数达到最大值的参数估计值，以此来确定数据生成过程最有可能的参数设置。简单来说，最大似然估计选择那个能使观测数据看起来最"自然"或"最可能"的参数值。