似然函数:事件A的发生含着有许多其它事件的发生。所以我就把这些其它事件发生的联合概率来作为事件A的概率,也就是似然函数。数据类型的不同(离散型和连续性)就有不同的似然函数
极大似然极大似然估计方法(Maximum Likelihood Estimate,MLE):那就是让这个似然函数的最大,目的是解决模型已定,参数未知的问题
可以发现,机器学习本身也是一种由数据(有标签或无标签)推测模型的过程,与极大似然估计十分类似。粗糙点说,极大似然的概率密度函数就像是机器学习的算法,要用偏导求得的参数就相当于机器学习里的参数(不是超参数,虽然有些算法只有超参数,这是一个大概的理解