【机器学习】四、计算学习理论

1 基础知识

计算学习理论（computational learning theory）：关于通过"计算"来进行"学习"的理论，即关于机器学习的理论基础，其目的是分析学习任务的困难本质，为学习算法体统理论保证，并根据结果指导算法设计。

对于二分类问题，给定样本集

假设所有样本服从一个隐含未知的分布D DD，所有样本均独立同分布（independent and identically distributed）。

令h为样本到{ − 1 , + 1 } 上的一个映射，其泛化误差为

h在D 的经验误差为

由于D是D的独立同分布采样，因此h hh的经验误差的期望等于其泛化误差。在上下文明确时，我们将E ( h ; D ) 和E ^ ( h ; D ) 分别简记为E ( h )和E ^ ( h ) 。令ϵ为E ( h ) 的上限，即E ( h ) ≤ ϵ E(h)；我们通常用ϵ表示预先设定的学得模型所应满足的误差要求，亦称"误差参数"。

我们将研究经验误差和泛化误差之间的逼近程度；若h在数据集上的经验误差为0，则称h与D一致，否则称其不一致。对于任意两个映射h 1 , h 2 ∈ X → Y h_1,h_2，用不合（disagreement）来度量他们之间的差别：

d ( h 1 , h 2 ) = P x ∼ D ( h 1 ( x ) ≠ h 2 ( x ) )

我们将会用到几个常见的不等式：

Jensen不等式：对任意凸函数，有