在AdaBoost中，分类错误的样本的权重会增大

正义的彬彬侠2024-11-03 21:12

在AdaBoost中，分类错误的样本的权重会增大，这是AdaBoost的核心机制之一。

具体原因与过程

在每一轮迭代中，AdaBoost会根据当前弱分类器的表现，调整每个样本的权重：

分类错误的样本：若某个样本被当前弱分类器错误分类，AdaBoost会增大该样本的权重，以便在下一轮训练中引起弱分类器的更多关注。
分类正确的样本：若某个样本被正确分类，AdaBoost会降低该样本的权重，因为它已经被正确分类，不需要弱分类器过多关注。

数学表达

在第 t t t 轮迭代中，样本 i i i 的权重更新公式为：
w t + 1 , i = w t , i ⋅ exp ⁡ ( − α t y i G t ( x i ) ) Z t w_{t+1,i} = \frac{w_{t,i} \cdot \exp(-\alpha_t y_i G_t(x_i))}{Z_t} wt+1,i=Ztwt,i⋅exp(−αtyiGt(xi))

其中：

G t ( x i ) G_t(x_i) Gt(xi) 是当前弱分类器的预测结果。
y i y_i yi 是样本的真实标签。
α t \alpha_t αt 是该轮弱分类器的权重，表示分类器的"强度"。

在此公式中：

如果 G t ( x i ) ≠ y i G_t(x_i) \neq y_i Gt(xi)=yi（即分类错误），则 exp ⁡ ( − α t y i G t ( x i ) ) \exp(-\alpha_t y_i G_t(x_i)) exp(−αtyiGt(xi)) 会变成一个大于1的数，这会增大 w t + 1 , i w_{t+1,i} wt+1,i。
如果 G t ( x i ) = y i G_t(x_i) = y_i Gt(xi)=yi（即分类正确），则 exp ⁡ ( − α t y i G t ( x i ) ) \exp(-\alpha_t y_i G_t(x_i)) exp(−αtyiGt(xi)) 会变成一个小于1的数，这会减小 w t + 1 , i w_{t+1,i} wt+1,i。

效果

通过这种权重调整机制，AdaBoost在每一轮迭代中都会让后续的弱分类器更关注被前一轮错分的样本，从而逐步提高整个分类器对这些"难分样本"的识别能力。这也是为什么AdaBoost能够提高整体分类精度的原因。