文章参考自B站机器学习期末速成课
本文仅作者个人复习使用
一、机器学习分类
聚类和分类的区别:
分类:一开始就知道有哪些类别
聚类:一开始不知道有哪些类别
损失函数:简单来说就是你预测出来的结果和真实值的差距。
0-1损失函数:一般做二分类问题
数据特征工程,相当于对原始数据进行一定的清理和提纯。
二、逻辑回归
sigmoid函数会让输出值在0-1之间
求参数,比如w和b,一般用梯度下降算法。
三、决策树
信息熵和信息增益描述数据的混乱程度
Gini系数则是描述数据的纯度
两者都是越小越好
四、集成学习算法
五、支持向量机
两个类别边缘上的点叫支持向量
硬间隔:完全分类准确
软间隔:存在分类错误的情况
六、聚类
七、特征工程和指标