一.初认识
1.定义
(a)Arthur Samuel的定义
在没有明确设置的情况下,使计算机具有学习能力的研究领域。(比较陈旧)
(b)Tom Mitchell的定义:
计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。(较新)
2.监督学习
定义:对于数据集中的每个样本, 想要算法预测,并得出"正确答案"
分类:
(1)回归算法
从无限多个可能的数字中,预测一个数字
(2)分类算法
从一小部分可能的输出中预测一个类别
3.无监督学习
定义:
聚类算法:
作用:被用来组织大型的计算机集群,提取相同点,合成一个类
异常检测:用于检测异常事件
降维:将大数据集压缩为小得多的数据集,同时尽可能少地丢失信息
线性回归模型
任何预测数字来解决问题,模型可以输出无限多个可能的数字
分类模型
预测类别或离散类别,在分类中,只有少数可能的输出,即存在一组离散的有限可能输出