机器学习笔记

绛橘色的日落(。・∀・)ノ2026-04-15 9:33

一.初认识

在没有明确设置的情况下，使计算机具有学习能力的研究领域。（比较陈旧）

（b）Tom Mitchell的定义：

计算机程序从经验E中学习，解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。（较新）

定义：对于数据集中的每个样本，想要算法预测，并得出"正确答案"

分类：

从无限多个可能的数字中，预测一个数字

从一小部分可能的输出中预测一个类别

定义：

聚类算法：

作用：被用来组织大型的计算机集群，提取相同点，合成一个类

异常检测：用于检测异常事件

降维：将大数据集压缩为小得多的数据集，同时尽可能少地丢失信息

线性回归模型

任何预测数字来解决问题，模型可以输出无限多个可能的数字

分类模型

预测类别或离散类别，在分类中，只有少数可能的输出，即存在一组离散的有限可能输出