01绪论
(1)机器学习基本分类:
- 监督学习(有标签)
- 半监督学习(部分标签,找数据结构)
- 无监督学习(无标签,找数据结构)
- 强化学习(不断交互,根据反馈调整策略)
(2)机器学习根据预测任务不同的分类:
- 分类问题
- 回归问题
- 标注问题
(3)相关名词:
- 输入空间:所有可能输入值的集合;
- 输出空间:所有可能输出值的集合;
- 实例:个体
- 特征向量:用于表示样本;
- 特征空间:特征向量存在的空间;
- 训练数据:用于训练模型;
- 测试数据:用于测试模型对未知数据的作用;
- 样本:具体的输入实例;
- 假设空间:所有可能的模型集合;
(4)机器学习按模型分类:
- 概率(朴素贝叶斯模型)与非概率模型(SVM)
- 线性(线性回归模型)与非线性模型(神经网络模型)
- 参数化(线性回归模型)与非参数化模型(核函数估计)
javascript
// An highlighted block
在机器学习中,"输入空间"是指所有可能输入值的集合,"输出空间"则是所有可能输出值的集合。每一个具体的输入实例被称为一个"样本",并由特征向量来表示。这些特征向量存在的空间称为"特征空间"。训练数据和测试数据都是样本的集合,用于训练和评估模型的性能。其中,训练数据用于训练模型,而测试数据用于测试模型对未知数据的预测能力。
此外,"假设空间"是机器学习中的另一个关键概念,它指的是所有可能模型的集合,包括模型的结构、参数等所有可以改变的部分。在监督学习中,我们会从假设空间中选取最优模型,使其能够最好地拟合训练数据*