机器学习期末复习

一、基本概念

  1. 分类、回归的概念区别

    • 分类:输出是离散的类别标签(如 "猫 / 狗""患病 / 健康");
    • 回归:输出是连续的数值(如 "房价""温度")。
  2. 训练集、验证集、测试集

    • 训练集:用于训练模型、更新参数
    • 验证集:用于调整超参数、选择模型(如选择学习率、模型结构);
    • 测试集:用于最终评估模型泛化能力(不参与任何训练过程)。
  3. 监督学习、非监督学习

    • 监督学习:数据带标签(如 "图片 + 类别"),目标是学习 "输入→标签" 的映射(如分类、回归);
    • 非监督学习:数据无标签,目标是挖掘数据内在规律(如聚类、降维)。
  4. 回归问题、分类问题

    • 回归问题:目标是预测连续值(如预测销售额);
    • 分类问题:目标是预测离散类别(如判断邮件是否为垃圾邮件)。
  5. 欠拟合、过拟合

    • 欠拟合:模型太简单,既没学好训练集,也没泛化能力(训练误差、测试误差都大);
    • 过拟合:模型太复杂,学好了训练集但记了 "噪声",测试误差远大于训练误差。
  6. 泛化 模型对未见过的新数据的预测能力,是机器学习的核心目标。

  7. 概率与频率的关系

    • 频率:多次重复实验中事件发生的比例(是统计结果);
    • 概率:事件发生的固有可能性(是理论值);
    • 关系:当实验次数足够多时,频率趋近于概率(大数定律)。
  8. 独立同分布

    • 独立:样本之间互不影响
    • 同分布:所有样本都来自同一个概率分布
    • 机器学习中通常假设训练 / 测试数据是独立同分布的。
  9. 先验概率,后验概率

    • 先验概率:未观察到数据时,某事件发生的概率(如 "患病的概率");
    • 后验概率:观察到数据后,某事件发生的概率(如 "检测阳性后患病的概率")。
  10. 朴素贝叶斯 基于贝叶斯定理的分类算法,核心假设是 "特征之间条件独立",计算后验概率实现分类。

  11. 衡量随机变量不确定性的指标:熵越大,不确定性越高。

    • 离散分布熵公式:H(X)=−∑iP(X=i)logP(X=i)。
  12. 连续分布的最大熵 在满足已知约束(如已知均值、方差)的前提下,熵最大的连续分布是正态分布(最大熵原理:不确定时选择最 "均匀" 的分布)。

  13. 回归分析法,回归方程

    • 回归分析:通过数据拟合变量间的函数关系的统计方法;
    • 回归方程:拟合得到的函数表达式(如一元线性回归方程:y^=wx+b)。
  14. 类别不平衡问题 分类任务中某类样本数量远多于 / 少于其他类(如 "正例 10 个,负例 1000 个"),会导致模型偏向多数类。

  15. 信息增益的缺陷 信息增益更偏好取值多的特征(如 "身份证号" 这类特征取值多,信息增益大,但无实际区分意义),因此决策树中常用 "信息增益率" 修正。

二、基本问题

  1. 机器学习的基本过程、三要素
  2. 最大似然估计
  3. 最小二乘法
  4. 过拟合的解决办法
  5. 决策树的基本结构
  6. 线性模型的衍生和广义线性模型
  7. LDA (线性判别分析) 的思想
  8. 多分类学习的思路
  9. 拆解法的类型
  10. 类别不平衡问题的解决思路
  11. 决策模型的基本流程
  12. 信息增益的形式
  13. 剪枝处理的基本策略
  14. 支持向量机的基本原理
  15. 集成学习主要解决的问题
  16. 神经网络的激活函数
  17. BP 神经网络的学习过程

三、基本算法

  1. 一元线性回归的基本形式和参数求解
  2. 多元线性回归的基本形式和参数求解
  3. 求解极大似然函数估计的一般步骤
  4. 描述决策树的算法流程
  5. 支持向量机的目标函数推导步骤
  6. 两层神经网络怎么解决异或问题
  7. 反向传播算法
  8. Bagging 算法过程
相关推荐
Frank学习路上16 分钟前
【AI技能】跟着费曼学自动驾驶
人工智能·机器学习·自动驾驶
bryant_meng1 小时前
【Reading Notes】(4)Favorite Articles from 2021
人工智能·深度学习·业界资讯
清空mega1 小时前
动手学深度学习——多尺度锚框
人工智能·深度学习·目标跟踪
克里斯蒂亚诺·罗纳尔达2 小时前
智能体学习16——学习与适应(Learning-and-Adaptation)-深入解读
深度学习·学习·机器学习
call me by ur name2 小时前
ERNIE 5.0 Technical Report论文解读
android·开发语言·人工智能·机器学习·ai·kotlin
冰西瓜6002 小时前
深度学习的数学原理(二十六)—— 多头注意力
人工智能·深度学习
lisw052 小时前
《计算机辅助设计与图形学学报》分析评介!
人工智能·机器学习
憨波个2 小时前
【说话人日志】从 LSTM attractor 到 Transformer attractor:EEND-TA
人工智能·深度学习·lstm·transformer·音频·语音识别
这张生成的图像能检测吗2 小时前
(论文速读)基于知识图谱构建的大型工业设备故障诊断模型
人工智能·深度学习·知识图谱·故障诊断
ccLianLian3 小时前
深度学习基础·损失函数
人工智能·深度学习