机器学习预备知识


一、机器学习应用领域

1.1 推荐系统

  • 典型案例:移动 APP 推荐功能
  • 核心方法:基于用户行为数据的协同过滤与深度学习

1.2 计算机视觉

  • 应用场景:图像分类、目标检测
  • 关键技术:卷积神经网络(CNN)

1.3 博弈决策

  • 里程碑案例:AlphaGo 围棋系统
  • 核心技术:深度强化学习与蒙特卡洛树搜索

二、核心概念体系

2.1 概念关系图谱

人工智能 机器学习 深度学习 强化学习 神经网络

2.2 关键术语解析

  • 数据集结构
食材新鲜度 火候 烹饪技术 菜肴评价
新鲜 偏大 熟练 中等
不够新鲜 适中 一般
  • 任务类型
    • 监督学习:分类(离散值)、回归(连续值)
    • 无监督学习:聚类、降维

三、机器学习三要素

3.1 模型架构

F = { f ∣ Y = f ( X ) } 或 F = { P ∣ P ( Y ∣ X ) } \mathcal{F}=\{f\mid Y=f(X)\} \quad \text{或} \quad \mathcal{F}=\{P\mid P(Y\mid X)\} F={f∣Y=f(X)}或F={P∣P(Y∣X)}

3.2 优化策略

损失函数公式:
L = 1 N ∑ i = 1 N L ( y i , f ( x i ) ) + λ J ( f ) L = \frac{1}{N}\sum_{i=1}^N L(y_i, f(x_i)) + \lambda J(f) L=N1i=1∑NL(yi,f(xi))+λJ(f)

3.3 求解算法

  • 梯度下降法
  • 牛顿法
  • 拟牛顿法

四、性能评估体系

4.1 分类指标

混淆矩阵示例

预测正 预测负
实际正 TP=70 FN=25
实际负 FP=15 TN=50

核心指标

  • 准确率:
  • 精确率:
  • 召回率:

4.2 回归指标

指标 公式
MAE 1 n ∑ y i − y ^ i \frac{1}{n}\sum y_i-\hat{y}_i n1∑yi−y^i
MSE 1 n ∑ ( y i − y ^ i ) 2 \frac{1}{n}\sum(y_i-\hat{y}_i)^2 n1∑(yi−y^i)2
1 − S S r e s S S t o t 1-\frac{SS_{res}}{SS_{tot}} 1−SStotSSres

五、编程实践

5.1 NumPy 基础

python 复制代码
import numpy as np
arr = np.array([1,2,3])
print(arr.dtype)  # 输出:int32

5.2 sklearn 建模

python 复制代码
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression

X, y = load_iris(return_X_y=True)
model = LogisticRegression().fit(X, y)
print(model.predict(X[:2]))  # 样本预测

六、实战练习

6.1 手动计算题

给定测试集与预测结果:

python 复制代码
y_test = [1,1,0,1,0,0,1,0,1,0,1,0,1,0,1,0,1,1,0,0,1,0,1,1,1,0,0,0,1,0]
y_pred = [1,0,1,1,0,1,1,0,1,0,0,0,1,0,1,0,1,1,0,1,1,1,1,1,1,0,1,0,1,1]

计算步骤

  1. 构建混淆矩阵
  2. 计算 Accuracy/Precision/Recall
  3. 推导 F 1 Score
  4. 估算 AUC 值

6.2 代码验证

python 复制代码
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

print(f"Accuracy: {accuracy_score(y_test, y_pred):.2f}")
print(f"AUC: {roc_auc_score(y_test, y_pred):.2f}")

七、延伸思考

  • 如何解决过拟合问题?
  • 特征工程对模型性能的影响
  • 不同优化算法的适用场景

附录 :机器学习发展历程时间轴

1950 s:图灵测试提出 → 1980 s:反向传播算法 → 2012:AlexNet 突破 → 2016:AlphaGo 里程碑


相关推荐
草莓熊Lotso32 分钟前
C++ STL map 系列全方位解析:从基础使用到实战进阶
java·开发语言·c++·人工智能·经验分享·网络协议·everything
zyplayer-doc37 分钟前
升级表格编辑器,AI客服应用支持转人工客服,AI问答风格与性能优化,zyplayer-doc 2.5.6 发布啦!
人工智能·编辑器·飞书·开源软件·创业创新·有道云笔记
~~李木子~~4 小时前
中文垃圾短信分类实验报告
人工智能·分类·数据挖掘
TsingtaoAI8 小时前
企业实训|自动驾驶中的图像处理与感知技术——某央企汽车集团
图像处理·人工智能·自动驾驶·集成学习
王哈哈^_^8 小时前
YOLO11实例分割训练任务——从构建数据集到训练的完整教程
人工智能·深度学习·算法·yolo·目标检测·机器学习·计算机视觉
檐下翻书1738 小时前
从入门到精通:流程图制作学习路径规划
论文阅读·人工智能·学习·算法·流程图·论文笔记
SalvoGao9 小时前
Python学习 | 怎么理解epoch?
数据结构·人工智能·python·深度学习·学习
搬砖者(视觉算法工程师)9 小时前
自动驾驶汽车技术的工程原理与应用
人工智能·计算机视觉·自动驾驶
CV实验室10 小时前
2025 | 哈工大&鹏城实验室等提出 Cascade HQP-DETR:仅用合成数据实现SOTA目标检测,突破虚实鸿沟!
人工智能·目标检测·计算机视觉·哈工大
aitoolhub10 小时前
培训ppt高效制作:稿定设计 + Prompt 工程 30 分钟出图指南
人工智能·prompt·aigc