机器学习 第一章

🧠 机器学习 第一章

一、什么是机器学习 (Machine Learning)

让计算机自己从数据中学习出规律,无需人手写规则

  • 输入: 特征 x
  • 输出: 标签 y
  • 学习目标: 学习出 f(x) 等价于 y

二、三大类型任务

类型 英文 特点 示例
回归 Regression 输出是连续值 房价预测
分类 Classification 输出是类别标签 图像识别
结构化学习 Structured Prediction 输出是结构 机器翻译、NER

三、模型核心公式

y = w x + b y = wx + b y=wx+b

符号 意义
x 输入特征
w 权重
b 偏置
y 预测值

四、Loss (损失函数)

用来衡量预测和真实值有多大差距

🔹 常用衡量:MSE (均方误)

L o s s = 1 n ∑ ( y i − y ^ i ) 2 Loss = \frac{1}{n} \sum (y_i - \hat{y}_i)^2 Loss=n1∑(yi−y^i)2

  • 输出越出误越小,Loss 越小

五、模型训练:梯度下降

🔹 目标:寻找 w、b 使 loss 最小

w = w − η ⋅ ∂ L ∂ w b = b − η ⋅ ∂ L ∂ b w = w - \eta \cdot \frac{\partial L}{\partial w} \ b = b - \eta \cdot \frac{\partial L}{\partial b} w=w−η⋅∂w∂L b=b−η⋅∂b∂L

  • 通过每次计算方向(导数)进行更新
  • 就是一步步往 Loss 地形最低点跑

六、向量化计算:NumPy 操作

  • x 是数组,包含所有样本
  • w * x + b 是一群预测值
  • y_pred - y:一群误差
  • np.mean() 就是对误差平方求均

七、神经网络公式构建

y = b + ∑ i c i ⋅ s i g m o i d ( b i + ∑ j w i j x j ) y = b + \sum_i c_i \cdot sigmoid(b_i + \sum_j w_{ij}x_j) y=b+i∑ci⋅sigmoid(bi+j∑wijxj)

  • 输入 x_j 经 w 和 b_i 进入 hidden layer
  • hidden 经 sigmoid 转换
  • hidden 和 c_i 相乘合并进入输出 y

八、激活函数 Activation Function

🔹 给神经元带来非线性能力,让网络可以拟合复杂函数

名称 特性 应用
Sigmoid S型,输出 0~1 合适二分类、概率输出
ReLU 负值滤掉,保留正值 现代深度网络主流
相关推荐
小陈工33 分钟前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬5 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志5 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114245 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠5 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光5 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好5 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力6 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo6 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_6 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能