神经网络之仿射变换

📐 一、什么是仿射变换?

仿射变换 = 线性变换 + 平移

它是一种**保持点之间的相对关系(平行性、比例)**的变换。通俗来说,仿射变换可以包括:

  • 旋转
  • 缩放
  • 剪切(shear)
  • 平移

🧮 数学定义

对于向量 x∈Rnx \in \mathbb{R}^nx∈Rn,仿射变换定义为:

f(x)=Ax+b f(x) = A x + b f(x)=Ax+b

其中:

  • A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n:一个矩阵,表示线性变换(如旋转、缩放等)
  • b∈Rmb \in \mathbb{R}^mb∈Rm:一个向量,表示平移
  • xxx:输入向量
  • f(x)f(x)f(x):变换后的输出向量

🧠 直观理解

组成 解释
AxAxAx 线性变换(拉伸、旋转、投影等)
+b+b+b 平移操作(将结果整体平移)

仿射变换比线性变换更通用,因为它不需要满足「原点映射到原点」这一限制。


📌 举个例子

在二维空间中:

设:

A=[2002],b=[11] A = \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}, \quad b = \begin{bmatrix} 1 \\ 1 \end{bmatrix} A=[2002],b=[11]

则:

f(x)=2x+[11] f(x) = 2x + \begin{bmatrix}1\\1\end{bmatrix} f(x)=2x+[11]

这个仿射变换会先把所有点缩放 2 倍 ,再整体平移 (1, 1)


🤖 在神经网络中的应用

神经网络中的每一层(不加激活函数)本质上就是一个仿射变换

z=Wx+b z = W x + b z=Wx+b

其中:

  • xxx:上一层的输出
  • WWW:权重矩阵
  • bbb:偏置向量
  • zzz:本层输出(未激活)

激活函数 的作用就是在仿射变换的基础上引入非线性,否则整个网络就是一系列仿射变换叠加,最终仍是一个仿射变换。


🧭 与其他变换的区别

类型 表达式 特点
线性变换 f(x)=Axf(x) = Axf(x)=Ax 不含平移,原点映射到原点
仿射变换 f(x)=Ax+bf(x) = Ax + bf(x)=Ax+b 包含平移,原点不一定映射到原点
仿射变换 + 激活函数 f(x)=σ(Ax+b)f(x) = \sigma(Ax + b)f(x)=σ(Ax+b) 神经网络的基本单元,增加非线性表达能力

✅ 总结

项目 内容
名称 仿射变换(Affine Transformation)
定义 f(x)=Ax+bf(x) = Ax + bf(x)=Ax+b
包含操作 旋转、缩放、剪切、平移
应用领域 图形学、几何变换、神经网络等
神经网络中体现 每一层的线性变换 + 偏置项
与线性变换的区别 仿射变换多了一个平移项 bbb
相关推荐
AI人工智能+5 分钟前
一种以深度学习与计算机视觉技术为核心的表格识别系统,实现了结构化、半结构化表格的精准文字提取、布局解析与版面完整还原
深度学习·计算机视觉·ocr·表格识别
小敬爱吃饭5 分钟前
Ragflow Docker部署及问题解决方案(界面为Welcome to nginx,ragflow上传文件失败,Docker中的ragflow-cpu-1一直重启)
人工智能·python·nginx·docker·语言模型·容器·数据挖掘
宸津-代码粉碎机12 分钟前
Spring Boot 4.0虚拟线程实战调优技巧,最大化发挥并发优势
java·人工智能·spring boot·后端·python
老兵发新帖21 分钟前
Hermes:比openclaw更好用的智能体?
人工智能
俊哥V28 分钟前
每日 AI 研究简报 · 2026-04-09
人工智能·ai
MicrosoftReactor30 分钟前
技术速递|使用 Copilot SDK 构建 AI 驱动的 GitHub Issue 分类系统
人工智能·github·copilot
AI成长日志32 分钟前
【GitHub开源项目专栏】AI推理优化框架深度解析(上):vLLM架构设计与核心实现
人工智能·开源·github
数智前线32 分钟前
三次“进窄门”,MiniMax走向AGI深处
人工智能
AI视觉网奇33 分钟前
几何数据集 多模态
人工智能·深度学习
Figo_Cheung34 分钟前
Figo义商本体约束推理引擎 (CRE):基于已部署CRE本地模型的技术实践研究——迈向AGI时代的AI伦理安全框架
人工智能·安全