神经网络之剪切变换

🧠 一、剪切变换是什么?

剪切(Shear)变换 是一种 仿射变换 ,它会让一个图形的形状发生"倾斜",角度改变但面积保持不变

  • 不改变面积 ✅
  • 不改变平行性 ✅
  • 改变角度和形状 ✅
  • 改变坐标 ✅

简而言之:

剪切变换是"沿某个方向将图形拉斜"。


🧮 二、数学定义(线性代数视角)

剪切变换通常表现为一种线性变换,可以写成矩阵乘法的形式:


✅ 在二维空间(2D):

  1. 沿 X 轴剪切(水平剪切)

$$

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & k \
0 & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x + ky \

y

\end{bmatrix}

👉 x 会根据 y 发生偏移,y 不变。 *** ** * ** *** 2. **沿 Y 轴剪切(垂直剪切)**: ##

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & 0 \
k & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x \

y + kx

\end{bmatrix}

👉 y 会根据 x 发生偏移,x 不变。 *** ** * ** *** #### ✅ 剪切矩阵通式 二维剪切的一般形式矩阵: Shear(kx,ky)=\[1kxky1\] \\text{Shear}(k_x, k_y) = \\begin{bmatrix} 1 \& k_x \\\\ k_y \& 1 \\end{bmatrix} Shear(kx,ky)=\[1kykx1\] * 当 kx≠0,ky=0k_x ≠ 0, k_y = 0kx=0,ky=0:水平剪切 * 当 kx=0,ky≠0k_x = 0, k_y ≠ 0kx=0,ky=0:垂直剪切 * 当 kx≠0,ky≠0k_x ≠ 0, k_y ≠ 0kx=0,ky=0:双向剪切(斜向拉伸) *** ** * ** *** ### 📐 三、几何直观:图形怎么变? #### 🔲 示例:剪切前后图形变化 假设我们有一个单位正方形: 原始顶点: A(0, 0), B(1, 0), C(1, 1), D(0, 1) 经过剪切(水平剪切,k = 1): 新顶点: A(0, 0) B(1, 0) C(1 + 1 = 2, 1) D(0 + 1 = 1, 1) 变成: 剪切后平行四边形: A(0,0), B(1,0), C(2,1), D(1,1) *** ** * ** *** ### 🧭 四、剪切变换的特性总结 | 属性 | 是否满足 | 说明 | |--------|------|-------------------| | 线性变换 | ✅ | 没有平移项(可以写成矩阵乘法) | | 面积不变 | ✅ | 对于某些剪切(行列式为 1) | | 平行性保持 | ✅ | 原来平行的线剪切后仍然平行 | | 长度角度保持 | ❌ | 向量长度和角度通常会变化 | | 可逆性 | ✅ | 如果剪切矩阵可逆(行列式 ≠ 0) | *** ** * ** *** ### 📷 五、图像处理中的剪切变换 剪切变换在图像处理中用途广泛,主要包括: * 图像倾斜矫正(文档扫描) * 数据增强(OCR、手写识别) * 仿射几何变换(如 `cv2.getAffineTransform()` + `cv2.warpAffine()`) 💡 **OpenCV 中的剪切实现**: ```python import cv2 import numpy as np image = cv2.imread("image.png") rows, cols = image.shape[:2] # 构造剪切矩阵 M = np.float32([[1, 0.5, 0], [0, 1, 0]]) # 水平剪切 sheared = cv2.warpAffine(image, M, (cols, rows)) ``` *** ** * ** *** ### 🔗 六、在神经网络中的关联 虽然剪切变换本身不是神经元层的计算结构,但它在以下方面出现: #### 1. **数据增强(Data Augmentation)** * 模拟真实世界中的偏斜图像 * 提高模型的泛化能力 #### 2. **空间变换网络(Spatial Transformer Network)** * 让模型自动学习仿射变换(包括剪切) *** ** * ** *** ### ✅ 七、总结表:剪切变换一览 | 项目 | 内容 | |-------|------------------------------| | 中文名 | 剪切变换 | | 英文名 | Shear / Shear Transformation | | 数学定义 | x′=Axx' = Axx′=Ax,其中 A 为剪切矩阵 | | 本质 | 改变角度,不改变平行性 | | 图形变形 | 正方形 → 平行四边形 | | 应用领域 | 图像处理、图形变换、机器学习数据增强 | | 与仿射关系 | 是仿射变换的一种(线性部分) |

相关推荐
得贤招聘官几秒前
招聘终极战场:AI重构首轮筛选的精准与效能革命
人工智能·重构
通义灵码5 分钟前
使用记忆提升开发效率
人工智能·qoder·记忆能力
Echo_NGC223713 分钟前
【传统JSCC+Deep JSCC】联合信源信道编码完全指南
人工智能·python·深度学习·神经网络·conda·无人机·jscc
阿杰学AI13 分钟前
AI核心知识63——大语言模型之Reasoning Model (简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·cot·推理模型·reasoning model
Blossom.11818 分钟前
大模型AI Agent实战:ReAct框架从零实现与金融研报分析系统
人工智能·学习·react.js·stable diffusion·金融·aigc·知识图谱
Mintopia20 分钟前
🌐 技术迭代速度与监管适配:WebAIGC的发展平衡术
前端·人工智能·aigc
多则惑少则明21 分钟前
AI大模型实用(九)Java快速实现智能体整理(使用LangChain4j-agentic + Tool)
java·人工智能·springai·langchain4j
模型启动机21 分钟前
告别OCR与分块!ICLR 2025 ColPali实现视觉文档检索精度&速度双碾压
人工智能·ai·大模型·ocr
其美杰布-富贵-李21 分钟前
数据清理与特征工程完整指南
笔记·深度学习·特征工程·训练·数据清理
xerthwis22 分钟前
Hadoop:大数据世界的“古老基石”与“沉默的共生者”
大数据·人工智能·hadoop