神经网络之剪切变换

🧠 一、剪切变换是什么?

剪切(Shear)变换 是一种 仿射变换 ,它会让一个图形的形状发生"倾斜",角度改变但面积保持不变

  • 不改变面积 ✅
  • 不改变平行性 ✅
  • 改变角度和形状 ✅
  • 改变坐标 ✅

简而言之:

剪切变换是"沿某个方向将图形拉斜"。


🧮 二、数学定义(线性代数视角)

剪切变换通常表现为一种线性变换,可以写成矩阵乘法的形式:


✅ 在二维空间(2D):

  1. 沿 X 轴剪切(水平剪切)

$$

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & k \
0 & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x + ky \

y

\end{bmatrix}

👉 x 会根据 y 发生偏移,y 不变。 *** ** * ** *** 2. **沿 Y 轴剪切(垂直剪切)**: ##

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & 0 \
k & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x \

y + kx

\end{bmatrix}

👉 y 会根据 x 发生偏移,x 不变。 *** ** * ** *** #### ✅ 剪切矩阵通式 二维剪切的一般形式矩阵: Shear(kx,ky)=\[1kxky1\] \\text{Shear}(k_x, k_y) = \\begin{bmatrix} 1 \& k_x \\\\ k_y \& 1 \\end{bmatrix} Shear(kx,ky)=\[1kykx1\] * 当 kx≠0,ky=0k_x ≠ 0, k_y = 0kx=0,ky=0:水平剪切 * 当 kx=0,ky≠0k_x = 0, k_y ≠ 0kx=0,ky=0:垂直剪切 * 当 kx≠0,ky≠0k_x ≠ 0, k_y ≠ 0kx=0,ky=0:双向剪切(斜向拉伸) *** ** * ** *** ### 📐 三、几何直观:图形怎么变? #### 🔲 示例:剪切前后图形变化 假设我们有一个单位正方形: 原始顶点: A(0, 0), B(1, 0), C(1, 1), D(0, 1) 经过剪切(水平剪切,k = 1): 新顶点: A(0, 0) B(1, 0) C(1 + 1 = 2, 1) D(0 + 1 = 1, 1) 变成: 剪切后平行四边形: A(0,0), B(1,0), C(2,1), D(1,1) *** ** * ** *** ### 🧭 四、剪切变换的特性总结 | 属性 | 是否满足 | 说明 | |--------|------|-------------------| | 线性变换 | ✅ | 没有平移项(可以写成矩阵乘法) | | 面积不变 | ✅ | 对于某些剪切(行列式为 1) | | 平行性保持 | ✅ | 原来平行的线剪切后仍然平行 | | 长度角度保持 | ❌ | 向量长度和角度通常会变化 | | 可逆性 | ✅ | 如果剪切矩阵可逆(行列式 ≠ 0) | *** ** * ** *** ### 📷 五、图像处理中的剪切变换 剪切变换在图像处理中用途广泛,主要包括: * 图像倾斜矫正(文档扫描) * 数据增强(OCR、手写识别) * 仿射几何变换(如 `cv2.getAffineTransform()` + `cv2.warpAffine()`) 💡 **OpenCV 中的剪切实现**: ```python import cv2 import numpy as np image = cv2.imread("image.png") rows, cols = image.shape[:2] # 构造剪切矩阵 M = np.float32([[1, 0.5, 0], [0, 1, 0]]) # 水平剪切 sheared = cv2.warpAffine(image, M, (cols, rows)) ``` *** ** * ** *** ### 🔗 六、在神经网络中的关联 虽然剪切变换本身不是神经元层的计算结构,但它在以下方面出现: #### 1. **数据增强(Data Augmentation)** * 模拟真实世界中的偏斜图像 * 提高模型的泛化能力 #### 2. **空间变换网络(Spatial Transformer Network)** * 让模型自动学习仿射变换(包括剪切) *** ** * ** *** ### ✅ 七、总结表:剪切变换一览 | 项目 | 内容 | |-------|------------------------------| | 中文名 | 剪切变换 | | 英文名 | Shear / Shear Transformation | | 数学定义 | x′=Axx' = Axx′=Ax,其中 A 为剪切矩阵 | | 本质 | 改变角度,不改变平行性 | | 图形变形 | 正方形 → 平行四边形 | | 应用领域 | 图像处理、图形变换、机器学习数据增强 | | 与仿射关系 | 是仿射变换的一种(线性部分) |

相关推荐
deephub2 小时前
从零构建短视频推荐系统:双塔算法架构解析与代码实现
人工智能·神经网络·机器学习·推荐系统
en-route2 小时前
从零开始学神经网络——RNN(循环神经网络)
人工智能·rnn·深度学习
spader-ai2 小时前
RAG is really dead? 大模型和知识之间的桥梁没了?
人工智能·大模型·rag·上下文工程
zskj_qcxjqr3 小时前
数字大健康崛起:艾灸机器人重构就业生态,传统与科技如何共生?
大数据·人工智能·科技·机器人
云澈ovo3 小时前
AI+传统工作流:Photoshop/Excel的智能插件开发指南
人工智能·excel·photoshop
kalvin_y_liu3 小时前
【深度相机术语与概念】
人工智能·数码相机·具身智能
山烛3 小时前
计算机视觉:OpenCV+Dlib 人脸检测
图像处理·人工智能·opencv·计算机视觉·人脸识别·dlib
小苑同学3 小时前
研究生如何看懂文献?
人工智能·安全·网络安全·安全性测试
补三补四3 小时前
图卷积网络 (GCN)
网络·人工智能·深度学习·神经网络·算法·机器学习