🧠 一、剪切变换是什么?
剪切(Shear)变换 是一种 仿射变换 ,它会让一个图形的形状发生"倾斜",角度改变但面积保持不变。
- 不改变面积 ✅
- 不改变平行性 ✅
- 改变角度和形状 ✅
- 改变坐标 ✅
简而言之:
剪切变换是"沿某个方向将图形拉斜"。
🧮 二、数学定义(线性代数视角)
剪切变换通常表现为一种线性变换,可以写成矩阵乘法的形式:
✅ 在二维空间(2D):
- 沿 X 轴剪切(水平剪切):
$$
\begin{bmatrix}
x' \
y'
\end{bmatrix}
\begin{bmatrix}
1 & k \
0 & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}
\begin{bmatrix}
x + ky \
y
\end{bmatrix}
👉 x 会根据 y 发生偏移,y 不变。 *** ** * ** *** 2. **沿 Y 轴剪切(垂直剪切)**: ##
\begin{bmatrix}
x' \
y'
\end{bmatrix}
\begin{bmatrix}
1 & 0 \
k & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}
\begin{bmatrix}
x \
y + kx
\end{bmatrix}
$$
👉 y 会根据 x 发生偏移,x 不变。
✅ 剪切矩阵通式
二维剪切的一般形式矩阵:
Shear(kx,ky)=1kxky1 \text{Shear}(k_x, k_y) = \begin{bmatrix} 1 & k_x \\ k_y & 1 \end{bmatrix} Shear(kx,ky)=1kykx1
- 当 kx≠0,ky=0k_x ≠ 0, k_y = 0kx=0,ky=0:水平剪切
- 当 kx=0,ky≠0k_x = 0, k_y ≠ 0kx=0,ky=0:垂直剪切
- 当 kx≠0,ky≠0k_x ≠ 0, k_y ≠ 0kx=0,ky=0:双向剪切(斜向拉伸)
📐 三、几何直观:图形怎么变?
🔲 示例:剪切前后图形变化
假设我们有一个单位正方形:
原始顶点:
A(0, 0), B(1, 0), C(1, 1), D(0, 1)
经过剪切(水平剪切,k = 1):
新顶点:
A(0, 0)
B(1, 0)
C(1 + 1 = 2, 1)
D(0 + 1 = 1, 1)
变成:
剪切后平行四边形:
A(0,0), B(1,0), C(2,1), D(1,1)
🧭 四、剪切变换的特性总结
| 属性 | 是否满足 | 说明 |
|---|---|---|
| 线性变换 | ✅ | 没有平移项(可以写成矩阵乘法) |
| 面积不变 | ✅ | 对于某些剪切(行列式为 1) |
| 平行性保持 | ✅ | 原来平行的线剪切后仍然平行 |
| 长度角度保持 | ❌ | 向量长度和角度通常会变化 |
| 可逆性 | ✅ | 如果剪切矩阵可逆(行列式 ≠ 0) |
📷 五、图像处理中的剪切变换
剪切变换在图像处理中用途广泛,主要包括:
- 图像倾斜矫正(文档扫描)
- 数据增强(OCR、手写识别)
- 仿射几何变换(如
cv2.getAffineTransform()+cv2.warpAffine())
💡 OpenCV 中的剪切实现:
python
import cv2
import numpy as np
image = cv2.imread("image.png")
rows, cols = image.shape[:2]
# 构造剪切矩阵
M = np.float32([[1, 0.5, 0], [0, 1, 0]]) # 水平剪切
sheared = cv2.warpAffine(image, M, (cols, rows))
🔗 六、在神经网络中的关联
虽然剪切变换本身不是神经元层的计算结构,但它在以下方面出现:
1. 数据增强(Data Augmentation)
- 模拟真实世界中的偏斜图像
- 提高模型的泛化能力
2. 空间变换网络(Spatial Transformer Network)
- 让模型自动学习仿射变换(包括剪切)
✅ 七、总结表:剪切变换一览
| 项目 | 内容 |
|---|---|
| 中文名 | 剪切变换 |
| 英文名 | Shear / Shear Transformation |
| 数学定义 | x′=Axx' = Axx′=Ax,其中 A 为剪切矩阵 |
| 本质 | 改变角度,不改变平行性 |
| 图形变形 | 正方形 → 平行四边形 |
| 应用领域 | 图像处理、图形变换、机器学习数据增强 |
| 与仿射关系 | 是仿射变换的一种(线性部分) |