神经网络之剪切变换

🧠 一、剪切变换是什么?

剪切(Shear)变换 是一种 仿射变换 ,它会让一个图形的形状发生"倾斜",角度改变但面积保持不变

  • 不改变面积 ✅
  • 不改变平行性 ✅
  • 改变角度和形状 ✅
  • 改变坐标 ✅

简而言之:

剪切变换是"沿某个方向将图形拉斜"。


🧮 二、数学定义(线性代数视角)

剪切变换通常表现为一种线性变换,可以写成矩阵乘法的形式:


✅ 在二维空间(2D):

  1. 沿 X 轴剪切(水平剪切)

$$

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & k \
0 & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x + ky \

y

\end{bmatrix}

👉 x 会根据 y 发生偏移,y 不变。 *** ** * ** *** 2. **沿 Y 轴剪切(垂直剪切)**: ##

\begin{bmatrix}
x' \
y'
\end{bmatrix}

\begin{bmatrix}

1 & 0 \
k & 1
\end{bmatrix}
\begin{bmatrix}
x \
y
\end{bmatrix}

\begin{bmatrix}

x \

y + kx

\end{bmatrix}

$$

👉 y 会根据 x 发生偏移,x 不变。


✅ 剪切矩阵通式

二维剪切的一般形式矩阵:

Shear(kx,ky)=1kxky1 \text{Shear}(k_x, k_y) = \begin{bmatrix} 1 & k_x \\ k_y & 1 \end{bmatrix} Shear(kx,ky)=1kykx1

  • 当 kx≠0,ky=0k_x ≠ 0, k_y = 0kx=0,ky=0:水平剪切
  • 当 kx=0,ky≠0k_x = 0, k_y ≠ 0kx=0,ky=0:垂直剪切
  • 当 kx≠0,ky≠0k_x ≠ 0, k_y ≠ 0kx=0,ky=0:双向剪切(斜向拉伸)

📐 三、几何直观:图形怎么变?

🔲 示例:剪切前后图形变化

假设我们有一个单位正方形:

复制代码
原始顶点:
A(0, 0), B(1, 0), C(1, 1), D(0, 1)

经过剪切(水平剪切,k = 1):

复制代码
新顶点:
A(0, 0)
B(1, 0)
C(1 + 1 = 2, 1)
D(0 + 1 = 1, 1)

变成:

复制代码
剪切后平行四边形:
A(0,0), B(1,0), C(2,1), D(1,1)

🧭 四、剪切变换的特性总结

属性 是否满足 说明
线性变换 没有平移项(可以写成矩阵乘法)
面积不变 对于某些剪切(行列式为 1)
平行性保持 原来平行的线剪切后仍然平行
长度角度保持 向量长度和角度通常会变化
可逆性 如果剪切矩阵可逆(行列式 ≠ 0)

📷 五、图像处理中的剪切变换

剪切变换在图像处理中用途广泛,主要包括:

  • 图像倾斜矫正(文档扫描)
  • 数据增强(OCR、手写识别)
  • 仿射几何变换(如 cv2.getAffineTransform() + cv2.warpAffine()

💡 OpenCV 中的剪切实现

python 复制代码
import cv2
import numpy as np

image = cv2.imread("image.png")
rows, cols = image.shape[:2]

# 构造剪切矩阵
M = np.float32([[1, 0.5, 0], [0, 1, 0]])  # 水平剪切
sheared = cv2.warpAffine(image, M, (cols, rows))

🔗 六、在神经网络中的关联

虽然剪切变换本身不是神经元层的计算结构,但它在以下方面出现:

1. 数据增强(Data Augmentation)

  • 模拟真实世界中的偏斜图像
  • 提高模型的泛化能力

2. 空间变换网络(Spatial Transformer Network)

  • 让模型自动学习仿射变换(包括剪切)

✅ 七、总结表:剪切变换一览

项目 内容
中文名 剪切变换
英文名 Shear / Shear Transformation
数学定义 x′=Axx' = Axx′=Ax,其中 A 为剪切矩阵
本质 改变角度,不改变平行性
图形变形 正方形 → 平行四边形
应用领域 图像处理、图形变换、机器学习数据增强
与仿射关系 是仿射变换的一种(线性部分)
相关推荐
一次旅行1 小时前
HyperTool:突破传统工具调用限制,让Agent更高效执行复杂任务
人工智能
陈天伟教授2 小时前
图解人工智能(58)人工智能应用-围棋国手
人工智能·语音识别·机器翻译
闻道参看2 小时前
2026年AI优质企业培训系统综合测评:合规管控/数据量化
人工智能
老虾头2 小时前
科技贴近烟火:本地化 AI,赋能各行各业日常经营
人工智能
毒爪的小新2 小时前
Linux 环境极速部署 vLLM:从零搭建生产级大模型推理服务
linux·人工智能·ai·语言模型·vllm
老大白菜2 小时前
25美元,DIY开源可穿戴智能AI眼镜:Arduino+乐鑫ESP32+DeepSeek项目
人工智能
DreamLife☼3 小时前
OpenBCI-脑机接口在康复医疗中的应用
深度学习·cnn·脑电·康复·fes·openbci·外骨骼
岁月宁静3 小时前
RAG 文档摄入全链路,从原理到生产落地
vue.js·人工智能·python
小和尚同志3 小时前
AI 自动化测试探索(一):Playwright MCP
前端·人工智能·aigc