AI大模型-卷积神经网络-对卷积的理解

目的

1、为避免一学就会、一用就废,这里做下笔记

2、让高等数学没学好的人(如本学渣),也能彻底搞懂卷积是什么

基础要求

1、认字

2、懂加减乘除四则运算

3、知道微积分符号的基本含义

什么是卷积

定义

卷积是一种数学运算方法,描述两个函数之间如何相互作用产生第三个函数。

对于两个函数f(t)f(t)f(t)和g(t)g(t)g(t),它们卷积后生成函数e(t)e(t)e(t),e(t)e(t)e(t)的数学定义为:
e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ e(t) = (f*g)(t) = ∫f(τ) \cdot g(t-τ)dτ e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ

  • t:函数的自变量
  • *:卷积操作
  • τττ:积分变量,该符号和t相似,要注意区分
  • ⋅\cdot⋅:点乘,即四则运算中的乘法

疑问:

1、e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫等符号有什么现实意义?

2、为什么工程中要用到这么奇怪的数学变换?

带着上述疑问,且看下一节↓

物理意义上如何理解?

想象一个能量发射的场景:

1、有一个能量发射器,它能不断对外发射能量,发射能量的强度随时间t的变化规律为f(t)f(t)f(t)

2、能量被发射后,随时间t不断耗散,耗散规律为g(t)g(t)g(t)

3、有一个能量探测器,它能探测t时刻,空间中能量的强度e(t)e(t)e(t)

场景1:最简单场景

1、能量发射器仅在0时刻,发射强度为2的能量,之后不发射,发射规律为:
f(t)={2当t=00当t>0f(t) = \begin{cases} 2 & 当t = 0 \\ 0 & 当t>0 \end{cases}f(t)={20当t=0当t>0

2、能量随时间t不断耗散为原本的一半,如1秒后耗散为原本的12\frac{1}{2}21,2秒后耗散为原本的14\frac{1}{4}41,3秒后耗散为原本的18\frac{1}{8}81。耗散规律g(t)g(t)g(t)为:
g(t)=12t g(t)=\frac{1}{2^t} g(t)=2t1

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)=2⋅123=14 e(3) = f(0) \cdot g(3-0) = 2 \cdot \frac{1}{2^3} = \frac{1}{4} e(3)=f(0)⋅g(3−0)=2⋅231=41

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(0)⋅g(t−0) e(t)=f(0) \cdot g(t-0) e(t)=f(0)⋅g(t−0)

场景2:仅改变发射能量的时刻

基于场景1:

1、仅略微改变f(t)f(t)f(t),发射时刻从0改为1
f(t)={2当t=10当t≥0且t≠1f(t) = \begin{cases} 2 & 当t = 1 \\ 0 & 当t≥0 且 t≠1 \end{cases}f(t)={20当t=1当t≥0且t=1

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:1时刻能量的残余 ,即:
e(3)=f(1)⋅g(3−1)=2⋅122=12 e(3)=f(1) \cdot g(3-1)=2 \cdot \frac{1}{2^2} = \frac{1}{2} e(3)=f(1)⋅g(3−1)=2⋅221=21

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(1)⋅g(t−1) e(t)=f(1) \cdot g(t-1) e(t)=f(1)⋅g(t−1)

场景3:发射2次能量

基于场景2:

1、仅略微改变f(t)f(t)f(t),发射时刻从1改为:0和1
f(t)={2当t=0,10当t>0且t≠1f(t) = \begin{cases} 2 & 当t = 0,1 \\ 0 & 当t>0 且 t≠1 \end{cases}f(t)={20当t=0,1当t>0且t=1

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余+1时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)=2⋅123+2⋅122=34 \begin{aligned} e(3)&=f(0) \cdot g(3-0)+f(1) \cdot g(3-1) \\ &=2 \cdot \frac{1}{2^3}+2 \cdot \frac{1}{2^2} = \frac{3}{4} \end{aligned} e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)=2⋅231+2⋅221=43

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(0)⋅g(t−0)+f(1)⋅g(t−1) e(t)=f(0) \cdot g(t-0)+f(1) \cdot g(t-1) e(t)=f(0)⋅g(t−0)+f(1)⋅g(t−1)

场景4:定时发射能量

基于场景3:

1、仅略微改变f(t)f(t)f(t),发射时刻改为从0开始,每秒1次
f(t)={2当t=0,1,2,3...0当t>0且t≠整数f(t) = \begin{cases} 2 & 当t = 0,1,2,3... \\ 0 & 当t>0 且 t≠整数 \end{cases}f(t)={20当t=0,1,2,3...当t>0且t=整数

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余+1时刻能量的残余+2时刻能量的残余+3时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)+f(2)⋅g(3−2)+f(3)⋅g(3−3) \begin{aligned} e(3)&=f(0) \cdot g(3-0)+f(1) \cdot g(3-1) \\ &+f(2) \cdot g(3-2)+f(3) \cdot g(3-3) \end{aligned} e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)+f(2)⋅g(3−2)+f(3)⋅g(3−3)

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=∑τ=0tf(τ)⋅g(t−τ) τ=0,1,2,3... e(t)=\sum_{τ=0}^t f(τ)\cdot g(t-τ) \ \ \ \ \ τ=0,1,2,3... e(t)=τ=0∑tf(τ)⋅g(t−τ) τ=0,1,2,3...

场景5:持续发射能量

基于场景4:

1、仅略微改变f(t)f(t)f(t),发射规律改为持续发射,即:
f(t)=2 t≥0 f(t) = 2 \ \ \ \ \ t≥0 f(t)=2 t≥0

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,用微积分的方法,探测到的能量强度为:0时刻能量的残余+0.001时刻能量的残余+0.002时刻能量的残余+0.003时刻能量的残余...+3时刻能量的残余 ,即:
e(3)=∫03f(τ)⋅g(t−τ)dτ e(3)=\int_0^3 f(τ) \cdot g(t-τ)dτ e(3)=∫03f(τ)⋅g(t−τ)dτ

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=∫0tf(τ)⋅g(t−τ)dτ e(t)=\int_0^t f(τ) \cdot g(t-τ)dτ e(t)=∫0tf(τ)⋅g(t−τ)dτ

总结

基于以上5个场景,成功推导出卷积公式e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ e(t) = (f*g)(t) = ∫f(τ) \cdot g(t-τ)dτ e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ

回应前面的疑问:

1、e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫等符号有什么现实意义?

上述场景中:

  • ttt:自变量,表示时间(当前时刻 或 不断向前的时间)
  • f(t)f(t)f(t):能量随时间t的发射规律
  • g(t)g(t)g(t):能量随时间t的耗散规律
  • e(t)e(t)e(t):ttt时刻,探测到的能量强度
  • τττ:积分变量,ttt之前的某一时刻,值域为[0,t][0,t][0,t]
  • f(τ)f(τ)f(τ):τττ时刻,能量源发出的能量大小(或能量强度)
  • f(τ)⋅g(t−τ)f(τ) \cdot g(t-τ)f(τ)⋅g(t−τ):τττ时刻发出的能量f(τ)f(τ)f(τ),到ttt时刻时,残余的能量大小
  • ∫0tf(τ)⋅g(t−τ)dτ\int_0^t f(τ) \cdot g(t-τ)dτ∫0tf(τ)⋅g(t−τ)dτ:0−t0-t0−t时刻之间,能量源已发出的所有能量(不断耗散),到ttt时刻时,残余能量的总和

2、为什么工程中要用到这么奇怪的数学变换?

因为实际工程中,会大量遇到上述案例的变种。

  • 变种1-信号处理,类比如下:
数学 能量发射场景 信号处理场景
f(t)f(t)f(t) 能量发射 信号源发出信号(声音、电信号、光信号)
g(t)g(t)g(t) 能量耗散规律 信号强度耗散规律
e(t)e(t)e(t) 探测t时刻能量强度 探测t时刻信号强度
  • 变种2-图像处理,类比如下:
数学 能量发射场景 图像处理场景
ttt 时间t 空间像素位置(x,y)
f(t)f(t)f(t) 能量发射 从左到右,从上到下,遍历图像不同区域的像素
g(t)g(t)g(t) 能量耗散规律 像素特征规律
e(t)e(t)e(t) 探测t时刻能量强度 遍历完图像后,抽取到整个图像的特征

哲学引申

现状是主体在历史作用下的结果,万事万物,莫不卷积。

数学 能量发射场景 哲学场景 个人示例
f(t)f(t)f(t) 能量发射 历史对主体的不断作用=不断输入信号 人的后天经历
g(t)g(t)g(t) 能量耗散规律 主体的特质(江山易改、本性难移) 人的先天禀赋
e(t)e(t)e(t) 探测t时刻能量强度 某一层面的现状 人的性情现状

文学引申

想起很早之前看的一段话,大意是:"这不仅仅只是一幅普通的油画,我的作品里,有我所有走过的路,读过的书,看过的风景,听过的音乐,和我爱过的人"。嗯,没错,这是卷积。

相关推荐
sanduo1122 小时前
AI 原生(AI-Native)&架构极简主义
人工智能·架构·ai-native
zhengfei6112 小时前
【开源渗透工具】——一个开源的多模态大型语言模型红队框架OpenRT
人工智能·语言模型·开源
WJSKad12353 小时前
工业零件识别与分类:基于lad_r50-paa-r101_fpn_2xb8_coco_1x模型实现
人工智能·分类·数据挖掘
千汇数据的老司机3 小时前
靠资源拿项目VS靠技术拿项目,二者的深刻区分。
大数据·人工智能·谈单
聚城云-GeecityCloud3 小时前
物业行业:在矛盾与转型中回归服务本质
人工智能·数据挖掘·回归
a3158238063 小时前
基于大语言模型的新闻判断技术
人工智能·语言模型·自然语言处理
亚里随笔3 小时前
超越LoRA:参数高效强化学习方法的全面评估与突破
人工智能·深度学习·机器学习·lora·rl
computersciencer3 小时前
机器学习入门:什么是机器学习
人工智能·机器学习
Java后端的Ai之路4 小时前
【机器学习】- CatBoost模型参数详细说明
人工智能·机器学习·catboost·模型参数