AI大模型-卷积神经网络-对卷积的理解

目的

1、为避免一学就会、一用就废,这里做下笔记

2、让高等数学没学好的人(如本学渣),也能彻底搞懂卷积是什么

基础要求

1、认字

2、懂加减乘除四则运算

3、知道微积分符号的基本含义

什么是卷积

定义

卷积是一种数学运算方法,描述两个函数之间如何相互作用产生第三个函数。

对于两个函数f(t)f(t)f(t)和g(t)g(t)g(t),它们卷积后生成函数e(t)e(t)e(t),e(t)e(t)e(t)的数学定义为:
e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ e(t) = (f*g)(t) = ∫f(τ) \cdot g(t-τ)dτ e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ

  • t:函数的自变量
  • *:卷积操作
  • τττ:积分变量,该符号和t相似,要注意区分
  • ⋅\cdot⋅:点乘,即四则运算中的乘法

疑问:

1、e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫等符号有什么现实意义?

2、为什么工程中要用到这么奇怪的数学变换?

带着上述疑问,且看下一节↓

物理意义上如何理解?

想象一个能量发射的场景:

1、有一个能量发射器,它能不断对外发射能量,发射能量的强度随时间t的变化规律为f(t)f(t)f(t)

2、能量被发射后,随时间t不断耗散,耗散规律为g(t)g(t)g(t)

3、有一个能量探测器,它能探测t时刻,空间中能量的强度e(t)e(t)e(t)

场景1:最简单场景

1、能量发射器仅在0时刻,发射强度为2的能量,之后不发射,发射规律为:
f(t)={2当t=00当t>0f(t) = \begin{cases} 2 & 当t = 0 \\ 0 & 当t>0 \end{cases}f(t)={20当t=0当t>0

2、能量随时间t不断耗散为原本的一半,如1秒后耗散为原本的12\frac{1}{2}21,2秒后耗散为原本的14\frac{1}{4}41,3秒后耗散为原本的18\frac{1}{8}81。耗散规律g(t)g(t)g(t)为:
g(t)=12t g(t)=\frac{1}{2^t} g(t)=2t1

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)=2⋅123=14 e(3) = f(0) \cdot g(3-0) = 2 \cdot \frac{1}{2^3} = \frac{1}{4} e(3)=f(0)⋅g(3−0)=2⋅231=41

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(0)⋅g(t−0) e(t)=f(0) \cdot g(t-0) e(t)=f(0)⋅g(t−0)

场景2:仅改变发射能量的时刻

基于场景1:

1、仅略微改变f(t)f(t)f(t),发射时刻从0改为1
f(t)={2当t=10当t≥0且t≠1f(t) = \begin{cases} 2 & 当t = 1 \\ 0 & 当t≥0 且 t≠1 \end{cases}f(t)={20当t=1当t≥0且t=1

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:1时刻能量的残余 ,即:
e(3)=f(1)⋅g(3−1)=2⋅122=12 e(3)=f(1) \cdot g(3-1)=2 \cdot \frac{1}{2^2} = \frac{1}{2} e(3)=f(1)⋅g(3−1)=2⋅221=21

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(1)⋅g(t−1) e(t)=f(1) \cdot g(t-1) e(t)=f(1)⋅g(t−1)

场景3:发射2次能量

基于场景2:

1、仅略微改变f(t)f(t)f(t),发射时刻从1改为:0和1
f(t)={2当t=0,10当t>0且t≠1f(t) = \begin{cases} 2 & 当t = 0,1 \\ 0 & 当t>0 且 t≠1 \end{cases}f(t)={20当t=0,1当t>0且t=1

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余+1时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)=2⋅123+2⋅122=34 \begin{aligned} e(3)&=f(0) \cdot g(3-0)+f(1) \cdot g(3-1) \\ &=2 \cdot \frac{1}{2^3}+2 \cdot \frac{1}{2^2} = \frac{3}{4} \end{aligned} e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)=2⋅231+2⋅221=43

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=f(0)⋅g(t−0)+f(1)⋅g(t−1) e(t)=f(0) \cdot g(t-0)+f(1) \cdot g(t-1) e(t)=f(0)⋅g(t−0)+f(1)⋅g(t−1)

场景4:定时发射能量

基于场景3:

1、仅略微改变f(t)f(t)f(t),发射时刻改为从0开始,每秒1次
f(t)={2当t=0,1,2,3...0当t>0且t≠整数f(t) = \begin{cases} 2 & 当t = 0,1,2,3... \\ 0 & 当t>0 且 t≠整数 \end{cases}f(t)={20当t=0,1,2,3...当t>0且t=整数

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,探测到的能量强度为:0时刻能量的残余+1时刻能量的残余+2时刻能量的残余+3时刻能量的残余 ,即:
e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)+f(2)⋅g(3−2)+f(3)⋅g(3−3) \begin{aligned} e(3)&=f(0) \cdot g(3-0)+f(1) \cdot g(3-1) \\ &+f(2) \cdot g(3-2)+f(3) \cdot g(3-3) \end{aligned} e(3)=f(0)⋅g(3−0)+f(1)⋅g(3−1)+f(2)⋅g(3−2)+f(3)⋅g(3−3)

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=∑τ=0tf(τ)⋅g(t−τ) τ=0,1,2,3... e(t)=\sum_{τ=0}^t f(τ)\cdot g(t-τ) \ \ \ \ \ τ=0,1,2,3... e(t)=τ=0∑tf(τ)⋅g(t−τ) τ=0,1,2,3...

场景5:持续发射能量

基于场景4:

1、仅略微改变f(t)f(t)f(t),发射规律改为持续发射,即:
f(t)=2 t≥0 f(t) = 2 \ \ \ \ \ t≥0 f(t)=2 t≥0

2、g(t)g(t)g(t)不变

3、能量探测器,在第3秒时,用微积分的方法,探测到的能量强度为:0时刻能量的残余+0.001时刻能量的残余+0.002时刻能量的残余+0.003时刻能量的残余...+3时刻能量的残余 ,即:
e(3)=∫03f(τ)⋅g(t−τ)dτ e(3)=\int_0^3 f(τ) \cdot g(t-τ)dτ e(3)=∫03f(τ)⋅g(t−τ)dτ

4、能量探测器,在第t秒时,探测到的能量强度为:
e(t)=∫0tf(τ)⋅g(t−τ)dτ e(t)=\int_0^t f(τ) \cdot g(t-τ)dτ e(t)=∫0tf(τ)⋅g(t−τ)dτ

总结

基于以上5个场景,成功推导出卷积公式e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ e(t) = (f*g)(t) = ∫f(τ) \cdot g(t-τ)dτ e(t)=(f∗g)(t)=∫f(τ)⋅g(t−τ)dτ

回应前面的疑问:

1、e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫e(t)、f(t)、g(t)、t、τ、∫等符号有什么现实意义?

上述场景中:

  • ttt:自变量,表示时间(当前时刻 或 不断向前的时间)
  • f(t)f(t)f(t):能量随时间t的发射规律
  • g(t)g(t)g(t):能量随时间t的耗散规律
  • e(t)e(t)e(t):ttt时刻,探测到的能量强度
  • τττ:积分变量,ttt之前的某一时刻,值域为[0,t][0,t][0,t]
  • f(τ)f(τ)f(τ):τττ时刻,能量源发出的能量大小(或能量强度)
  • f(τ)⋅g(t−τ)f(τ) \cdot g(t-τ)f(τ)⋅g(t−τ):τττ时刻发出的能量f(τ)f(τ)f(τ),到ttt时刻时,残余的能量大小
  • ∫0tf(τ)⋅g(t−τ)dτ\int_0^t f(τ) \cdot g(t-τ)dτ∫0tf(τ)⋅g(t−τ)dτ:0−t0-t0−t时刻之间,能量源已发出的所有能量(不断耗散),到ttt时刻时,残余能量的总和

2、为什么工程中要用到这么奇怪的数学变换?

因为实际工程中,会大量遇到上述案例的变种。

  • 变种1-信号处理,类比如下:
数学 能量发射场景 信号处理场景
f(t)f(t)f(t) 能量发射 信号源发出信号(声音、电信号、光信号)
g(t)g(t)g(t) 能量耗散规律 信号强度耗散规律
e(t)e(t)e(t) 探测t时刻能量强度 探测t时刻信号强度
  • 变种2-图像处理,类比如下:
数学 能量发射场景 图像处理场景
ttt 时间t 空间像素位置(x,y)
f(t)f(t)f(t) 能量发射 从左到右,从上到下,遍历图像不同区域的像素
g(t)g(t)g(t) 能量耗散规律 像素特征规律
e(t)e(t)e(t) 探测t时刻能量强度 遍历完图像后,抽取到整个图像的特征

哲学引申

现状是主体在历史作用下的结果,万事万物,莫不卷积。

数学 能量发射场景 哲学场景 个人示例
f(t)f(t)f(t) 能量发射 历史对主体的不断作用=不断输入信号 人的后天经历
g(t)g(t)g(t) 能量耗散规律 主体的特质(江山易改、本性难移) 人的先天禀赋
e(t)e(t)e(t) 探测t时刻能量强度 某一层面的现状 人的性情现状

文学引申

想起很早之前看的一段话,大意是:"这不仅仅只是一幅普通的油画,我的作品里,有我所有走过的路,读过的书,看过的风景,听过的音乐,和我爱过的人"。嗯,没错,这是卷积。

相关推荐
小草cys13 小时前
基于大模型的图像目标检测及跟踪算法
人工智能·算法·目标检测
lrh12280014 小时前
详解线性回归算法:原理、实现与优化(附损失函数与正则化)
人工智能·机器学习·回归
朱元禄14 小时前
AI Agent 实战课程 之 《RAG 闭环实操:RAG 闭环实操(讲师逐字稿)DeepSeek + LangChain》
人工智能·langchain
Elwin Wong14 小时前
浅析DeepSeek-OCR v1&v2
人工智能·大模型·llm·ocr·deepseek
火山引擎开发者社区14 小时前
火山引擎正式上线 102.4T 自研交换机,构建 AI 网络新底座
网络·人工智能·火山引擎
庄周迷蝴蝶14 小时前
CNN的底层实现方式
人工智能·神经网络·cnn
落雨盛夏14 小时前
深度学习|李哥考研——transformer
人工智能·深度学习·transformer
凤希AI伴侣14 小时前
凤希AI伴侣V1.3.5.0发布:从“功能堆砌”到“体验重塑”的思考
人工智能·凤希ai伴侣
catchadmin14 小时前
Laravel AI SDK 在 Laracon India 2026 首次亮相
人工智能·php·laravel
love530love14 小时前
Windows 11 配置 CUDA 版 llama.cpp 并实现系统全局调用(GGUF 模型本地快速聊天)
人工智能·windows·大模型·llama·llama.cpp·gguf·cuda 加速