在图像处理中,"频率"并不指代时间上的快慢,而是指空间频率(Spatial Frequency) 。它定义的是图像像素灰度值随空间位置变化的剧烈程度。
-
低频(Low Frequency):
-
定义: 图像中灰度值变化缓慢、平坦的区域。
-
对应内容: 图像的大致轮廓、连片的背景(如蓝天、草地)、柔和的渐变。
-
视觉感受: 决定了图像的整体亮度分布和基本结构。
-
-
高频(High Frequency):
-
定义: 图像中灰度值变化剧烈、迅速的区域。
-
对应内容: 物体的边缘、精细的纹理(如发丝、布料纤维)、突发的细节,以及图像中的随机噪声。
-
视觉感受: 决定了图像的清晰度和锐利度。
-
-
低通滤波器(LPF): 允许低频通过,滤除高频。结果是图像变模糊了,因为细节和边缘(高频)被删除了。
-
高通滤波器(HPF): 允许高频通过,滤除低频。结果是图像变成了"素描稿"或边缘图,因为背景和主体颜色(低频)被删除了,只剩下了轮廓和噪声。
中心区域: 通常代表低频部分。如果图像是一片死黑或全白,能量会极度集中在中心点。
边缘区域: 代表高频部分。离中心越远,频率越高。
坐标轴的定义


-
如果一张图是纯黑色:
-
平均亮度 = 0。
-
由于没有任何变化,所有频率的振幅都是 0。
-
频谱图:全黑。
-
-
如果一张图是纯白色:
-
平均亮度 = 255(最大值)。
-
由于没有任何变化,所有高频振幅依然是 0。
-
频谱图:只有最中心的一个点极亮,其余地方全黑
-


特性的使用:
-
光照归一化: 如果我们想让模型不受环境光(整体变亮或变暗)的影响,有一种简单的方法就是直接把频谱图中心那个点的数值设为 0。这样图像就失去了整体亮度信息,只剩下了结构信息。
-
图像压缩: 既然自然图像的大部分能量都在这个中心点(平均亮度),我们只需要高精度保存中心点,四周的微小高频信息可以适当丢弃
图像压缩(JPEG):
假设我们把这 8x8 的像素块转换到频率域,得到了 64 个频率系数:
-
左上角(低频):数值可能是
240, 15, 8...(数值很大,能量集中)。 -
右下角(高频):数值可能是
0.1, 0.02, 0.001...(数值极小)。
图像压缩之所以敢丢弃信息,是因为人类的眼睛对高频细节并不敏感。
-
如果我把照片里蓝天的整体色调(低频)从蓝色改成绿色,你一眼就能发现。
-
但如果我把草地上某根草尖上的一个小毛刺(极高频)删掉,或者把它的颜色深浅稍微改一点点,你的大脑根本察觉不到。
这是最关键的"丢弃"动作。我们会准备一个量化矩阵,用来除以频率域的系数。
-
对低频: 我们除以一个很小的数(比如 10)。
240 / 10 = 24。数值变小了,但主要信息还在。 -
对高频: 我们除以一个很大的数(比如 100)。
0.1 / 100 = 0.001。在计算机取整存储时,这个0.001直接就变成了 0。
结果: 转换后的 64 个数字里,原本右下角那些零碎的小数,全部变成了 0。
现在,这 8x8 块的频率数据变成了这样: [24, 2, 1, 0, 0, 0, 0, 0, ...... 0]
在计算机存储时,我们不再需要存 64 个不同的数字。我们只需要存:"数字 24,数字 2,数字 1,后面跟着 61 个零"。 这种极其简单的描述方式,占用的空间微乎其微。
当你打开图片时,计算机会执行逆变换:
-
它把那些 0 重新变回像素。
-
由于我们当初把
0.1强行变成了0,还原回来的图像会丢失那些极其微小的细节(比如草尖的锋利感)。
这就是为什么当你把 JPEG 压缩率调得极高时,图片会出现**"方块效应"**(马赛克)------因为高频的细节全被当成 0 丢掉了,剩下的全是代表大块颜色的低频分量。
滤波方法
| 滤波名称 | 核心特长 | 典型应用场景 |
|---|---|---|
| 均值滤波 | 速度最快 | 极其粗糙的实时背景平滑 |
| 高斯滤波 | 符合自然分布 | 大多数视觉算法的预处理步骤 |
| 中值滤波 | 专克椒盐噪声 | 扫描文档去噪、老照片修复 |
| 双边滤波 | 保边去噪 | 人脸美化、高质量照片降噪 |
| 高通滤波 | 提取细节 | 轮廓检测、图像锐化 |
1. 空间域滤波 (Spatial Domain)
直接在图像像素上移动一个"模板"(Kernel),通过加权求和来改变中心像素的值。
线性滤波 (Linear Filters)
-
均值滤波 (Mean Filter)
-
原理:取邻域像素的平均值。
-
用途:最简单的平滑处理。
-
缺点:在去噪的同时会严重模糊边缘。
-
-
高斯滤波 (Gaussian Filter)
-
原理:权重符合高斯分布(中间高、四周低)。
-
公式 :
-
用途:去除高斯噪声的标准手段,比均值滤波更自然地保留图像结构。
-
非线性滤波 (Non-linear Filters)
-
中值滤波 (Median Filter)
-
原理 :取邻域像素的中位数。
-
全能王 :它是去除"椒盐噪声"(图像上随机出现的白点黑点)的神器。
-
优点:能极好地保护边缘不被模糊。
-
-
双边滤波 (Bilateral Filter)
-
原理 :同时考虑空间距离 和像素值差异(颜色接近才参与平滑)。
-
用途 :美颜磨皮的核心算法。它能在磨平皮肤(平坦区)的同时,绝对不模糊五官边缘。
-
2. 频率域滤波 (Frequency Domain)
通过傅里叶变换进入频域,修改频谱后再反变换回来。
-
低通滤波器 (LPF):
-
理想低通:一刀切,会有严重的振铃(波纹)。
-
巴特沃斯低通:平滑过渡,阶数可控(你之前问过的)。
-
高斯低通:完全没有振铃,效果最柔和。
-
-
高通滤波器 (HPF):
-
用途:提取边缘、锐化图像。
-
Sobel/Prewitt 算子:计算梯度,常用于检测水平或垂直边缘。
-
拉普拉斯算子 (Laplacian):二阶导数,对细节极其敏感,常用于增强图像的突变部分。
-
维纳滤波器
应用场景

核心思想


| 特性 | 逆滤波 | 维纳滤波 |
|---|---|---|
| 对待噪声 | 完全不管,容易放大噪声 | 考虑噪声,自动调节增益 |
| 数学性质 | 简单的代数反演 | 基于概率统计的最优化 |
| 效果 | 容易出现强烈的振铃和雪花 | 图像更稳健,但可能略微模糊 |
传递函数
传递函数通常定义为系统输出的拉普拉斯变换(或傅里叶变换)与输入的拉普拉斯变换之比,且假设所有初始条件为零。

巴特沃斯和维纳滤波器,这两个本质上都是频率域的传递函数

