【图像与视频处理】什么是图像的频率?

在图像处理中,"频率"并不指代时间上的快慢,而是指空间频率(Spatial Frequency) 。它定义的是图像像素灰度值随空间位置变化的剧烈程度

  • 低频(Low Frequency):

    • 定义: 图像中灰度值变化缓慢、平坦的区域。

    • 对应内容: 图像的大致轮廓、连片的背景(如蓝天、草地)、柔和的渐变。

    • 视觉感受: 决定了图像的整体亮度分布和基本结构。

  • 高频(High Frequency):

    • 定义: 图像中灰度值变化剧烈、迅速的区域。

    • 对应内容: 物体的边缘、精细的纹理(如发丝、布料纤维)、突发的细节,以及图像中的随机噪声。

    • 视觉感受: 决定了图像的清晰度和锐利度。

  • 低通滤波器(LPF): 允许低频通过,滤除高频。结果是图像变模糊了,因为细节和边缘(高频)被删除了。

  • 高通滤波器(HPF): 允许高频通过,滤除低频。结果是图像变成了"素描稿"或边缘图,因为背景和主体颜色(低频)被删除了,只剩下了轮廓和噪声。

中心区域: 通常代表低频部分。如果图像是一片死黑或全白,能量会极度集中在中心点。

边缘区域: 代表高频部分。离中心越远,频率越高。

坐标轴的定义

  • 如果一张图是纯黑色

    • 平均亮度 = 0。

    • 由于没有任何变化,所有频率的振幅都是 0。

    • 频谱图:全黑。

  • 如果一张图是纯白色

    • 平均亮度 = 255(最大值)。

    • 由于没有任何变化,所有高频振幅依然是 0。

    • 频谱图:只有最中心的一个点极亮,其余地方全黑

特性的使用:

  • 光照归一化: 如果我们想让模型不受环境光(整体变亮或变暗)的影响,有一种简单的方法就是直接把频谱图中心那个点的数值设为 0。这样图像就失去了整体亮度信息,只剩下了结构信息。

  • 图像压缩: 既然自然图像的大部分能量都在这个中心点(平均亮度),我们只需要高精度保存中心点,四周的微小高频信息可以适当丢弃

图像压缩(JPEG):

假设我们把这 8x8 的像素块转换到频率域,得到了 64 个频率系数:

  • 左上角(低频):数值可能是 240, 15, 8...(数值很大,能量集中)。

  • 右下角(高频):数值可能是 0.1, 0.02, 0.001...(数值极小)。

图像压缩之所以敢丢弃信息,是因为人类的眼睛对高频细节并不敏感

  • 如果我把照片里蓝天的整体色调(低频)从蓝色改成绿色,你一眼就能发现。

  • 但如果我把草地上某根草尖上的一个小毛刺(极高频)删掉,或者把它的颜色深浅稍微改一点点,你的大脑根本察觉不到。

这是最关键的"丢弃"动作。我们会准备一个量化矩阵,用来除以频率域的系数。

  • 对低频: 我们除以一个很小的数(比如 10)。240 / 10 = 24。数值变小了,但主要信息还在。

  • 对高频: 我们除以一个很大的数(比如 100)。0.1 / 100 = 0.001。在计算机取整存储时,这个 0.001 直接就变成了 0

结果: 转换后的 64 个数字里,原本右下角那些零碎的小数,全部变成了 0

现在,这 8x8 块的频率数据变成了这样: [24, 2, 1, 0, 0, 0, 0, 0, ...... 0]

在计算机存储时,我们不再需要存 64 个不同的数字。我们只需要存:"数字 24,数字 2,数字 1,后面跟着 61 个零"。 这种极其简单的描述方式,占用的空间微乎其微。

当你打开图片时,计算机会执行逆变换:

  • 它把那些 0 重新变回像素。

  • 由于我们当初把 0.1 强行变成了 0,还原回来的图像会丢失那些极其微小的细节(比如草尖的锋利感)。

这就是为什么当你把 JPEG 压缩率调得极高时,图片会出现**"方块效应"**(马赛克)------因为高频的细节全被当成 0 丢掉了,剩下的全是代表大块颜色的低频分量。

滤波方法

滤波名称 核心特长 典型应用场景
均值滤波 速度最快 极其粗糙的实时背景平滑
高斯滤波 符合自然分布 大多数视觉算法的预处理步骤
中值滤波 专克椒盐噪声 扫描文档去噪、老照片修复
双边滤波 保边去噪 人脸美化、高质量照片降噪
高通滤波 提取细节 轮廓检测、图像锐化

1. 空间域滤波 (Spatial Domain)

直接在图像像素上移动一个"模板"(Kernel),通过加权求和来改变中心像素的值。

线性滤波 (Linear Filters)
  • 均值滤波 (Mean Filter)

    • 原理:取邻域像素的平均值。

    • 用途:最简单的平滑处理。

    • 缺点:在去噪的同时会严重模糊边缘。

  • 高斯滤波 (Gaussian Filter)

    • 原理:权重符合高斯分布(中间高、四周低)。

    • 公式

    • 用途:去除高斯噪声的标准手段,比均值滤波更自然地保留图像结构。

非线性滤波 (Non-linear Filters)
  • 中值滤波 (Median Filter)

    • 原理 :取邻域像素的中位数

    • 全能王 :它是去除"椒盐噪声"(图像上随机出现的白点黑点)的神器。

    • 优点:能极好地保护边缘不被模糊。

  • 双边滤波 (Bilateral Filter)

    • 原理 :同时考虑空间距离像素值差异(颜色接近才参与平滑)。

    • 用途美颜磨皮的核心算法。它能在磨平皮肤(平坦区)的同时,绝对不模糊五官边缘。

2. 频率域滤波 (Frequency Domain)

通过傅里叶变换进入频域,修改频谱后再反变换回来。

  • 低通滤波器 (LPF)

    • 理想低通:一刀切,会有严重的振铃(波纹)。

    • 巴特沃斯低通:平滑过渡,阶数可控(你之前问过的)。

    • 高斯低通:完全没有振铃,效果最柔和。

  • 高通滤波器 (HPF)

    • 用途:提取边缘、锐化图像。

    • Sobel/Prewitt 算子:计算梯度,常用于检测水平或垂直边缘。

    • 拉普拉斯算子 (Laplacian):二阶导数,对细节极其敏感,常用于增强图像的突变部分。

维纳滤波器

应用场景

核心思想

特性 逆滤波 维纳滤波
对待噪声 完全不管,容易放大噪声 考虑噪声,自动调节增益
数学性质 简单的代数反演 基于概率统计的最优化
效果 容易出现强烈的振铃和雪花 图像更稳健,但可能略微模糊
传递函数

传递函数通常定义为系统输出的拉普拉斯变换(或傅里叶变换)输入的拉普拉斯变换之比,且假设所有初始条件为零。

巴特沃斯和维纳滤波器,这两个本质上都是频率域的传递函数

相关推荐
2603_954708312 小时前
微电网主从控制架构:集中式调度与分布式执行的协同机制
人工智能·分布式·物联网·架构·系统架构·能源
yuanmazhiwu3 小时前
计算机毕业设计:Python全国空气质量与气象监测平台 Flask框架 可视化 数据分析 机器学习 天气 深度学习 AI 空气质量分析(建议收藏)✅
人工智能·python·深度学习·数据挖掘·flask·汽车·课程设计
Fleshy数模3 小时前
基于机器学习的实时手势识别系统实现
人工智能·机器学习
龙侠九重天3 小时前
C# 机器学习数据处理
开发语言·人工智能·机器学习·ai·c#
China_Yanhy10 小时前
动手学大模型第一篇学习总结
人工智能
空间机器人10 小时前
自动驾驶 ADAS 器件选型:算力只是门票,系统才是生死线
人工智能·机器学习·自动驾驶
C+++Python10 小时前
提示词、Agent、MCP、Skill 到底是什么?
人工智能
小松要进步10 小时前
机器学习1
人工智能·机器学习
泰恒10 小时前
openclaw近期怎么样了?
人工智能·深度学习·机器学习