【图像与视频处理】什么是图像的频率?

在图像处理中,"频率"并不指代时间上的快慢,而是指空间频率(Spatial Frequency) 。它定义的是图像像素灰度值随空间位置变化的剧烈程度

  • 低频(Low Frequency):

    • 定义: 图像中灰度值变化缓慢、平坦的区域。

    • 对应内容: 图像的大致轮廓、连片的背景(如蓝天、草地)、柔和的渐变。

    • 视觉感受: 决定了图像的整体亮度分布和基本结构。

  • 高频(High Frequency):

    • 定义: 图像中灰度值变化剧烈、迅速的区域。

    • 对应内容: 物体的边缘、精细的纹理(如发丝、布料纤维)、突发的细节,以及图像中的随机噪声。

    • 视觉感受: 决定了图像的清晰度和锐利度。

  • 低通滤波器(LPF): 允许低频通过,滤除高频。结果是图像变模糊了,因为细节和边缘(高频)被删除了。

  • 高通滤波器(HPF): 允许高频通过,滤除低频。结果是图像变成了"素描稿"或边缘图,因为背景和主体颜色(低频)被删除了,只剩下了轮廓和噪声。

中心区域: 通常代表低频部分。如果图像是一片死黑或全白,能量会极度集中在中心点。

边缘区域: 代表高频部分。离中心越远,频率越高。

坐标轴的定义

  • 如果一张图是纯黑色

    • 平均亮度 = 0。

    • 由于没有任何变化,所有频率的振幅都是 0。

    • 频谱图:全黑。

  • 如果一张图是纯白色

    • 平均亮度 = 255(最大值)。

    • 由于没有任何变化,所有高频振幅依然是 0。

    • 频谱图:只有最中心的一个点极亮,其余地方全黑

特性的使用:

  • 光照归一化: 如果我们想让模型不受环境光(整体变亮或变暗)的影响,有一种简单的方法就是直接把频谱图中心那个点的数值设为 0。这样图像就失去了整体亮度信息,只剩下了结构信息。

  • 图像压缩: 既然自然图像的大部分能量都在这个中心点(平均亮度),我们只需要高精度保存中心点,四周的微小高频信息可以适当丢弃

图像压缩(JPEG):

假设我们把这 8x8 的像素块转换到频率域,得到了 64 个频率系数:

  • 左上角(低频):数值可能是 240, 15, 8...(数值很大,能量集中)。

  • 右下角(高频):数值可能是 0.1, 0.02, 0.001...(数值极小)。

图像压缩之所以敢丢弃信息,是因为人类的眼睛对高频细节并不敏感

  • 如果我把照片里蓝天的整体色调(低频)从蓝色改成绿色,你一眼就能发现。

  • 但如果我把草地上某根草尖上的一个小毛刺(极高频)删掉,或者把它的颜色深浅稍微改一点点,你的大脑根本察觉不到。

这是最关键的"丢弃"动作。我们会准备一个量化矩阵,用来除以频率域的系数。

  • 对低频: 我们除以一个很小的数(比如 10)。240 / 10 = 24。数值变小了,但主要信息还在。

  • 对高频: 我们除以一个很大的数(比如 100)。0.1 / 100 = 0.001。在计算机取整存储时,这个 0.001 直接就变成了 0

结果: 转换后的 64 个数字里,原本右下角那些零碎的小数,全部变成了 0

现在,这 8x8 块的频率数据变成了这样: [24, 2, 1, 0, 0, 0, 0, 0, ...... 0]

在计算机存储时,我们不再需要存 64 个不同的数字。我们只需要存:"数字 24,数字 2,数字 1,后面跟着 61 个零"。 这种极其简单的描述方式,占用的空间微乎其微。

当你打开图片时,计算机会执行逆变换:

  • 它把那些 0 重新变回像素。

  • 由于我们当初把 0.1 强行变成了 0,还原回来的图像会丢失那些极其微小的细节(比如草尖的锋利感)。

这就是为什么当你把 JPEG 压缩率调得极高时,图片会出现**"方块效应"**(马赛克)------因为高频的细节全被当成 0 丢掉了,剩下的全是代表大块颜色的低频分量。

滤波方法

滤波名称 核心特长 典型应用场景
均值滤波 速度最快 极其粗糙的实时背景平滑
高斯滤波 符合自然分布 大多数视觉算法的预处理步骤
中值滤波 专克椒盐噪声 扫描文档去噪、老照片修复
双边滤波 保边去噪 人脸美化、高质量照片降噪
高通滤波 提取细节 轮廓检测、图像锐化

1. 空间域滤波 (Spatial Domain)

直接在图像像素上移动一个"模板"(Kernel),通过加权求和来改变中心像素的值。

线性滤波 (Linear Filters)
  • 均值滤波 (Mean Filter)

    • 原理:取邻域像素的平均值。

    • 用途:最简单的平滑处理。

    • 缺点:在去噪的同时会严重模糊边缘。

  • 高斯滤波 (Gaussian Filter)

    • 原理:权重符合高斯分布(中间高、四周低)。

    • 公式

    • 用途:去除高斯噪声的标准手段,比均值滤波更自然地保留图像结构。

非线性滤波 (Non-linear Filters)
  • 中值滤波 (Median Filter)

    • 原理 :取邻域像素的中位数

    • 全能王 :它是去除"椒盐噪声"(图像上随机出现的白点黑点)的神器。

    • 优点:能极好地保护边缘不被模糊。

  • 双边滤波 (Bilateral Filter)

    • 原理 :同时考虑空间距离像素值差异(颜色接近才参与平滑)。

    • 用途美颜磨皮的核心算法。它能在磨平皮肤(平坦区)的同时,绝对不模糊五官边缘。

2. 频率域滤波 (Frequency Domain)

通过傅里叶变换进入频域,修改频谱后再反变换回来。

  • 低通滤波器 (LPF)

    • 理想低通:一刀切,会有严重的振铃(波纹)。

    • 巴特沃斯低通:平滑过渡,阶数可控(你之前问过的)。

    • 高斯低通:完全没有振铃,效果最柔和。

  • 高通滤波器 (HPF)

    • 用途:提取边缘、锐化图像。

    • Sobel/Prewitt 算子:计算梯度,常用于检测水平或垂直边缘。

    • 拉普拉斯算子 (Laplacian):二阶导数,对细节极其敏感,常用于增强图像的突变部分。

维纳滤波器

应用场景

核心思想

特性 逆滤波 维纳滤波
对待噪声 完全不管,容易放大噪声 考虑噪声,自动调节增益
数学性质 简单的代数反演 基于概率统计的最优化
效果 容易出现强烈的振铃和雪花 图像更稳健,但可能略微模糊
传递函数

传递函数通常定义为系统输出的拉普拉斯变换(或傅里叶变换)输入的拉普拉斯变换之比,且假设所有初始条件为零。

巴特沃斯和维纳滤波器,这两个本质上都是频率域的传递函数

相关推荐
广州灵眸科技有限公司3 分钟前
瑞芯微(EASY EAI)RV1126B AI算法开发流程
人工智能·算法·机器学习
志栋智能2 小时前
运维超自动化:构建弹性IT架构的关键支撑
运维·服务器·网络·人工智能·架构·自动化
薛定猫AI2 小时前
【深度解析】Open Design:用本地优先架构重塑 AI UI 生成工作流
人工智能·ui·架构
嵌入式小企鹅3 小时前
CPU供需趋紧、DeepSeek V4全链适配、小米开源万亿模型
人工智能·学习·开源·嵌入式·小米·算力·昇腾
草莓熊Lotso3 小时前
Vibe Coding 时代:LangChain 与 LangGraph 全链路解析
linux·运维·服务器·数据库·人工智能·mysql·langchain
快乐非自愿4 小时前
RAG夺命10连问,你能抗住第几问?
人工智能·面试·程序员
千匠网络7 小时前
破局出海壁垒,千匠网络新能源汽车跨境出海解决方案
人工智能
马丁聊GEO8 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker8 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.9 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展