再谈图像处理中的傅里叶变换

图像处理中的傅里叶变换

1. 图像的空间域 vs 频率域

  • 空间域(Spatial Domain):图像由像素点构成,每个像素值表示亮度或颜色。
  • 频率域(Frequency Domain) :表示图像的不同频率分量。
    • 低频(Low Frequency):大尺度结构,平滑区域。
    • 高频(High Frequency):边缘、纹理等细节。

傅里叶变换的作用是:将图像分解成不同频率的分量,类似于把一张图像看成由不同频率的正弦波叠加而成。

煮啵讲一下自己的理解:

傅里叶变换可以看做是对图像数据的重新组织,将数据从空间域的展示形式转换到频率域的形式。如果不好理解,这样想,煮啵很喜欢吃的一道菜叫土豆丝(尤其是老妈炒的微微糊的,香迷糊了!!!),如果把一幅图像比作为一盘炒好的土豆丝,那么傅里叶变换就是找出这盘土豆丝的配料(土豆丝,蒜瓣,盐,耗油,醋等等)。这个方法(傅里叶变换)的神奇之处就在于不管这道菜是怎么做的(分别放还是大乱炖)都能将配料清晰的分辨出来。在图像处理中,配料的种类按频率进行划分。有的是高频信息,有的是低频信息。低频信息一般是整幅图像的基础,就像一道菜的主料。在土豆丝中,低频信息可以看做是土豆丝的大致形状和轮廓。高频信息是指变动比较大的,表达这道菜特点的信息,有点像配料和调料。关于低频信息和高频信息的用处: 如果现在的任务是给出一盘炒土豆丝,问这盘菜是谁做的做的,那么盘子里的数量众多的土豆丝不一定能帮助我们找到厨师,而其中佐料的分量更有助于我们找出厨师的做菜风格。当然,这里我们假设厨师有自己的风格,且正常发挥没有失误。如果我们想知道这是一道什么菜,低频信息的代表一一蒜爆还是葱爆,醋的量,耗油的量就变得十分重要了,所以在上面的两个问题中,低频和高频信息、都有可能十分重要。当然傅立叶变换及频域信息、分析显然没有上面说的这么简单,更多的细节还需要更多知识和更深入地分析,这里只是"抛砖"作个引子。


2. 二维傅里叶变换(2D-FT)

傅里叶变换的公式如下:

F ( u , v ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 f ( x , y ) e − j 2 π ( u x M + v y N ) F(u, v) = \sum_{x=0}^{M-1} \sum_{y=0}^{N-1} f(x, y) e^{-j 2\pi \left( \frac{ux}{M} + \frac{vy}{N} \right)} F(u,v)=x=0∑M−1y=0∑N−1f(x,y)e−j2π(Mux+Nvy)

其中:

  • f ( x , y ) f(x, y) f(x,y) 是空间域的图像。
  • F ( u , v ) F(u, v) F(u,v) 是频率域的表示。
  • ( x , y ) (x, y) (x,y) 是空间坐标, ( u , v ) (u, v) (u,v) 是频率坐标。

逆傅里叶变换(IFT)

f ( x , y ) = 1 M N ∑ u = 0 M − 1 ∑ v = 0 N − 1 F ( u , v ) e j 2 π ( u x M + v y N ) f(x, y) = \frac{1}{MN} \sum_{u=0}^{M-1} \sum_{v=0}^{N-1} F(u, v) e^{j 2\pi \left( \frac{ux}{M} + \frac{vy}{N} \right)} f(x,y)=MN1u=0∑M−1v=0∑N−1F(u,v)ej2π(Mux+Nvy)

这表明可以从频率域恢复原始图像。


3. 频谱图的特点

  • 低频成分集中在中心,表示大致轮廓。
  • 高频成分分布在四周,表示细节和边缘。

傅里叶变换结果是复数 ,我们通常查看其幅度谱

∣ F ( u , v ) ∣ = Re ⁡ 2 + Im ⁡ 2 |F(u, v)| = \sqrt{\operatorname{Re}^2 + \operatorname{Im}^2} ∣F(u,v)∣=Re2+Im2

为了更清晰可视化,一般采用对数变换:

log ⁡ ( 1 + ∣ F ( u , v ) ∣ ) \log(1 + |F(u, v)|) log(1+∣F(u,v)∣)


4. 傅里叶变换的应用

(1) 低通滤波(去噪,平滑)
  • 目标:去除高频信息,使图像变得平滑。
  • 方法:在频域中保留低频成分,抑制高频。

应用

  • 去除高频噪声(如 JPEG 压缩噪声)。
  • 进行模糊处理(如高斯模糊)。
(2) 高频增强(边缘检测)
  • 目标:保留图像的边缘和纹理信息,提高清晰度。
  • 方法:在频域中保留高频,抑制低频。

应用

  • 提高图像锐度(如拉普拉斯锐化)。
  • 进行边缘检测(如 Sobel、Canny 算子)。
(3) 图像压缩
  • 目标:减少数据存储量,保留主要信息。
  • 方法:去掉频率域中对图像贡献较小的部分。

应用

  • JPEG 压缩:使用离散余弦变换(DCT),只保留低频信息。
(4) 去除周期性噪声
  • 目标:去掉特定频率的噪声,如扫描图像中的条纹。
  • 方法:在频域中找到噪声对应的频率点,并滤除。

应用

  • 复印件/扫描件去除条纹。
  • 医学图像去除周期性伪影。

5. 结论

  • 傅里叶变换将图像从空间域转换到频率域,分析图像的频率组成。
  • 在频域中可以应用滤波 (如低通、高通、带通),然后通过逆变换恢复图像。
  • 常见应用:去噪、边缘检测、图像压缩、医学影像分析等。

傅里叶变换提供了一种**从"局部像素变化"到"全局频率分布"**的视角,使我们能更灵活地处理图像信息。

相关推荐
Wnq100721 天前
世界模型 AI:认知跃迁的可行性与本质性挑战
人工智能
穷人小水滴1 天前
科幻 「备用肉身虫」 系列设定集 (AI 摘要)
人工智能·aigc·科幻·未来·小说·设定
老赵聊算法、大模型备案1 天前
北京市生成式人工智能服务已备案信息公告(2025年12月11日)
人工智能·算法·安全·aigc
咬人喵喵1 天前
上下文窗口:AI 的“大脑容量”
人工智能
workflower1 天前
时序数据获取事件
开发语言·人工智能·python·深度学习·机器学习·结对编程
weixin_446122461 天前
一个案例验证 LLM大模型编码能力哪家强
人工智能
老蒋新思维1 天前
创客匠人峰会深度解析:知识变现的 “信任 - 效率” 双闭环 —— 从 “单次交易” 到 “终身复购” 的增长密码
大数据·网络·人工智能·tcp/ip·重构·数据挖掘·创客匠人
大刘讲IT1 天前
面向中小企业的企业AI Agent未来3年构建蓝图规划
人工智能·经验分享·ai·开源·制造
yzx9910131 天前
深度学习的进化之路:从感知机到通用智能的曙光
人工智能·深度学习
是开心的栗子呀1 天前
阿里云天池:预测二手车交易价格的机器学习项目-高效实现MAE低于500分
人工智能·机器学习·阿里云·ai·云计算