1. 二维离散傅里叶变换

DFT 是 Discrete Fourier Transform 即离散傅里叶变换的简称。二维离散傅里叶变换（2D Discrete Fourier Transform，简称 2D DFT）是将二维离散信号（例如数字图像）从空间域变换到频率域的一种数学工具。

1.1 定义

二维离散傅里叶变换的定义如下：

设 f(x,y) 是一个 M×N 的图像，其中 x=0,1,...,M−1 和 y=0,1,...,N−1。则其二维离散傅里叶变换 F(u,v) 定义为：

<math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u , v ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 f ( x , y ) e − j 2 π ( u x / M + v y / N ) F(u, v) = \sum_{x = 0}^{M - 1} \sum_{y = 0}^{N - 1} f(x, y) e^{-j2\pi(ux/M + vy/N)} </math>F(u,v)=∑x=0M−1∑y=0N−1f(x,y)e−j2π(ux/M+vy/N)

其中，u=0,1,...,M−1 和 v=0,1,...,N−1。

二维离散傅里叶逆变换：

<math xmlns="http://www.w3.org/1998/Math/MathML"> f ( x , y ) = 1 M N ∑ u = 0 M − 1 ∑ v = 0 N − 1 F ( u , v ) e j 2 π ( u x / M + v y / N ) f(x, y) = \frac{1}{MN} \sum_{u = 0}^{M - 1} \sum_{v = 0}^{N - 1} F(u, v) e^{j2\pi(ux/M + vy/N)} </math>f(x,y)=MN1∑u=0M−1∑v=0N−1F(u,v)ej2π(ux/M+vy/N)

1.2 矩阵乘法表示

二维离散傅里叶变换可以表示为矩阵乘法，这是一种更直观、更易于理解的表示方式。

<math xmlns="http://www.w3.org/1998/Math/MathML"> F = W f \mathbf{F} = \mathbf{W} \mathbf{f} </math>F=Wf

其中，

F 是 M×N 的傅里叶变换矩阵，代表变换后的图像在频率域的数据。
f 是 M×N 的图像矩阵。
W 是 M×N 的傅里叶变换基矩阵，由傅里叶变换系数构成。

傅里叶变换基矩阵 W 的元素定义为： <math xmlns="http://www.w3.org/1998/Math/MathML"> W x y = e − j 2 π ( u x / M + v y / N ) W_{xy} = e^{-j2\pi(ux/M + vy/N)} </math>Wxy=e−j2π(ux/M+vy/N)

矩阵乘法表示傅里叶变换的过程，是将原始图像每个像素值与基矩阵中对应元素进行乘积并求和，得到变换后的每个频率分量。

二维离散傅里叶逆变换使用矩阵乘法表示：

<math xmlns="http://www.w3.org/1998/Math/MathML"> f = W H F \mathbf{f} = \mathbf{W}^H \mathbf{F} </math>f=WHF

其中， <math xmlns="http://www.w3.org/1998/Math/MathML"> W H \mathbf{W}^H </math>WH是 W 的共轭转置。

矩阵乘法表示的优势:

简洁直观：用矩阵乘法表示二维离散傅里叶变换，可以直观地理解变换过程，并将计算过程转化为矩阵运算，方便计算机实现。
易于编程：矩阵乘法是编程中常用的操作，可以用各种编程语言方便地实现二维离散傅里叶变换。
⾼效计算：基于矩阵乘法的快速傅里叶变换（FFT）算法，可以显著提高计算效率，是图像处理中常用的傅里叶变换实现方法。
便于扩展：矩阵乘法可以扩展到更高维度的傅里叶变换。

二维离散傅里叶变换按照定义的公式来计算，其计算量非常大。在实际应用中，通常使用快速傅里叶变换（FFT）算法来计算二维离散傅里叶变换。FFT 算法可以将二维离散傅里叶变换的计算量从 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( M 2 N 2 ) O(M^2N^2) </math>O(M2N2) 降低到 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( M N log ⁡ ( M N ) ) O(MN\log(MN)) </math>O(MNlog(MN))。

2. 二维离散傅里叶变换的性质

2.1 尺度变换

如果图像在空间域中进行尺度变换，则其傅里叶变换在频率域中会发生相应的尺度反变换。

f(x,y) 将其沿着 x 方向缩放 s 倍，或者沿着 y 方向缩放 t 倍，则其傅里叶变换 F(u,v) 沿着 u 方向缩放 1/s 倍，或者沿着 v 方向缩放 1/t 倍。

2.2 平移性

如果 f(x,y) 沿着 x 方向平移 p 个单位，或者沿着 y 方向平移 q 个单位，则其傅里叶变换 F(u,v) 沿着 u 方向平移 −p 个单位，或者沿着 v 方向平移 −q 个单位。

该性质意味着图像在空间域中平移，其傅里叶变换在频率域中对应方向上发生平移。

2.3 旋转不变性

如果 f(x,y) 绕原点旋转 θ 角度，则其傅里叶变换 F(u,v) 绕原点旋转 −θ 角度。

该性质意味着图像在空间域中旋转，其傅里叶变换在频率域中对应方向上旋转。

2.4 周期性

二维离散傅里叶变换的周期性体现在以下两个方面：

水平方向周期性：将二维离散傅里叶变换的结果沿水平方向平移 M 个单位（即图像宽度），则结果将与原始结果相同。即： <math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u + M , v ) = F ( u , v ) F(u + M, v) = F(u, v) </math>F(u+M,v)=F(u,v)
垂直方向周期性：将二维离散傅里叶变换的结果沿垂直方向平移 N 个单位（即图像高度），则结果将与原始结果相同。即： <math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u , v + N ) = F ( u , v ) F(u, v + N) = F(u, v) </math>F(u,v+N)=F(u,v)

二维离散傅里叶变换的周期性可以用以下公式来表示：

<math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u + k M , v + l N ) = F ( u , v ) F(u + kM, v + lN) = F(u, v) </math>F(u+kM,v+lN)=F(u,v)

其中，k 和 l 是任意整数。

2.5 共轭对称性

二维离散傅里叶变换的实部和虚部具有共轭对称性。即

<math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u , v ) = F ∗ ( − u , − v ) F(u,v)= \mathbf{F}^*(−u,−v) </math>F(u,v)=F∗(−u,−v)

该性质意味着二维离散傅里叶变换的频谱在实轴和虚轴对称。

2.6 傅里叶频谱和相角

二维离散傅里叶变换通常是复函数，因此可以用极坐标形式表示：

<math xmlns="http://www.w3.org/1998/Math/MathML"> F ( u , v ) = R ( u , v ) + j I ( u , v ) = ∣ F ( u , v ) ∣ e j ϕ ( u , v ) F(u,v)= R(u,v)+jI(u,v) = |F(u,v)|e^{j\phi(u,v)} </math>F(u,v)=R(u,v)+jI(u,v)=∣F(u,v)∣ejϕ(u,v)

幅度：

<math xmlns="http://www.w3.org/1998/Math/MathML"> ∣ F ( u , v ) ∣ = [ R 2 ( u , v ) + I 2 ( u , v ) ] 1 / 2 |F(u,v)| = [R^2(u,v)+I^2(u,v)]^{1/2} </math>∣F(u,v)∣=[R2(u,v)+I2(u,v)]1/2 称为傅里叶频谱(频谱)。

而 <math xmlns="http://www.w3.org/1998/Math/MathML"> ϕ ( u , v ) = arctan ⁡ [ I ( u , v ) R ( u , v ) ] \phi(u,v) = \arctan[\frac{I(u,v)}{R(u,v)}] </math>ϕ(u,v)=arctan[R(u,v)I(u,v)] 称为相角(相位谱)。

傅里叶频谱它通常用图像表示，其中亮度表示幅度的大小。傅里叶频谱可以用来分析图像的频率特征。

相角是二维离散傅里叶变换的相位值，它表示图像中各个频率分量的相位信息。相角可以用来分析图像的相位特征。

2.7 二维离散卷积定理

两个函数在空间域中卷积的结果的傅里叶变换等于这两个函数的傅里叶变换在频率域中的乘积。

设 f(x,y) 和 h(x,y) 是两个 M×N 的图像，则其卷积 g(x,y) 定义为：

<math xmlns="http://www.w3.org/1998/Math/MathML"> g ( x , y ) = ∑ k = 0 M − 1 ∑ l = 0 N − 1 f ( k , l ) h ( x − k , y − l ) g(x, y) = \sum_{k = 0}^{M - 1} \sum_{l = 0}^{N - 1} f(k, l) h(x - k, y - l) </math>g(x,y)=∑k=0M−1∑l=0N−1f(k,l)h(x−k,y−l)

其中，x=0,1,...,M−1 和 y=0,1,...,N−1。

根据卷积定理，有：

<math xmlns="http://www.w3.org/1998/Math/MathML"> G ( u , v ) = F ( u , v ) H ( u , v ) G(u, v) = F(u, v) H(u, v) </math>G(u,v)=F(u,v)H(u,v)

其中，G(u,v)、F(u,v) 和 H(u,v) 分别是 g(x,y)、f(x,y) 和 h(x,y) 的二维离散傅里叶变换。

3. 示例

3.1 将频率域图像转换成空间域的图像

下面的代码，展示了图像从空间域转换到频域，再转换回空间域的过程。

cpp 复制代码

#include <opencv2/opencv.hpp>
#include <opencv2/core.hpp>
#include <opencv2/highgui.hpp>

using namespace std;
using namespace cv;

// fft 变换后进行频谱中心化
void fftshift(cv::Mat &plane0, cv::Mat &plane1)
{
    int cx = plane0.cols / 2;
    int cy = plane0.rows / 2;
    cv::Mat q0_r(plane0, cv::Rect(0, 0, cx, cy));  // 元素坐标表示为(cx, cy)
    cv::Mat q1_r(plane0, cv::Rect(cx, 0, cx, cy));
    cv::Mat q2_r(plane0, cv::Rect(0, cy, cx, cy));
    cv::Mat q3_r(plane0, cv::Rect(cx, cy, cx, cy));

    cv::Mat temp;
    q0_r.copyTo(temp);  //左上与右下交换位置(实部)
    q3_r.copyTo(q0_r);
    temp.copyTo(q3_r);

    q1_r.copyTo(temp);  //右上与左下交换位置(实部)
    q2_r.copyTo(q1_r);
    temp.copyTo(q2_r);

    cv::Mat q0_i(plane1, cv::Rect(0, 0, cx, cy));  //元素坐标(cx,cy)
    cv::Mat q1_i(plane1, cv::Rect(cx, 0, cx, cy));
    cv::Mat q2_i(plane1, cv::Rect(0, cy, cx, cy));
    cv::Mat q3_i(plane1, cv::Rect(cx, cy, cx, cy));

    q0_i.copyTo(temp);  //左上与右下交换位置(虚部)
    q3_i.copyTo(q0_i);
    temp.copyTo(q3_i);

    q1_i.copyTo(temp);  //右上与左下交换位置(虚部)
    q2_i.copyTo(q1_i);
    temp.copyTo(q2_i);
}

int main()
{
    Mat src = imread(".../girl.jpg");
    imshow("src", src);

    Mat gray;
    cvtColor(src, gray, COLOR_BGR2GRAY);
    gray.convertTo(gray, CV_32FC1);

    cv::Mat planes[] = {Mat_<float>(gray), cv::Mat::zeros(src.size() , CV_32FC1) };

    cv::Mat complexI;
    cv::merge(planes, 2, complexI); // 合并通道 （把两个矩阵合并为一个2通道的Mat类容器）
    cv::dft(complexI, complexI); // 进行傅立叶变换

    // 分离通道（数组分离）
    cv::split(complexI, planes);

    // 计算幅值
    cv::Mat mag,mag_log,mag_nor;
    cv::magnitude(planes[0], planes[1], mag);

    // 幅值对数化：log（1+m）
    mag += Scalar::all(1);
    cv::log(mag, mag_log);
    cv::normalize(mag_log, mag_nor, 1,0, NORM_MINMAX);

    // 频谱中心化
    fftshift(planes[0], planes[1]);

    cv::Mat dst;

    // 再次频谱中心化
    fftshift(planes[0], planes[1]);
    cv::merge(planes, 2, dst); // 实部与虚部合并
    cv::idft(dst, dst);              // idft 结果也为复数
    dst = dst / dst.rows / dst.cols;
    cv::split(dst, planes);//分离通道，主要获取通道

    convertScaleAbs(gray,gray);
    convertScaleAbs(planes[0],planes[0]);

    imshow("gray", gray);
    imshow("result", planes[0]);
    waitKey(0);

    return 0;
}

3.2 添加盲水印

盲水印功能是指将水印以不可见的形式添加到图片中，这样的水印不会图片观感产生影响，同时也保证了图片的原创性。当发现图片被盗取后，可以通过提取盲水印，将不可见的水印提取出来，验证图片的归属。

下面的代码展示了添加盲水印的流程:

原图 -> 通过傅里叶变换，在频域上添加水印 -> 优化由 dft 操作产生的图像 -> 频域图 -> 傅里叶逆变换 -> 最终在空间域生成含有盲水印的图像