图像滤波：手撕五大经典滤波（均值 / 高斯 / 中值 / 双边 / 导向）【计算机视觉】

[图像滤波（Image Filtering）](#图像滤波（Image Filtering）)
- Ⅰ、引言
- - [1. 图像滤波的作用](#1. 图像滤波的作用)
  - [2. 五大经典滤波](#2. 五大经典滤波)
- Ⅱ、线性滤波
- - [一、均值滤波（Mean Filter）](#一、均值滤波（Mean Filter）)
  - - [1. 均值滤波核心概述](#1. 均值滤波核心概述)
    - [2. 均值滤波的数学原理](#2. 均值滤波的数学原理)
    - [3. 具体例题手动计算（直观理解核心逻辑）](#3. 具体例题手动计算（直观理解核心逻辑）)
    - [4. Python 代码实现均值滤波](#4. Python 代码实现均值滤波)
    - [5. cv2.blur()函数](#5. cv2.blur()函数)
    - 6.总结
  - [二、高斯滤波（Gauss Filter）](#二、高斯滤波（Gauss Filter）)
  - - [1. 高斯噪声](#1. 高斯噪声)
    - [2. 高斯滤波器核心概述](#2. 高斯滤波器核心概述)
    - [3. 高斯滤波的数学原理](#3. 高斯滤波的数学原理)
    - - （1）核心数学公式
      - （2）高斯核权重计算
    - [4. Python 代码实现高斯滤波](#4. Python 代码实现高斯滤波)
    - 5.cv2.GaussianBlur()函数
    - [6. 总结](#6. 总结)
  - [均值滤波 vs 高斯滤波（处理高斯噪声）对比表](#均值滤波 vs 高斯滤波（处理高斯噪声）对比表)
- Ⅲ、非线性滤波
- - [三、中值滤波（Median Filter）](#三、中值滤波（Median Filter）)
  - - [1. 椒盐噪声](#1. 椒盐噪声)
    - [2. 中值滤波器核心概述](#2. 中值滤波器核心概述)
    - [3. 中值滤波的数学原理](#3. 中值滤波的数学原理)
    - - （1）核心数学表达式
      - [（2）3×3 中值滤波分步实现](#（2）3×3 中值滤波分步实现)
      - [（3）5×5 中值滤波补充说明](#（3）5×5 中值滤波补充说明)
    - [4. Python 代码实现中值滤波](#4. Python 代码实现中值滤波)
    - [5. cv2.medianBlur() 函数](#5. cv2.medianBlur() 函数)
    - 6.总结
  - [四、双边滤波（Bilateral Filter）](#四、双边滤波（Bilateral Filter）)
  - - [1. 双边滤波器核心概述](#1. 双边滤波器核心概述)
    - [2. 双边滤波的数学原理](#2. 双边滤波的数学原理)
    - - （1）核心数学表达式
      - [（2）3×3 双边滤波分步实现](#（2）3×3 双边滤波分步实现)
      - （3）大窗口双边滤波补充说明
    - [3. 双边滤波主要应用场景](#3. 双边滤波主要应用场景)
    - [4.Python 代码实现双边滤波](#4.Python 代码实现双边滤波)
    - - [（1）强高斯噪声滤波对比实验（双边滤波 vs 高斯滤波）](#（1）强高斯噪声滤波对比实验（双边滤波 vs 高斯滤波）)
      - [（2）强椒盐噪声滤波（双边滤波 vs 中值滤波）](#（2）强椒盐噪声滤波（双边滤波 vs 中值滤波）)
    - [5. cv2.bilateralFilter()函数](#5. cv2.bilateralFilter()函数)
    - [6. 总结](#6. 总结)
  - [五、导向滤波（Guided Filter）](#五、导向滤波（Guided Filter）)
  - - [1. 导向滤波核心概述](#1. 导向滤波核心概述)
    - [2. 导向滤波的数学原理](#2. 导向滤波的数学原理)
    - - （1）核心数学表达式
      - [（2）3×3 导向滤波分步实现](#（2）3×3 导向滤波分步实现)
      - （3）大窗口导向滤波补充说明
    - [3. 高斯噪声环境下导向滤波与双边滤波的保边去噪性能对比实验](#3. 高斯噪声环境下导向滤波与双边滤波的保边去噪性能对比实验)
    - [4. Python 代码实现导向滤波](#4. Python 代码实现导向滤波)
    - [5. cv2.ximgproc.guidedFilter() 函数](#5. cv2.ximgproc.guidedFilter() 函数)
    - [6. 总结](#6. 总结)
  - 非线性滤波对比表格
- Ⅳ、图像滤波总结
- - 上一章

图像滤波（Image Filtering）

图像滤波：用一个固定大小的滑动窗口（卷积核）遍历图像，根据窗口内邻域像素的统计或加权信息，重新计算并更新中心像素值的过程。

Ⅰ、引言

1. 图像滤波的作用

图像滤波的主要作用是提升图像质量 ，让后续任务更可靠。实际图像常包含噪声、纹理干扰或光照不均，这些都会影响检测、分割、识别等算法的性能。滤波能有效抑制噪声 、突出关键结构 ，是计算机视觉系统中不可或缺的预处理步骤。

2. 五大经典滤波

滤波类型	具体算法	核心原理	特点与适用场景
线性滤波	均值滤波	用邻域内所有像素的平均值替换中心像素	简单快速，计算高效；但会模糊图像边缘，细节丢失明显，适用于高斯噪声抑制、对图像模糊度要求不高的场景
线性滤波	高斯滤波	根据高斯分布给邻域像素分配不同权重，再进行加权平均	权重符合正态分布，图像模糊更自然柔和，边缘模糊程度低于均值滤波；是最常用的平滑滤波，广泛适用于各类高斯噪声抑制、图像预处理平滑场景
非线性滤波	中值滤波	取邻域像素的中位数作为中心像素新值	对椒盐噪声（黑白亮点/暗点）特别有效；能较好保留图像边缘细节，无线性模糊的拖影；适用于椒盐噪声去除、需要保留边缘的平滑场景
非线性滤波	双边滤波	同时考虑空间距离（邻域远近）和像素值相似度（色彩差异），进行加权平滑	兼具平滑降噪和边缘保留的特性（保边去噪）；模糊程度低，细节保留好，适用于需要降噪且不希望边缘模糊的场景（如人像磨皮、景物细节保留）
非线性滤波	导向滤波	利用引导图（通常为原图）计算局部线性模型，基于模型实现平滑加权	保边平滑效果更精确，优于双边滤波，且具有可解释性；常用于图像增强、抠图、去雾、边缘保留平滑等高精度图像处理任务

Ⅱ、线性滤波

一、均值滤波（Mean Filter）

1. 均值滤波核心概述

均值滤波（Mean Filter）是一种最基础的线性空间域滤波方法，核心思想是用图像中某像素点周围邻域内所有像素的灰度平均值，来替代该像素点的原始灰度值，从而实现对图像噪声的平滑（抑制）效果，尤其对高斯噪声有较好的处理表现。

2. 均值滤波的数学原理

（1）核心数学公式

均值滤波的数学表达分为离散域像素计算 和卷积核表达两种形式，本质等价。

（2）离散域像素直接计算

对于图像中的任意像素点 ( x , y ) (x, y) (x,y)，其经过均值滤波后的输出灰度值 g ( x , y ) g(x, y) g(x,y) 计算公式为：
g ( x , y ) = 1 M × N ∑ i = − a a ∑ j = − b b f ( x + i , y + j ) g(x, y) = \frac{1}{M \times N} \sum_{i=-a}^{a} \sum_{j=-b}^{b} f(x+i, y+j) g(x,y)=M×N1i=−a∑aj=−b∑bf(x+i,y+j)

其中：

f ( x , y ) f(x, y) f(x,y)：图像的原始灰度值（输入图像）
g ( x , y ) g(x, y) g(x,y)：均值滤波后的灰度值（输出图像）
M × N M \times N M×N：邻域窗口的尺寸（通常取奇数，如 3 × 3 3 \times 3 3×3、 5 × 5 5 \times 5 5×5， M = 2 a + 1 M=2a+1 M=2a+1， N = 2 b + 1 N=2b+1 N=2b+1）
1 M × N \frac{1}{M \times N} M×N1：归一化系数（保证滤波后图像灰度值范围不溢出）

（3）卷积核（模板）表达

均值滤波本质是一种卷积运算，对应的卷积核（均值模板）是一个所有元素值相等且满足归一化的矩阵。

以最常用的 3 × 3 3 \times 3 3×3 均值卷积核为例，其形式为：
K = 1 9 [ 1 1 1 1 1 1 1 1 1 ] K = \frac{1}{9} \begin{bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{bmatrix} K=91 111111111

再如 5 × 5 5 \times 5 5×5 均值卷积核：
K = 1 25 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ] K = \frac{1}{25} \begin{bmatrix} 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 \end{bmatrix} K=251 1111111111111111111111111

卷积运算过程 ：将卷积核中心与图像像素 ( x , y ) (x, y) (x,y) 对齐，卷积核各元素与对应位置的图像像素相乘，求和后得到的结果即为 g ( x , y ) g(x, y) g(x,y)（由于卷积核元素均为1，相乘求和等价于直接求和，再除以窗口像素总数）。

（4）边界处理说明

当卷积核滑动到图像边缘时，会出现邻域超出图像范围 的问题（比如图像左上角像素， 3 × 3 3 \times 3 3×3 邻域有一半在图像外），常用解决方法有：

边界填充（最常用）：在图像边缘填充0（零填充）、重复边缘像素（复制填充）、镜像填充等，使卷积核能够完整滑动；
忽略边缘像素：直接舍弃图像边缘无法完整计算的像素，输出图像尺寸略小于输入图像；
裁剪卷积核：边缘位置使用缩小的邻域窗口计算（不推荐，会导致边缘效果不一致）。

3. 具体例题手动计算（直观理解核心逻辑）

为了更清晰地掌握均值滤波的计算过程，我们以 3 × 3 3 \times 3 3×3 邻域窗口为例，进行手动分步计算，无边界问题（选取图像内部像素，无需填充）。

（1）例题条件

给定一张 5 × 5 5 \times 5 5×5 的灰度图像（像素值为0-255之间的整数），如下所示（矩阵形式，行号0-4，列号0-4）：
f ( x , y ) = [ 10 20 30 40 50 15 25 35 45 55 20 30 40 50 60 25 35 45 55 65 30 40 50 60 70 ] f(x, y) = \begin{bmatrix} 10 & 20 & 30 & 40 & 50 \\ 15 & 25 & 35 & 45 & 55 \\ 20 & 30 & \textbf{40} & 50 & 60 \\ 25 & 35 & 45 & 55 & 65 \\ 30 & 40 & 50 & 60 & 70 \end{bmatrix} f(x,y)= 10152025302025303540303540455040455055605055606570

要求：使用 3 × 3 3 \times 3 3×3 均值滤波，计算中心像素 ( 2 , 2 ) (2, 2) (2,2)（像素值为40，加粗标注）的滤波后输出值 g ( 2 , 2 ) g(2, 2) g(2,2)。

（2）分步计算过程

步骤1：确定邻域窗口范围

根据 3 × 3 3 \times 3 3×3 窗口要求，中心像素 ( 2 , 2 ) (2, 2) (2,2) 对应的邻域窗口为行号1-3、列号1-3的像素区域，提取该邻域窗口的像素值：
邻域窗口 = [ 25 35 45 30 40 50 35 45 55 ] \text{邻域窗口} = \begin{bmatrix} 25 & 35 & 45 \\ 30 & 40 & 50 \\ 35 & 45 & 55 \end{bmatrix} 邻域窗口= 253035354045455055

步骤2：计算邻域窗口内所有像素的总和

将窗口内9个像素值依次相加：
S = 25 + 35 + 45 + 30 + 40 + 50 + 35 + 45 + 55 = 360 S = 25 + 35 + 45 + 30 + 40 + 50 + 35 + 45 + 55=360 S=25+35+45+30+40+50+35+45+55=360

步骤3：除以窗口像素总数（归一化），得到滤波结果
3 × 3 3 \times 3 3×3 窗口的像素总数为9，因此均值为：
g ( 2 , 2 ) = S 9 = 360 9 = 40 g(2, 2) = \frac{S}{9} = \frac{360}{9} = 40 g(2,2)=9S=9360=40

（3）例题扩展说明

本例题中中心像素滤波后值仍为40，是因为邻域像素呈均匀递增分布，平均值恰好等于原始像素值，实际含噪图像中这种情况极少；
若中心像素原始值为60（模拟噪声干扰），邻域总和仍为360，则滤波后值为40，可见均值滤波会将噪声像素拉回到邻域平均水平，实现噪声抑制；
若使用 5 × 5 5 \times 5 5×5 窗口计算该像素，邻域总和为1000，均值为 1000 / 25 = 40 1000/25=40 1000/25=40，同样可得到稳定结果，但窗口越大，越容易抹平周边像素的差异。

（4）例题代码验证

python 复制代码

import numpy as np

# 1. 构建例题中的5x5原始图像矩阵
original_image = np.array([
    [10, 20, 30, 40, 50],
    [15, 25, 35, 45, 55],
    [20, 30, 40, 50, 60],
    [25, 35, 45, 55, 65],
    [30, 40, 50, 60, 70]
], dtype=np.uint8)

# 2. 提取3x3邻域窗口（对应中心像素(2,2)，行1-3，列1-3）
neighborhood = original_image[1:4, 1:4]  # 切片：左闭右开，1:4对应索引1、2、3

# 3. 计算邻域窗口的总和与平均值（模拟均值滤波核心计算）
neighborhood_sum = np.sum(neighborhood)
neighborhood_mean = np.mean(neighborhood)

# 4. 打印结果，验证手动计算
print("=== 均值滤波例题验证结果 ===")
print(f"3x3邻域窗口像素矩阵：\n{neighborhood}")
print(f"邻域窗口像素总和：{neighborhood_sum}")
print(f"邻域窗口像素平均值（滤波后结果）：{neighborhood_mean}")

4. Python 代码实现均值滤波

python 复制代码

import numpy as np
import cv2
import matplotlib.pyplot as plt

# -------- 核心：添加Matplotlib中文显示配置 --------
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

def manual_mean_filter(image, kernel_size=3):

    if kernel_size % 2 == 0:
        raise ValueError("卷积核尺寸必须为奇数，请修改kernel_size参数")

    h, w = image.shape
    pad_size = kernel_size // 2
    padded_image = np.pad(image, pad_width=pad_size, mode='edge')
    output_image = np.zeros_like(image)

    for y in range(h):
        for x in range(w):
            neighborhood = padded_image[y:y+kernel_size, x:x+kernel_size]
            output_image[y, x] = np.mean(neighborhood)

    return output_image.astype(np.uint8)

对def manual_mean_filter(image, kernel_size=3):的解析

python 复制代码

if kernel_size % 2 == 0:
    raise ValueError("卷积核尺寸必须为奇数，请修改kernel_size参数")

逻辑：使用取模运算%判断kernel_size是否为偶数（对2取模结果为0即为偶数）。
作用：
1. 均值滤波窗口需要有唯一的中心像素（如3×3窗口中心是第2行第2列），偶数尺寸窗口无明确中心，会导致滤波逻辑混乱。
2. 传入偶数时抛出明确异常，避免后续代码运行出现未知问题。

python 复制代码

h, w = image.shape
pad_size = kernel_size // 2

h, w = image.shape：从输入灰度图像的shape属性中解包出图像高度（h）和宽度（w）。
pad_size = kernel_size // 2：
1. 核心作用：保证滤波后输出图像尺寸与输入图像完全一致，避免尺寸缩小。
2. 示例：kernel_size=3时pad_size=1，kernel_size=5时pad_size=2。

python 复制代码

padded_image = np.pad(image, pad_width=pad_size, mode='edge')

功能：调用numpy.pad()对原始图像进行边界填充。
参数说明：
- pad_width=pad_size：上下左右四个方向各填充pad_size个像素。
- mode='edge'：填充模式为「边缘复制」，使用图像边缘像素值填充边界，减少边缘滤波失真。
核心作用：
1. 解决卷积核滑动到图像边缘时无法提取完整邻域窗口的问题。
2. 保证输出图像尺寸与输入图像一致，避免尺寸损失。

python 复制代码

output_image = np.zeros_like(image)

创建与输入图像image形状相同、数据类型相同的全零数组，用于存储滤波结果。

python 复制代码

for y in range(h):
    for x in range(w):
        neighborhood = padded_image[y:y+kernel_size, x:x+kernel_size]
        output_image[y, x] = np.mean(neighborhood)

核心逻辑：「滑动窗口遍历」+「邻域像素求平均」，对应均值滤波的数学原理。
逐行解析：
1. 双重循环遍历：外层循环遍历图像每一行，内层循环遍历图像每一列，实现卷积核逐行逐列滑动。
2. 提取邻域窗口：通过numpy切片从填充后图像中提取kernel_size×kernel_size的邻域像素。
3. 邻域求平均：调用np.mean()计算邻域内像素平均值，赋值给输出图像对应位置，实现噪声「拉平」降噪。

python 复制代码

return output_image.astype(np.uint8)

将输出图像转换为uint8类型（8位无符号整数），符合图像存储和显示的标准格式。

python 复制代码

img_gray = cv2.imread("img/lena.jpeg", cv2.IMREAD_GRAYSCALE)
if img_gray is None:
    raise FileNotFoundError("未找到测试图像，请确保img/test_image.jpg在对应目录下")

# 添加高斯噪声
np.random.seed(42)
noise = np.random.normal(0, 20, img_gray.shape).astype(np.uint8)
noisy_img = cv2.add(img_gray, noise)

# 执行均值滤波
filtered_img_3 = manual_mean_filter(noisy_img, kernel_size=3)
filtered_img_5 = manual_mean_filter(noisy_img, kernel_size=5)

# 可视化（中文标题可正常显示，无乱码）
plt.figure(figsize=(16, 8))
plt.subplot(2, 2, 1)
plt.imshow(img_gray, cmap='gray')
plt.title("原始灰度图像", fontsize=12)  # 中文标题
plt.axis('off')

plt.subplot(2, 2, 2)
plt.imshow(noisy_img, cmap='gray')
plt.title("添加高斯噪声后的图像", fontsize=12)  # 中文标题
plt.axis('off')

plt.subplot(2, 2, 3)
plt.imshow(filtered_img_3, cmap='gray')
plt.title("手动实现3x3均值滤波结果", fontsize=12)  # 中文标题
plt.axis('off')

plt.subplot(2, 2, 4)
plt.imshow(filtered_img_5, cmap='gray')
plt.title("手动实现5x5均值滤波结果", fontsize=12)  # 中文标题
plt.axis('off')

plt.tight_layout()
plt.show()

5. cv2.blur()函数

cv2.blur() 是 OpenCV 库中专门用于实现「均值滤波」的内置函数，核心作用是对图像进行降噪和平滑处理，底层采用 C++ 优化实现，运行高效，是图像处理中抑制高斯噪声、弱化图像细节边缘的常用工具。

python 复制代码

dst = cv2.blur(src, ksize, anchor=None, borderType=None)

核心必选参数（实际开发中最常用）

参数	含义与说明
`src`	输入图像（待滤波的图像），支持 uint8、float32 等数据类型，OpenCV 读取的灰度图 / 彩色图均可直接传入。
`ksize`	滤波窗口（又称卷积核）尺寸，格式为 (width, height)（宽度 × 高度），要求为正整数。常用正方形奇数窗口：(3, 3)、(5, 5)、(7, 7)，窗口越大，降噪 / 平滑效果越强，图像细节丢失越多。

可选参数（默认值满足常规需求）

参数	含义与说明
`anchor`	窗口锚点（滤波时的参考中心），默认值 (-1, -1)，表示锚点位于窗口中心，无需手动修改。
`borderType`	边界填充方式，默认值 cv2.BORDER_DEFAULT（等价于边缘复制填充），解决图像边缘无法提取完整窗口的问题，避免边缘像素滤波失效。

返回值 dst

滤波后的输出图像，格式、尺寸与输入图像 src 完全一致：

输入灰度图，返回灰度图；输入 BGR 彩色图，返回 BGR 彩色图。
像素值已完成邻域平均更新，保留 OpenCV 默认图像格式，可直接用于后续其他 OpenCV 图像处理函数。

这时我们就可以对上面的代码进行优化

python 复制代码

# 转换为灰度图（可选，也可直接处理彩色图）
img_gray = cv2.imread("img/lena.jpeg", cv2.IMREAD_GRAYSCALE)
# BGR 转 RGB（适配Matplotlib显示彩色图像）
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 添加高斯噪声
np.random.seed(42)
noise = np.random.normal(0, 20, img.shape).astype(np.uint8)
noisy_img = cv2.add(img, noise)
noisy_img_rgb = cv2.cvtColor(noisy_img, cv2.COLOR_BGR2RGB)

# 执行OpenCV均值滤波
filtered_img_3 = cv2.blur(noisy_img, ksize=(3, 3))
filtered_img_3_rgb = cv2.cvtColor(filtered_img_3, cv2.COLOR_BGR2RGB)

filtered_img_5 = cv2.blur(noisy_img, ksize=(5, 5))
filtered_img_5_rgb = cv2.cvtColor(filtered_img_5, cv2.COLOR_BGR2RGB)

先通过cv2.imread()完成图像读取（含可选灰度图、核心彩色图），再通过cv2.cvtColor()将OpenCV默认的BGR格式转换为Matplotlib兼容的RGB格式（适配可视化）；
接着通过np.random.normal()生成高斯噪声、cv2.add()将噪声叠加到彩色原图制造带噪图像；
最后通过核心滤波函数cv2.blur()分别以3×3和5×5窗口执行均值滤波实现降噪，并再次通过 cv2.cvtColor()将带噪图、滤波图统一转换为RGB格式
「图像读取→格式适配→噪声添加→均值滤波→显示适配」，为后续可视化对比降噪效果做好准备。

python 复制代码

plt.figure(figsize=(16, 8))
plt.subplot(2, 2, 1)
plt.imshow(img_rgb)
plt.title("原始彩色图像（Lena）", fontsize=12)
plt.axis('off')

plt.subplot(2, 2, 2)
plt.imshow(noisy_img_rgb)
plt.title("添加高斯噪声后的Lena图像", fontsize=12)
plt.axis('off')

plt.subplot(2, 2, 3)
plt.imshow(filtered_img_3_rgb)
plt.title("OpenCV 3x3均值滤波结果", fontsize=12)
plt.axis('off')

plt.subplot(2, 2, 4)
plt.imshow(filtered_img_5_rgb)
plt.title("OpenCV 5x5均值滤波结果", fontsize=12)
plt.axis('off')

plt.tight_layout()
plt.show()

6.总结

均值滤波主要解决图像中的高斯噪声 （又称正态噪声）干扰问题，同时可辅助解决图像中微小纹理、杂点带来的视觉杂乱问题
均值滤波的核心逻辑是 「滑动窗口 + 邻域等权平均」，通过cv2.blur()函数自动实现，无需手动干预
均值滤波的数学本质是 「邻域像素的算术平均值计算」，通过对局部窗口内的像素值进行等权求和再平均，用统计平均结果抵消单个噪声像素的极端值，从而抹平像素值的剧烈波动，实现降噪和平滑，其数学表达简洁且易于理解。

二、高斯滤波（Gauss Filter）

1. 高斯噪声

python 复制代码

# 单元格1：导入依赖库 + 创建img文件夹（若不存在，避免路径报错）+ 新增高斯噪声函数
import numpy as np
import cv2
import matplotlib.pyplot as plt

# 配置Matplotlib中文显示（可选，避免图表中文乱码）
plt.rcParams["font.sans-serif"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False

python 复制代码

def add_gaussian_noise(image, mean=0, var=0.005):

    image_float = np.array(image, dtype=np.float32) / 255.0

    noise = np.random.normal(mean, np.sqrt(var), image_float.shape)

    noisy_image_float = np.clip(image_float + noise, 0, 1)

    noisy_image = np.uint8(noisy_image_float * 255.0)

    noise_normalized = np.zeros_like(noise)
    if len(noise.shape) == 3:  # 彩色图（H,W,3）
        for channel in range(3):
            channel_noise = noise[..., channel]
            chan_min, chan_max = np.min(channel_noise), np.max(channel_noise)
            if chan_max - chan_min != 0:
                noise_normalized[..., channel] = (channel_noise - chan_min) / (chan_max - chan_min)
            else:
                noise_normalized[..., channel] = channel_noise
    else:  # 灰度图（H,W）
        noise_min, noise_max = np.min(noise), np.max(noise)
        if noise_max - noise_min != 0:
            noise_normalized = (noise - noise_min) / (noise_max - noise_min)
        else:
            noise_normalized = noise
    noise_uint8 = np.uint8(noise_normalized * 255.0)

    return noisy_image, noise_uint8

add_gaussian_noise 函数解析

该函数用于给灰度/彩色图像添加高斯噪声，返回带噪声的图像和可单独可视化的归一化噪声矩阵。
1. 图像预处理：转换为浮点型并归一化
  将输入图像转换为 float32 类型，并除以 255 归一化到 [0, 1] 区间，避免噪声计算时出现溢出或失真问题。

python 复制代码

	image_float = np.array(image, dtype=np.float32) / 255.0

1. 生成高斯噪声矩阵
  利用 np.random.normal 生成符合高斯分布的噪声，噪声的尺寸与预处理后的图像完全一致（彩色图自动适配 3 通道，灰度图适配 2 维尺寸），其中：
mean：高斯噪声的均值，默认 0，避免图像整体明暗偏移
np.sqrt(var)：高斯噪声的标准差，由方差开方得到，控制噪声强度

python 复制代码

	noise = np.random.normal(mean, np.sqrt(var), image_float.shape)

1. 图像添加噪声并裁剪合法范围
  将预处理后的图像与高斯噪声相加，再通过 np.clip 裁剪到 [0, 1] 区间，确保数值不会超出浮点型图像的合法范围，避免出现异常明暗区域。

python 复制代码

	noisy_image_float = np.clip(image_float + noise, 0, 1)

1. 转换回 uint8 格式图像（用于后续处理）
  将浮点型带噪声图像乘以 255 还原到 [0, 255] 区间，再转换为 uint8 类型（OpenCV 图像默认格式），得到可直接用于后续滤波等处理的带噪声图像。

python 复制代码

	noisy_image = np.uint8(noisy_image_float * 255.0)

1. 初始化噪声归一化矩阵
  创建一个与原始噪声矩阵尺寸、类型完全一致的全 0 矩阵，用于存储后续归一化后的噪声数据，为单独可视化噪声做准备。

python 复制代码

	noise_normalized = np.zeros_like(noise)

1. 彩色图噪声归一化（多通道独立处理）
  针对 3 通道彩色图像（形状为 H,W,3），遍历每个颜色通道进行独立归一化：

提取当前通道的噪声数据
计算该通道噪声的最大值和最小值
若最大值与最小值不相等，通过 Min-Max 归一化将通道噪声转换到 [0, 1] 区间
若最大值与最小值相等（无有效噪声），直接保留原始噪声数据

python 复制代码

if len(noise.shape) == 3:  # 彩色图（H,W,3）
        for channel in range(3):
            channel_noise = noise[..., channel]
            chan_min, chan_max = np.min(channel_noise), np.max(channel_noise)
            if chan_max - chan_min != 0:
                noise_normalized[..., channel] = (channel_noise - chan_min) / (chan_max - chan_min)
            else:
                noise_normalized[..., channel] = channel_noise

1. 灰度图噪声归一化（单通道处理）
  针对 2 维灰度图像（形状为 H,W），直接对整个噪声矩阵进行 Min-Max 归一化：

计算灰度噪声的最大值和最小值
若最大值与最小值不相等，转换到 [0, 1] 区间
若最大值与最小值相等，直接保留原始噪声数据

python 复制代码

 else:  # 灰度图（H,W）
        noise_min, noise_max = np.min(noise), np.max(noise)
        if noise_max - noise_min != 0:
            noise_normalized = (noise - noise_min) / (noise_max - noise_min)
        else:
            noise_normalized = noise

1. 转换噪声矩阵为可可视化格式
  将归一化到 [0, 1] 区间的噪声矩阵乘以 255，再转换为 uint8 类型，得到可直接用 plt.imshow 可视化的噪声图像。

python 复制代码

	noise_uint8 = np.uint8(noise_normalized * 255.0)

1. 函数返回结果
  返回两个核心结果，满足不同使用需求：

noisy_image：带高斯噪声的原始格式图像（uint8 类型），可用于后续滤波、检测等图像处理流程
noise_uint8：归一化后的单独噪声图像（uint8 类型），可用于直观展示高斯噪声的分布样貌

python 复制代码

	return noisy_image, noise_uint8

2. 高斯滤波器核心概述

高斯滤波是一种基于高斯函数（正态分布）的线性平滑滤波，常用于消除高斯噪声（如相机传感器噪声）。
它的核心特点是：对图像中距离中心点越近的像素，赋予越高的权重，既平滑图像又能更好地保留边缘细节（比均值滤波更柔和）。

3. 高斯滤波的数学原理

（1）核心数学公式

高斯滤波的权重核（卷积核）由二维高斯函数 生成：
G ( x , y ) = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 G(x,y) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}} G(x,y)=2πσ21e−2σ2x2+y2

x , y x,y x,y：核内像素相对于中心点的坐标（如3×3核的中心点坐标为(0,0)，周围为(±1,±1)）；
σ \sigma σ：高斯分布的标准差， σ \sigma σ越大，核的"模糊程度"越强。

当 σ = 1 \sigma=1 σ=1 时，公式简化为：
G ( x , y ) = 1 2 π e − x 2 + y 2 2 G(x,y) = \frac{1}{2\pi} e^{-\frac{x^2 + y^2}{2}} G(x,y)=2π1e−2x2+y2

其中： ( x , y ) (x,y) (x,y)：核内像素相对于中心 ( 0 , 0 ) (0,0) (0,0) 的坐标

（2）高斯核权重计算

步骤1：确定 3×3 核坐标

中心为 ( 0 , 0 ) (0,0) (0,0)，只需要算 3 种位置（其余位置值相同）：

中心点： ( 0 , 0 ) (0,0) (0,0)（1 个）
相邻点： ( 1 , 0 ) (1,0) (1,0)、 ( 0 , 1 ) (0,1) (0,1)（共 4 个）
对角点： ( 1 , 1 ) (1,1) (1,1)（共 4 个）

步骤2：获取原始权重（σ=1）

用高斯公式 G ( x , y ) = 1 2 π e − x 2 + y 2 2 G(x,y)=\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}} G(x,y)=2π1e−2x2+y2 代入坐标，得到近似值：

中心点 ( 0 , 0 ) (0,0) (0,0)： x 2 + y 2 = 0 x^2+y^2=0 x2+y2=0 → G ≈ 0.159 G≈0.159 G≈0.159
相邻点 ( 1 , 0 ) (1,0) (1,0)： x 2 + y 2 = 1 x^2+y^2=1 x2+y2=1 → G ≈ 0.092 G≈0.092 G≈0.092
对角点 ( 1 , 1 ) (1,1) (1,1)： x 2 + y 2 = 2 x^2+y^2=2 x2+y2=2 → G ≈ 0.059 G≈0.059 G≈0.059

步骤3：计算权重总和
总和 = 0.159 + 4 × 0.092 + 4 × 0.059 ≈ 0.876 总和 = 0.159 + 4×0.092 + 4×0.059 ≈ 0.876 总和=0.159+4×0.092+4×0.059≈0.876

步骤4：归一化（让权重和为 1，避免图像变暗）

每个权重除以总和 0.876 0.876 0.876，取近似值：

中心点： 0.159 ÷ 0.876 ≈ 0.256 0.159 ÷ 0.876 ≈ 0.256 0.159÷0.876≈0.256
相邻点： 0.092 ÷ 0.876 ≈ 0.129 0.092 ÷ 0.876 ≈ 0.129 0.092÷0.876≈0.129
对角点： 0.059 ÷ 0.876 ≈ 0.065 0.059 ÷ 0.876 ≈ 0.065 0.059÷0.876≈0.065

步骤5：最终 3×3 高斯核

排序后极端值（255）被排至末尾，正常灰度值集中在前面，有效分离噪声与正常像素；
排序是中值滤波的核心步骤，为后续提取中间值提供基础。

步骤3：提取中间值（代入数学公式）

根据中值运算的数学表达式，取排序后第 5 个值（ a 5 a_5 a5）作为中间值：
m e d { 11 , 12 , 13 , 14 , 15 , 16 , 17 , 18 , 255 } = a 5 = 15 med\left\{ 11,12,13,14,15,16,17,18,255 \right\} = a_5 = 15 med{11,12,13,14,15,16,17,18,255}=a5=15

本次窗口的中间值为：15，该值为窗口内正常像素的典型灰度值，无噪声干扰。

步骤4：替换窗口中心点像素值

将 3×3 窗口中心点的原像素值（255，椒盐噪声）替换为提取的中间值（15），替换后窗口像素值更新为：