2024.9.13 Python与图像处理新国大EE5731课程大作业，索贝尔算子计算边缘，高斯核模糊边缘，Haar小波计算边缘

1.编写一个图像二维卷积程序。它应该能够处理任何灰度输入图像，并使用以下内核进行操作：

py 复制代码

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
from scipy import linalg
import random as rm
import math
import cv2

# import and show the image
img = cv2.imread('einstein.png',cv2.IMREAD_GRAYSCALE)
plt.imshow(img,plt.cm.gray)
print(img)
img_sz=img.shape

代码逻辑：

提取灰度图，显示图片

py 复制代码

def pascal(k,n):
    if k >= 0 and k <= n:
        y = math.factorial(n)/(math.factorial(n-k)*math.factorial(k))
    else:
        y=0
    return y

算组合种类的pascal函数，就是数学里的大C，之后用于计算索贝尔算子

2.索贝尔算子

Sobel 算子（Sobel Operator）是一种常用的边缘检测算法，用于图像处理领域。它通过计算图像像素的梯度（变化率）来检测图像中的边缘。具体来说，Sobel 算子用于确定图像中灰度变化最明显的区域，这些区域通常对应于物体的边界或细节。

在二维函数中，计算梯度，可以找到变化率最大的部分来，索贝尔算子就是在图像中计算梯度最大的部分。他有两种3*3的卷积核（滤波器）

分别是：

py 复制代码

def sobel(order): 
    sobel_x=np.zeros([order,order])
    smooth=np.zeros([order,1])
    diff=np.zeros([order,1])
    for j in range(0,order):
        smooth=pascal(j,order-1)
#         print(smooth)
        for k in range(0,order):
            diff=pascal(k,order-2)-pascal(k-1,order-2)
#             print(diff)
            sobel_x[j][k]=smooth*diff
            
    sobel_y=-1*sobel_x.T
    return sobel_x,sobel_y

这个代码就可以生成order*order的两种索贝尔算子，如果order是3，那么上面的索贝尔算子就是上面那个图。

py 复制代码

# convolution for sobel kernel, 2 kernel in 2 directions
def convolution_2(img,kernel1,kernel2):
    sz_img=img.shape
    sz_kernel=kernel1.shape
    #[a,b]=sz_kernel
    
    a=int((sz_kernel[0]-1)/2)
    b=int((sz_kernel[1]-1)/2)
    
    pimg=np.zeros(sz_img)
    for j in range(a,(sz_img[0]-a)):
        for k in range(b,(sz_img[1]-b)):
            for i in range(0,2):
                ximg=np.sum(img[j-a:j+a+1,k-b:k+b+1]*kernel1)
                yimg=np.sum(img[j-a:j+a+1,k-b:k+b+1]*kernel2)
                pimg[j][k]=np.abs(ximg)+np.abs(yimg)
    
    return pimg

代码逻辑：

举个例子，现在有一个55的图片，你的卷积核是3 3的，那么现在你需要做的是，在55的图片中先取最左上角的3 3矩阵和两个卷积核相卷积，然后得出两个数字，给这两个数字都做一次绝对值然后再相加，就是这个点的近似梯度，然后55的图像考虑边缘，能做3 3次这样的操作，最后得到3*3的矩阵。

理论上求该点的平方和然后开方才应该是这个点的真实梯度，为什么要用绝对值和呢，因为在庞大的计算中，如果都去做平方和，那就太耗费系统资源了，所以使用绝对值和是近似的计算方法，忽略了方向性，只看水平和垂直梯度的绝对强度之和，它可以提供相对较强的边缘信息，但缺少准确性，边缘会显得比较尖锐和不平滑。

py 复制代码

# when mask size is 3, ploting the Sobel kenerl processed image
[sobel_x,sobel_y]=sobel(3)
print(sobel_x,'\n',sobel_y)
sobel_img = convolution_2(img,sobel_x,sobel_y)
#sobel_x_img=np.uint8(sobel_x_img)
plt.imshow(sobel_img,plt.cm.gray)
# print(sobel_x_img)

计算卷积，生成边缘图像

3.高斯核与高斯卷积

py 复制代码

def convolution_1(img,kernel1):
    sz_img = img.shape          # 获取图像的尺寸
    sz_kernel = kernel1.shape    # 获取卷积核的尺寸
    a = int((sz_kernel[0]-1)/2)  # 计算卷积核在 x 方向的半径
    b = int((sz_kernel[1]-1)/2)  # 计算卷积核在 y 方向的半径
    
    pimg = np.zeros(sz_img)      # 初始化输出图像的大小，和原图大小相同
    for j in range(a, (sz_img[0]-a)):      # 遍历图像的每一个像素
        for k in range(b, (sz_img[1]-b)):
            # 从原图像中提取出一个与高斯核大小相同的子矩阵，进行逐元素相乘并累加
            ximg = np.sum(img[j-a:j+a+1, k-b:k+b+1] * kernel1)
            pimg[j][k] = np.abs(ximg)     # 将卷积后的结果的绝对值赋值给输出图像
    return pimg

这个代码是卷积的定义操作，高斯核还没进去

py 复制代码

#kernel
#gaussian
def gaussian(x,y,delta):
    return 1/(2*math.pi*delta**2)*np.exp(-1*(x*x+y*y)/(2*delta**2))
def Gau(order):
    delta=0.3*((order-1)/2-1)+0.8
    a=int((order-1)/2)
    ga=np.zeros([order,order])
    for j in range(-a,a+1):
        for k in range(-a,a+1):
            ga[j][k]=gaussian(j,k,delta)
    
    return ga
# ga1=1/16*np.array([[1,2,1],[2,4,2],[1,2,1]])
# ga2=1/159*np.array([[2,4,5,4,2],[4,9,12,9,4],[5,12,15,12,5],[4,9,12,9,4],[2,4,5,4,2]])

高斯核（Gaussian Kernel）是图像处理中一种常用的滤波器，用于平滑图像，消除噪声。它是根据高斯函数定义的二维矩阵。高斯核的作用是将图像中的每个像素与其邻域像素的加权平均计算，权重依据高斯分布确定，离中心越近的像素权重越大，离得越远的像素权重越小。

卷积后的图像会变得更加平滑，噪声被抑制，同时保留主要的图像特征。这个函数中使用了绝对值，通常用于保持结果的非负性，但在一般高斯卷积中不一定需要绝对值。

代码先定义了高斯函数，然后定义了高斯核。并给出了常见的三阶高斯核和五阶高斯核

ga1 是较小的高斯核，平滑效果相对较弱，但保留了更多的图像细节。

ga2 是较大的高斯核，平滑效果较强，适合噪声较大的图像。

py 复制代码

# when mask size is 3, ploting the Gaussian kenerl processed image
ga1=Gau(3)
print(ga1)
gaussian_img = convolution_1(img,ga1)
#sobel_x_img=np.uint8(sobel_x_img)
plt.imshow(gaussian_img,plt.cm.gray)
#print(sobel_x_img)

这个代码就是对图像进行高斯卷积操作模糊边缘，高斯卷积核为三层高斯核

效果如下，如果用九阶高斯核代码和输出如下：

py 复制代码

# when mask size is 9, ploting the Gaussian kenerl processed image
ga2=Gau(9)
print(ga2)
gaussian_img = convolution_1(img,ga2)
#sobel_x_img=np.uint8(sobel_x_img)
plt.imshow(gaussian_img,plt.cm.gray)
#print(sobel_x_img)

4.Haar小波卷积核

Haar 小波卷积是一种高效的边缘检测和特征提取方法。它通过简单的 1 和 -1 构造出卷积核，可以快速检测图像中的边缘和变化。

卷积操作将 Haar 核应用于图像，生成新的特征图，用于分析图像的结构和特征。

Haar 小波广泛应用于边缘检测、图像压缩和特征提取等任务，尤其适合实时计算和高效处理场景。

在计算机视觉中，Haar 小波常用于特征提取。例如，人脸检测算法中，Haar 特征被用于快速检测图像中的人脸区域。适合实时计算和高效处理场景。
与 Sobel 核的对比

Sobel 卷积核也是用于边缘检测的，但与 Haar 核不同，Sobel 核使用的是平滑的梯度变化，而 Haar 核直接检测的是 1 和 -1 的急剧变化。与 Sobel 核相比，Haar 核的计算更加简单，但 Sobel 核能够更精细地检测梯度信息，适合检测较为平滑的边缘。

py 复制代码

# Haar kernel
def Haar(order):
    block=np.ones([order,order]).astype(int)
    mask1=np.concatenate([-1*block,block],axis=0)
    mask2=np.concatenate([-1*block,block],axis=1)
    mask3=np.concatenate([block,-1*block,block],axis=0)
    mask4=np.concatenate([block,-1*block,block],axis=1)
    mask5=np.concatenate([mask1,-1*mask1],axis=1)
    mask=[mask1,mask2,mask3,mask4,mask5]
    return mask

# 2D convolution for Haar kernel
def convolution_3(img,mask):
    sz_img=img.shape
    sz_kernel=mask.shape
    #[a,b]=sz_kernel
    
    a=int(sz_kernel[0])
    b=int(sz_kernel[1])
    
    pimg=np.zeros(sz_img)
    for j in range(0,(sz_img[0]-a)):
        for k in range(0,(sz_img[1]-b)):
            for i in range(0,2):
                ximg=np.sum(img[j:j+a,k:k+b]*mask)
                #yimg=np.sum(img[j-a:j+a+1,k-b:k+b+1]*kernel2)
                pimg[j][k]=np.abs(ximg)
    
    return pimg

代码逻辑：

定义Haar卷积核，注意，给定一个维度数，会同时产生五个Haar卷积核，存放在数组中

mask1: 检测水平边缘，例如物体的上下轮廓。

mask2: 检测垂直边缘，例如物体的左右轮廓。

mask3: 检测正对角线方向，捕捉从左上到右下的边缘。

mask4: 检测反对角线方向，捕捉从左下到右上的边缘。

mask5: 检测复杂变化，这是由 mask1 的进一步组合生成的更复杂卷积核，通过在水平和垂直方向进行进一步拼接。这种结构的卷积核可以检测图像中的更复杂的变化模式，包括一些图像块内部的细节变化。它的作用不是单一的某个方向检测，而是组合式的模式检测，能捕捉图像中的更细腻特征。

py 复制代码

# when mask size is 1, ploting the Haar kenerl processed image
mask=Haar(1)
print(mask)
for ma in mask:
    Haar_img = convolution_3(img,ma)
    plt.imshow(Haar_img,plt.cm.gray)
    plt.show()

# when mask size is 2, ploting the Haar kenerl processed image
mask=Haar(2)
print(mask)
for ma in mask:
    Haar_img = convolution_3(img,ma)
    plt.imshow(Haar_img,plt.cm.gray)
    plt.show()

这个代码就是使用Haar的两个不同的size输出的效果。

结果就是Sobel 核提取图像的边缘；高斯核使图像模糊；不同的 Haar mask 效果不同。Type1 的输出像 sobel 一样提取边缘。Type2 的输出像高斯一样使图像模糊。Type3 看起来像是 type1 中 2 个输出的组合。

核的尺寸越大，核的效果越强。