Python----计算机视觉处理（Opencv：自适应二值化，取均值，加权求和（高斯定理））

一、自适应二值化

与二值化算法相比，自适应二值化更加适合用在明暗分布不均的图片，因为图片的明暗不均，导致图片上的每一小部分都要使用不同的阈值进行二值化处理，这时候传统的二值化算法就无法满足我们的需求了，于是就出现了自适应二值化。

二、取均值

假如我们使用的小区域是3*3的，那么就会从图片的左上角开始（也就是像素值为162的地方）计算其邻域内的平均值，如果处于边缘地区就会对边界进行填充，填充值就是边界的像素点。

对于左上角像素值为162的这个点，161（也就是上图中括号内的计算结果，结果会进行取整）就是根据平均值计算出来的阈值，接着减去一个固定值C，得到的结果就是左上角这个点的二值化阈值了，接着根据选取的是阈值法还是反阈值法进行二值化操作。紧接着，向右滑动计算每个点的邻域内的平均值，直到计算出右下角的点的阈值为止。我们所用到的不断滑动的小区域被称之为核，比如3*3的小区域叫做3*3的核，并且核的大小都是奇数个，也就是3*3、5*5、7*7等。

三、加权求和

对小区域内的像素进行加权求和得到新的阈值，其权重值来自于高斯分布。

高斯概率函数是相对于二维坐标产生的，其中（x,y）为点坐标，要得到一个高斯滤波器模板，应先对高斯函数进行离散化，将得到的值作为模板的系数。例如：要产生一个3*3的高斯权重核，以核的中心位置为坐标原点进行取样，其周围的坐标如下图所示（x轴水平向右，y轴竖直向上）

|-----------------------------------------|----------------------------------------|----------------------------------------|
| (−𝟏,𝟏) | (𝟎,𝟏) | (𝟏,𝟏) |
| (−𝟏,𝟎) | (𝟎,𝟎) | (𝟏,𝟎) |
| (−𝟏,−𝟏) | (𝟎,−𝟏) | (𝟏,−𝟏) |

将坐标带入上面的公式中，即可得到一个高斯权重核。

而在opencv里，当kernel(小区域)的尺寸为1、3、5、7并且用户没有设置sigma的时候(sigma <= 0),核值就会取固定的系数，这是一种默认的值是高斯函数的近似。

|----------|---------------------------------------------------------------|
| kernel尺寸 | 核值 |
| 1 | [1] |
| 3 | [0.25,0.5,0.25] |
| 5 | [0.0625,0.25,0.375,0.25,0.0625] |
| 7 | [0.03125,0.109375,0.21875,0.28125,0.21875,0.109375,0.03125] |

通过这个高斯核，即可对图片中的每个像素去计算其阈值，并将该阈值减去固定值得到最终阈值，然后根据二值化规则进行二值化。

某像素点的阈值计算过程如下图所示：

首先还是对边界进行填充，然后计算原图中的左上角（也就是162像素值的位置）的二值化阈值，其计算过程如上图所示，再然后根据选择的二值化方法对左上角的像素点进行二值化，之后核向右继续计算第二个像素点的阈值，第三个像素点的阈值...直到右下角（也就是155像素值的位置）为止。

当核的大小不同时，仅仅是核的参数会发生变化，计算过程与此是一样的。

四、自适应

python 复制代码

cv2.adaptiveThreshold:是用来对单通道图进行自适应二值化的。
第一个参数：单通道图
第二个参数：二值化过程中所用到的最大值
第三个参数：计算阈值的方法： 1. 平均值法  cv2.ADAPTIVE_THRESH_MEAN_C  2. 使用高斯核的加权平均法 cv2.ADAPTIVE_THRESH_GAUSSIAN_C
第四个参数：二值化的方法：1. 阈值法 THRESH_BINARY， 2. 反阈值法 THRESH_BINARY_INV
第五个参数： blocksize ： 核的大小，通常为奇数  3*3， 5*5
第六个参数： 要减去的常数C的大小： 通常是正数，但也有可能是0或负数

导入模块

python 复制代码

import cv2

读取图片

python 复制代码

img=cv2.imread('lena.png')

灰度化

python 复制代码

img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

自适应

python 复制代码

img_adaptive=cv2.adaptiveThreshold(img_gray,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,7,5)

结果

python 复制代码

cv2.imshow('img_adaptive',img_adaptive)
cv2.waitKey(0)

完整代码

复制代码

import cv2  

img = cv2.imread('lena.png')  

# 将彩色图像转换为灰度图像  
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  

# 使用自适应阈值算法对灰度图像进行二值化处理  
# cv2.adaptiveThreshold() 的参数：  
# 1. 输入图像 (img_gray)  
# 2. 最大值 (255): 二值化后像素的最大值  
# 3. 自适应阈值方法 (cv2.ADAPTIVE_THRESH_GAUSSIAN_C): 使用高斯加权邻域平均值  
# 4. 阈值类型 (cv2.THRESH_BINARY): 二值化类型  
# 5. 领域大小 (7): 奇数，阈值计算时邻域的大小  
# 6. 常数 (5): 从计算的阈值中减去的常数  
img_adaptive = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 5)  

# 显示处理后的自适应二值化图像  
cv2.imshow('img_adaptive', img_adaptive)  

# 等待用户按键后关闭窗口  
cv2.waitKey(0)

五、库函数

adaptiveThreshold()

python 复制代码

cv.adaptiveThreshold(	src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst]	) ->	dst

方法	描述
src	源 8 位单通道图像。
maxValue	分配给满足条件的像素的非零值
adaptiveMethod	要使用的自适应阈值算法
thresholdType	阈值类型必须为 THRESH_BINARY 或 THRESH_BINARY_INV
blocksize	用于计算像素阈值的像素邻域的大小：3、5、7 等。
C	从平均值或加权平均值中减去的常数。通常，它是正的，但也可能是零或负的

adaptiveMethod------Enumerator
FLOODFILL_FIXED_RANGE Python: cv.FLOODFILL_FIXED_RANGE	如果设置了相关参数，则会考虑当前像素与种子像素之间的差异。否则，会考虑相邻像素之间的差异（也就是说，范围是浮动的）。
FLOODFILL_MASK_ONLY Python: cv.FLOODFILL_MASK_ONLY	如果设置了该参数，则该函数不会改变图像（新值将被忽略），并且仅会按照上述描述在标志的第 8 到第 16 位中指定的值填充掩码。此选项仅在具有掩码参数的函数变体中才有意义。