Python----计算机视觉处理(Opencv:自适应二值化,取均值,加权求和(高斯定理))

一、自适应二值化

与二值化算法相比,自适应二值化更加适合用在明暗分布不均的图片,因为图片的明暗不均,导致图片 上的每一小部分都要使用不同的阈值进行二值化处理,这时候传统的二值化算法就无法满足我们的需求 了,于是就出现了自适应二值化。

二、取均值

假如我们使用的小区域是3*3的,那么就会从图片的左上角开始(也就是像素值为162的地方)计算其邻 域内的平均值,如果处于边缘地区就会对边界进行填充,填充值就是边界的像素点。

对于左上角像素值为162的这个点,161(也就是上图中括号内的计算结果,结果会进行取整)就是 根据平均值计算出来的阈值,接着减去一个固定值C,得到的结果就是左上角这个点的二值化阈值了, 接着根据选取的是阈值法还是反阈值法进行二值化操作。紧接着,向右滑动计算每个点的邻域内的平均 值,直到计算出右下角的点的阈值为止。我们所用到的不断滑动的小区域被称之为核,比如3*3的小区 域叫做3*3的核,并且核的大小都是奇数个,也就是3*3、5*5、7*7等。

三、加权求和

对小区域内的像素进行加权求和得到新的阈值,其权重值来自于高斯分布。

高斯概率函数是相对于二维坐标产生的,其中(x,y)为点坐标,要得到一个高斯滤波器模板,应先对高 斯函数进行离散化,将得到的值作为模板的系数。例如:要产生一个3*3的高斯权重核,以核的中心位 置为坐标原点进行取样,其周围的坐标如下图所示(x轴水平向右,y轴竖直向上)

|-----------------------------------------|----------------------------------------|----------------------------------------|
| (−𝟏,𝟏) | (𝟎,𝟏) | (𝟏,𝟏) |
| (−𝟏,𝟎) | (𝟎,𝟎) | (𝟏,𝟎) |
| (−𝟏,−𝟏) | (𝟎,−𝟏) | (𝟏,−𝟏) |

将坐标带入上面的公式中,即可得到一个高斯权重核。

而在opencv里,当kernel(小区域)的尺寸为1、3、5、7并且用户没有设置sigma的时候(sigma <= 0),核 值就会取固定的系数,这是一种默认的值是高斯函数的近似。

|----------|---------------------------------------------------------------|
| kernel尺寸 | 核值 |
| 1 | [1] |
| 3 | [0.25,0.5,0.25] |
| 5 | [0.0625,0.25,0.375,0.25,0.0625] |
| 7 | [0.03125,0.109375,0.21875,0.28125,0.21875,0.109375,0.03125] |

通过这个高斯核,即可对图片中的每个像素去计算其阈值,并将该阈值减去固定值得到最终阈值,然后 根据二值化规则进行二值化。

某像素点的阈值计算过程如下图所示:

首先还是对边界进行填充,然后计算原图中的左上角(也就是162像素值的位置)的二值化阈值,其计 算过程如上图所示,再然后根据选择的二值化方法对左上角的像素点进行二值化,之后核向右继续计算 第二个像素点的阈值,第三个像素点的阈值...直到右下角(也就是155像素值的位置)为止。

当核的大小不同时,仅仅是核的参数会发生变化,计算过程与此是一样的。

四、自适应

python 复制代码
cv2.adaptiveThreshold:是用来对单通道图进行自适应二值化的。
第一个参数:单通道图
第二个参数:二值化过程中所用到的最大值
第三个参数:计算阈值的方法: 1. 平均值法  cv2.ADAPTIVE_THRESH_MEAN_C  2. 使用高斯核的加权平均法 cv2.ADAPTIVE_THRESH_GAUSSIAN_C
第四个参数:二值化的方法:1. 阈值法 THRESH_BINARY, 2. 反阈值法 THRESH_BINARY_INV
第五个参数: blocksize : 核的大小,通常为奇数  3*3, 5*5
第六个参数: 要减去的常数C的大小: 通常是正数,但也有可能是0或负数

导入模块

python 复制代码
import cv2

读取图片

python 复制代码
img=cv2.imread('lena.png')

灰度化

python 复制代码
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

自适应

python 复制代码
img_adaptive=cv2.adaptiveThreshold(img_gray,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,7,5)

结果

python 复制代码
cv2.imshow('img_adaptive',img_adaptive)
cv2.waitKey(0)

完整代码

复制代码
import cv2  

img = cv2.imread('lena.png')  

# 将彩色图像转换为灰度图像  
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  

# 使用自适应阈值算法对灰度图像进行二值化处理  
# cv2.adaptiveThreshold() 的参数:  
# 1. 输入图像 (img_gray)  
# 2. 最大值 (255): 二值化后像素的最大值  
# 3. 自适应阈值方法 (cv2.ADAPTIVE_THRESH_GAUSSIAN_C): 使用高斯加权邻域平均值  
# 4. 阈值类型 (cv2.THRESH_BINARY): 二值化类型  
# 5. 领域大小 (7): 奇数,阈值计算时邻域的大小  
# 6. 常数 (5): 从计算的阈值中减去的常数  
img_adaptive = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 5)  

# 显示处理后的自适应二值化图像  
cv2.imshow('img_adaptive', img_adaptive)  

# 等待用户按键后关闭窗口  
cv2.waitKey(0)  

五、库函数

adaptiveThreshold()

python 复制代码
cv.adaptiveThreshold(	src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst]	) ->	dst
方法 描述
src 源 8 位单通道图像。
maxValue 分配给满足条件的像素的非零值
adaptiveMethod 要使用的自适应阈值算法
thresholdType 阈值类型必须为 THRESH_BINARYTHRESH_BINARY_INV
blocksize 用于计算像素阈值的像素邻域的大小:3、5、7 等。
C 从平均值或加权平均值中减去的常数。通常,它是正的,但也可能是零或负的
adaptiveMethod------Enumerator
FLOODFILL_FIXED_RANGE Python: cv.FLOODFILL_FIXED_RANGE 如果设置了相关参数,则会考虑当前像素与种子像素之间的差异。否则,会考虑相邻像素之间的差异(也就是说,范围是浮动的)。
FLOODFILL_MASK_ONLY Python: cv.FLOODFILL_MASK_ONLY 如果设置了该参数,则该函数不会改变图像(新值将被忽略),并且仅会按照上述描述在标志的第 8 到第 16 位中指定的值填充掩码。此选项仅在具有掩码参数的函数变体中才有意义。
相关推荐
永恒的溪流几秒前
无法运用pytorch环境、改环境路径、隔离环境
人工智能·pytorch·python·深度学习
猫天意6 分钟前
【目标检测】检测网络中neck的核心作用
人工智能·目标检测·计算机视觉·基础·cv
猫天意7 分钟前
【目标检测】backbone究竟有何关键作用?
人工智能·目标检测·计算机视觉·cv
FL16238631297 分钟前
[yolov11改进系列]基于yolov11引入上下文锚点注意力CAA的python源码+训练源码
人工智能·yolo·目标跟踪
翻滚吧键盘28 分钟前
Spring Boot,注解,@ConfigurationProperties
spring boot·后端·python
这个名字真好听29 分钟前
blender 手柄驱动开发-ubuntu
python·blender·pygame
取酒鱼食--【余九】1 小时前
rl_sar功能包详解
人工智能·笔记·算法·机器人·强化学习
pen-ai1 小时前
【深度学习】18. 生成模型:Variational Auto-Encoder(VAE)详解
人工智能·深度学习
鱼找水需要时间1 小时前
Spring AI调用Ollama+DeepSeek
java·人工智能·spring
TGITCIC1 小时前
智能体觉醒:AI开始自己“动手”了-自主进化开启任务革命时代
人工智能·ai编程·ai agent·智能体·ai工具·大模型编程