Python----计算机视觉处理(opencv:图片灰度化)

一、灰度图与彩色图区别

灰度图与彩色图最大的不同就是:彩色图是由R、G、B 三个通道组成,而灰度图只有一个通道,也称为单通道图像,所以彩色图转成灰度图的过程本质上就是 将R、G、B三通道合并成一个通道的过程。

二、灰度化

读取图片

python 复制代码
import cv2
import numpy as np
img=cv2.imread('light.jpg')

获取 图片高和宽

python 复制代码
img_shape=img.shape

利用numpy创建等宽高的画布

python 复制代码
img_gray=np.zeros((img_shape[0],img_shape[1]),np.uint8)

注意:

shape:是ndarray的一个属性,用来查看数组的形状shape读取到的形状与图像的实际宽和高是相反的,shape[0]代表的是图像的高度shape[1]代表的是图像的宽度

2.1、加权平均法

对于彩色图像的每个像素,它会按照一定的权重去乘以每个通道的像素值,并将其相加,得到最后的值 就是灰度图像中对应位置的像素值。

权重的比例为:

R乘以0.299

G乘以0.587

B乘以 0.114

这是经过大量实验得到的一个权重比例,也是一个比较常用的权重比例。

python 复制代码
weight_red=0.299
weight_green=0.587
weight_blue=0.114
python 复制代码
for i in range(1067):
    for j in range(800):
        img_gray[i][j]=round(img[i,j][0]*0.114+img[i,j][1]*0.578+img[i,j][2]*0.299)

2.2、均值法

对于彩色图像的每个像素,它会将R、G、B三个通道的像素值全部加起来,然后再除以三,得到的平均 值就是灰度图像中对应位置的像素值

python 复制代码
for i in range(1067):
    for j in range(800):
        img_gray[i][j]=(int(img[i,j][0])+int(img[i,j][1])+int(img[i,j][2]))//3

2.3、最大值法

对于彩色图像的每个像素,它会从R、G、B三个通道的值中选出最大的一个,并将其作为灰度图像中对 应位置的像素值。

python 复制代码
for i in range(1067):
    for j in range(800):
        img_gray[i][j]=max(img[i,j][0],img[i,j][1],img[i,j][2])

2.4、完整代码

python 复制代码
import cv2  
import numpy as np  

img = cv2.imread('light.jpg')  

# 获取图像的形状 (高, 宽, 通道数)  
img_shape = img.shape  

# 创建一个与输入图像高和宽相同的灰度图像,初始化为全零(黑色)  
img_gray = np.zeros((img_shape[0], img_shape[1]), np.uint8)  

# 定义 RGB 颜色通道的加权系数,用于灰度转换  
weight_red = 0.299  
weight_green = 0.587  
weight_blue = 0.114  

# 遍历图像的每一个像素  
# 假设图像的高度为 1067 和宽度为 800(请根据实际图像大小进行调整)  
for i in range(1067):  
    for j in range(800):  
        # 使用加权平均法将 RGB 转换为灰度值,并存储在灰度图像中  
        img_gray[i][j] = round(  
            img[i, j][0] * weight_blue +  # 蓝色通道  
            img[i, j][1] * weight_green + # 绿色通道  
            img[i, j][2] * weight_red      # 红色通道  
        )  

# 显示生成的灰度图像  
cv2.imshow('light', img_gray)  

# 等待用户按键后关闭窗口  
cv2.waitKey(0)  

三、opencv内置函数

cvtColor

python 复制代码
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

四、库函数

4.1、imread()

python 复制代码
img = cv.imread(cv.samples.findFile("starry_night.jpg"))

调用 cv::imread 函数会使用第一个参数指定的文件路径加载图像。第二个参数是可选的,它指定了我们想要图像的格式。这可能是:

  • IMREAD_COLOR 以 BGR 8 位格式加载图像。这是此处使用的默认值
  • IMREAD_UNCHANGED按原样加载图像(包括 Alpha 通道,如果存在)
  • IMREAD_GRAYSCALE 将图像加载为强度图像

注意

OpenCV 支持图像格式 Windows 位图 (bmp)、可移植图像格式 (pbm、pgm、ppm) 和 Sun 光栅 (sr, ras)。借助插件(如果您自己构建库,则需要指定使用它们,但在我们附带的软件包中默认存在),您还可以加载图像格式,如 JPEG(jpeg、jpg、jpe)、JPEG 2000(jp2 - 在 CMake 中代号为 Jasper)、TIFF 文件(tiff、tif)和便携式网络图形 (png)。此外,OpenEXR 也是一种可能性。

4.2、cvtColor()

|-----------------------------------------|------------------------------------------------------------------------------------------------------------------------------|
| COLOR_BGR2GRAY Python:cv.COLOR_BGR2GRAY | 在 RGB/BGR 和灰度之间转换,颜色转换 |

相关推荐
qq_1893704916 分钟前
自然语言处理NLP中的连续词袋(Continuous bag of words,CBOW)方法、优势、作用和程序举例
人工智能·自然语言处理·连续词袋
threelab3 小时前
07.three官方示例+编辑器+AI快速学习webgl_buffergeometry_attributes_integer
人工智能·学习·编辑器
背太阳的牧羊人4 小时前
tokenizer.encode_plus,BERT类模型 和 Sentence-BERT 他们之间的区别与联系
人工智能·深度学习·bert
学算法的程霖4 小时前
TGRS | FSVLM: 用于遥感农田分割的视觉语言模型
人工智能·深度学习·目标检测·机器学习·计算机视觉·自然语言处理·遥感图像分类
博睿谷IT99_4 小时前
华为HCIP-AI认证考试版本更新通知
人工智能·华为
小彭律师4 小时前
数字化工厂中央控制室驾驶舱系统架构文档
python
一点.点5 小时前
SafeDrive:大语言模型实现自动驾驶汽车知识驱动和数据驱动的风险-敏感决策——论文阅读
人工智能·语言模型·自动驾驶
concisedistinct5 小时前
如何评价大语言模型架构 TTT ?模型应不应该永远“固定”在推理阶段?模型是否应当在使用时继续学习?
人工智能·语言模型·大模型
找了一圈尾巴5 小时前
AI Agent-基础认知与架构解析
人工智能·ai agent
jzwei0236 小时前
Transformer Decoder-Only 参数量计算
人工智能·深度学习·transformer