点赞 + 关注 + 收藏 = 学会了
前面介绍过在 OpenCV 里可以通过 cv2.imread
读取本地图片,但这个方法无法读取网络图片。
读取网络图片:cv2.imdecode
在 OpenCV 里读取网络图片需要使用 cv2.imdecode
这个方法,它可以直接处理字节流(如网络传输的图像、摄像头帧)而无需先保存为文件。
语法:
python
image = cv2.imdecode(buf, flags)
buf
:必须是numpy.ndarray
类型,通常通过np.frombuffer()
将字节数据转换而来。该 NumPy 数组的dtype
(数据类型) 必须是np.uint8
。这是因为图像的编码数据本质上是一串字节流,每个字节的值范围是0到255,这恰好对应了8位无符号整数 (uint8
) 的表示范围 。flags
:可选参数,指定解码方式(与cv2.imread
的flags
相同)。是一个整数,它像一个指令开关,告诉imdecode
函数我们希望以何种方式来解码这张图片 。这个参数决定了输出图像的颜色模式、是否保留透明通道等。
以下是几个最常用、也最重要的 flags
值:
标志常量 | 整数值 | 描述 |
---|---|---|
cv2.IMREAD_COLOR |
1 | (默认值) 将图像解码为三通道的BGR彩色图像。如果原始图像有Alpha(透明)通道,它将被忽略并移除 。这是最常用的模式。 |
cv2.IMREAD_GRAYSCALE |
0 | 将图像解码为单通道的灰度图像 。即使原始图像是彩色的,也会被转换为灰度图。这在很多不需要颜色信息的场景(如边缘检测)中非常有用。 |
cv2.IMREAD_UNCHANGED |
-1 | 按原样加载图像。这是功能最全的模式,它会保留图像的所有通道,包括Alpha(透明)通道 。如果你需要处理带透明背景的PNG图片,就必须使用这个标志 。 |
cv2.IMREAD_ANYCOLOR |
4 | 以任意可能的颜色格式读取图像 。 |
举个例子

python
# 导入OpenCV库,用于图像处理和显示
import cv2
# 导入NumPy库,用于数组操作
import numpy as np
# 导入SSL库,用于处理HTTPS请求
import ssl
# 主程序入口,确保该代码块仅在直接运行脚本时执行
if __name__ == '__main__':
# 打印cv2模块信息,验证OpenCV是否正确安装
print(cv2)
# 导入urllib.request模块并简化为request别名,用于网络请求
import urllib.request as request
# 设置请求头,模拟Chrome浏览器访问,避免被服务器拒绝
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"}
# 创建请求对象,包含图片URL和请求头
req = request.Request("https://p9-passport.byteacctimg.com/img/user-avatar/6c49bd0b908f5b1601050a168d0283b2~60x60.awebp", headers=headers)
# 创建未经验证的SSL上下文,解决HTTPS证书验证问题
context = ssl._create_unverified_context()
# 发送请求并获取响应,使用SSL上下文避免证书错误
response = request.urlopen(req, context=context)
# 读取响应内容,转换为字节数组,再转为NumPy数组,最后解码为OpenCV图像
imgUrl = cv2.imdecode(np.array(bytearray(response.read()), dtype=np.uint8), -1)
# 创建窗口显示图片,窗口标题为"imgUrl"
cv2.imshow("imgUrl", imgUrl)
# 等待用户按键输入,0表示无限等待
key = cv2.waitKey(0)
# 判断用户是否按下'q'键
if key == ord("q"):
# 关闭所有OpenCV创建的窗口
cv2.destroyAllWindows()zhen
在这个例子中,通过 request
发起请求,模拟了浏览器请求,获取我在掘金的头像图片。
然后用 cv2.imdecode
方法加载我的头像。
最后通过 cv2.waitKey(0)
让图片一直展示,直至按下 q
键才关闭图片窗口。
为何需要 cv2.imread
和 cv2.imdecode
两个API?
cv2.imread
和 cv2.imdecode
似乎在做同样的事情------将某种格式的数据变成OpenCV可以处理的图像矩阵。那么,为什么需要两个独立的函数呢?这并非冗余设计,而是体现了软件工程中一个极其重要的原则:单一职责原则(Single Responsibility Principle, SRP)。这个原则指出,一个类或一个模块应该有且只有一个引起它变化的原因。换句话说,一个函数应该只做一件事,并把它做好。
更直观地总结两者的区别,总结了一个表格:
特性 | cv2.imread |
cv2.imdecode |
---|---|---|
主要使用场景 | 从本地文件路径加载图像。 | 从内存中的字节缓冲区解码图像。 |
输入参数类型 | string (文件路径) |
numpy.ndarray (一维, dtype=np.uint8 ) |
承担的职责 | 文件I/O 2. 图像解码 | 图像解码 |
抽象级别 | 高层 (便利的封装函数) | 底层 (核心解码引擎) |
灵活性 | 局限于本地文件系统。 | 高度灵活,可处理来自任何来源的数据。 |
以上就是本文的全部内容了,想了解更多 OpenCV Python
的工友欢迎关注 《OpenCV Python 中文教程》
点赞 + 关注 + 收藏 = 学会了
