PIL、OpenCV、numpy处理图像格式的相互转化方式

PIL、OpenCV、numpy处理图像格式的相互转化方式

  • [1、PIL 读取、显示、保存图片](#1、PIL 读取、显示、保存图片)
  • [2、OpenCV 读取、显示、保存图片](#2、OpenCV 读取、显示、保存图片)
    • [1、采用 matplotlib 显示以 OpenCV 读取的图片](#1、采用 matplotlib 显示以 OpenCV 读取的图片)
  • [3、numpy 和 Image 的相互转换](#3、numpy 和 Image 的相互转换)
    • [1、Image 转换成 numpy](#1、Image 转换成 numpy)
    • [2、numpy 转换成 Image](#2、numpy 转换成 Image)

1、PIL 读取、显示、保存图片

python 复制代码
from PIL import Image

# PIL 读取、显示、保存图片
path = "D:/Deeplearning/img/dog.jpg"
image = Image.open(path)  # PIL Image 类型
print(image.size)  # (650, 433), 即(W, H)

image.show()  # 显示图片
image.save('new_image.jpg')

2、OpenCV 读取、显示、保存图片

OpenCV读取图像后返回的是一个代表图像的NumPy数组,采用的格式是 H×W×C,通道顺序为BGR

python 复制代码
import cv2

path = "D:/Deeplearning/img/dog.jpg"
image = cv2.imread(path)  # 返回的是 numpy 数组
print(image.shape)  # (433, 650, 3), 即 (H, W, C)

cv2.imshow("Image", image)
cv2.waitKey(0)  # 暂停显示图片,数字0代表按键后 0 ms执行

cv2.imwrite("new_image.jpg", image)  # 保存图片

1、采用 matplotlib 显示以 OpenCV 读取的图片

使用matplotlib绘图时,可以读取tesnor和numpy数据类型,图片通道顺序为RGB,且尺寸为(H,W,C)。

python 复制代码
# 采用 matplotlib 显示以 OpenCV 方式读取的图片(numpy)
import matplotlib.pyplot as plt
# 在 jupyter 中需要加上下面一行代码
# %matplotlib inline

# OpenCV 的通道顺序为 BGR
# 用 matplotlib 绘图时,需将其转换成 RGB 才能正常显示
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# image = image[:, :, ::-1]  # 这是另一种 BGR 转换成 RGB的方式

plt.imshow(image)  # 显示图片
plt.axis("off")  # 不显示坐标轴
plt.show()

3、numpy 和 Image 的相互转换

1、Image 转换成 numpy

使用np.array(image)和np.asarray(image)可以将 PIL Image 图像转换成 numpy 数组。

python 复制代码
path = "D:/Deeplearning/img/dog.jpg"
image = Image.open(path)  # PIL Image 类型

image_array = np.array(image)  # 深拷贝,通道顺序是 RGB, (H,W,C)
print(type(image_array))  # numpy.ndarray

plt.imshow(image_array)  # 正常显示图片
plt.axis("off")
plt.show()
python 复制代码
image_array2 = np.asarray(image) # 浅拷贝,通道顺序是 RGB,(H,W,C)
print(type(image_array))  # numpy.ndarray

2、numpy 转换成 Image

使用Image.fromarray(np.uint8(image))进行转换。

python 复制代码
path = "D:/Deeplearning/img/dog.jpg"
image = cv2.imread(path)  

image = image[:,:,::-1]  # OpenCV 的通道顺序为 BGR, 转换成RGB

image_pil = Image.fromarray(np.uint8(image))
print(type(image_pil))  # PIL.Image.Image

image_pil.show()  # 显示正常

使用Image.fromarray(image.astype('uint8')).convert('RGB')进行转换,效果相同。.png格式的图像是4通道的,加.convert('RGB')可以将其转变成3通道。

python 复制代码
image_pil2 = Image.fromarray(image.astype('uint8'))  # .convert('RGB')
print(type(image_pil2))  # PIL.Image.Image

使用torchvision.transforms.ToPIL()也可以实现 numpy 到 PIL Image 的转换。

python 复制代码
from torchvision import transforms
trans = transforms.ToPILImage()
image_pil3 = trans(image)  
相关推荐
冬奇Lab5 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab5 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm
IT_陈寒7 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo11 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户51914958484511 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户51914958484512 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016912 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气16 小时前
Function Calling 格式漂移
人工智能