python
import torch
from PIL import Image
from torchvision import transforms
import matplotlib.pyplot as plt
# 打开一个图像文件
image = Image.open('dog.jpg')
#显示原图
plt.imshow(image)
plt.axis('off') # 关闭坐标轴,让图像展示更简洁
plt.show()
# 创建一个转换操作,只包含 ToTensor()
a = transforms.ToTensor()
# 应用转换操作,将 PIL 图像转换为 PyTorch 张量
tensor_image = a(image)
tensor_image_unsqueezed = tensor_image.unsqueeze(0)
# 打印转换后的张量形状
print(tensor_image_unsqueezed.shape)
# 首先,如果之前增加了批量维度(维度为1的那个维度),先去掉这个维度
tensor_image_original_shape = tensor_image_unsqueezed.squeeze(0)
# 将张量的维度从 C×H×W 转换回 PIL 图像要求的 H×W×C 格式,并将像素值从 [0, 1] 范围转换回 [0, 255] 范围,且转换为无符号8位整数类型
image_np = tensor_image_original_shape.permute(1, 2, 0).numpy() * 255
image_np = image_np.astype('uint8')
# 使用 PIL 的 Image.fromarray 函数将 numpy 数组转换回 PIL 图像
recovered_image = Image.fromarray(image_np)
# 使用 matplotlib 展示恢复后的图像(也可以直接使用 recovered_image.show() 展示,但 matplotlib 展示在一些场景下更灵活,比如可以控制展示的布局等)
plt.imshow(recovered_image)
plt.axis('off')
plt.show()
原图:
张量形状:torch.Size([1, 3, 640, 515])
复原:
处理:
transforms.ToTensor():transforms.ToTensor()-CSDN博客
简单理解就是进行三个操作
1.将输入数据(H x W x C)变为(C x H x W)
2.将图像的像素值从 [0, 255] 范围归一化到 [0.0, 1.0] 范围。方便后续处理
3.将 PIL 图像或 NumPy ndarray 转换为 PyTorch 张量(Tensor)
然后对张量进行处理
复原:
因为处理进行了这些操作所以逆向转变
# 首先,如果之前增加了批量维度(维度为1的那个维度),先去掉这个维度
tensor_image_original_shape = tensor_image_unsqueezed.squeeze(0)
# 将张量的维度从 C×H×W 转换回 PIL 图像要求的 H×W×C 格式,并将像素值从 [0, 1] 范围转换回 [0, 255] 范围,且转换为无符号8位整数类型
image_np = tensor_image_original_shape.permute(1, 2, 0).numpy() * 255
image_np = image_np.astype('uint8')
# 使用 PIL 的 Image.fromarray 函数将 numpy 数组转换回 PIL 图像
recovered_image = Image.fromarray(image_np)