RGB图片的处理和复原

python 复制代码
import torch
from PIL import Image
from torchvision import transforms
import matplotlib.pyplot as plt
# 打开一个图像文件
image = Image.open('dog.jpg')
#显示原图
plt.imshow(image)
plt.axis('off')  # 关闭坐标轴,让图像展示更简洁
plt.show()
# 创建一个转换操作,只包含 ToTensor()
a = transforms.ToTensor()

# 应用转换操作,将 PIL 图像转换为 PyTorch 张量
tensor_image = a(image)

tensor_image_unsqueezed = tensor_image.unsqueeze(0)
# 打印转换后的张量形状
print(tensor_image_unsqueezed.shape)
# 首先,如果之前增加了批量维度(维度为1的那个维度),先去掉这个维度
tensor_image_original_shape = tensor_image_unsqueezed.squeeze(0)

# 将张量的维度从 C×H×W 转换回 PIL 图像要求的 H×W×C 格式,并将像素值从 [0, 1] 范围转换回 [0, 255] 范围,且转换为无符号8位整数类型
image_np = tensor_image_original_shape.permute(1, 2, 0).numpy() * 255
image_np = image_np.astype('uint8')

# 使用 PIL 的 Image.fromarray 函数将 numpy 数组转换回 PIL 图像
recovered_image = Image.fromarray(image_np)

# 使用 matplotlib 展示恢复后的图像(也可以直接使用 recovered_image.show() 展示,但 matplotlib 展示在一些场景下更灵活,比如可以控制展示的布局等)
plt.imshow(recovered_image)
plt.axis('off')
plt.show()

原图:

复制代码
张量形状:torch.Size([1, 3, 640, 515])

复原:

处理:

复制代码
transforms.ToTensor():transforms.ToTensor()-CSDN博客

简单理解就是进行三个操作

1.将输入数据(H x W x C)变为(C x H x W)

2.将图像的像素值从 [0, 255] 范围归一化到 [0.0, 1.0] 范围。方便后续处理

3.将 PIL 图像或 NumPy ndarray 转换为 PyTorch 张量(Tensor)

然后对张量进行处理

复原:

因为处理进行了这些操作所以逆向转变

复制代码
# 首先,如果之前增加了批量维度(维度为1的那个维度),先去掉这个维度
tensor_image_original_shape = tensor_image_unsqueezed.squeeze(0)

# 将张量的维度从 C×H×W 转换回 PIL 图像要求的 H×W×C 格式,并将像素值从 [0, 1] 范围转换回 [0, 255] 范围,且转换为无符号8位整数类型
image_np = tensor_image_original_shape.permute(1, 2, 0).numpy() * 255
image_np = image_np.astype('uint8')

# 使用 PIL 的 Image.fromarray 函数将 numpy 数组转换回 PIL 图像
recovered_image = Image.fromarray(image_np)
相关推荐
yiyu07164 小时前
3分钟搞懂深度学习AI:梯度下降:迷雾中的下山路
人工智能·深度学习
CoovallyAIHub6 小时前
Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!
深度学习·算法·计算机视觉
vivo互联网技术6 小时前
ICLR2026 | 视频虚化新突破!Any-to-Bokeh 一键生成电影感连贯效果
人工智能·python·深度学习
OpenBayes贝式计算7 小时前
边看、边听、边说,MiniCPM-0-4.5 全双工全模态模型;Pan-Cancer scRNA-Seq 涵盖三种生物学状态单细胞转录数据集
人工智能·深度学习·机器学习
CoovallyAIHub7 小时前
速度暴涨10倍、成本暴降6倍!Mercury 2用扩散取代自回归,重新定义LLM推理速度
深度学习·算法·计算机视觉
OpenBayes贝式计算7 小时前
教程上新丨基于500万小时语音数据,Qwen3-TTS实现3秒语音克隆及精细调控
人工智能·深度学习·机器学习
CoovallyAIHub10 小时前
OpenClaw一脚踩碎传统CV?机器终于不再只是看世界
深度学习·算法·计算机视觉
CoovallyAIHub10 小时前
仅凭单目相机实现3D锥桶定位?UNet-RKNet破解自动驾驶锥桶检测难题
深度学习·算法·计算机视觉
Narrastory2 天前
明日香 - Pytorch 快速入门保姆级教程(一)
人工智能·pytorch·深度学习