随手笔记-python-opencv 读取图像的顺序 与pytorch处理图像的顺序

python 复制代码
import cv2

# 读取图像
image_path = 'path/to/your/image.jpg'  # 替换为你的图像路径
image = cv2.imread(image_path)

# 检查图像是否成功读取
if image is None:
    print("Error: Unable to load image.")
else:
    print("Image loaded successfully.")

1、OpenCV 使用 BGR 格式而不是 RGB 格式。

python 复制代码
import matplotlib.pyplot as plt

# 将 BGR 图像转换为 RGB
rgb_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

# 使用 Matplotlib 显示图像
plt.imshow(rgb_image)
plt.title('Image')
plt.axis('off')  # 关闭坐标轴
plt.show()

在 PyTorch 中处理图像时,图像的维度顺序通常与 NumPy 或 OpenCV 中的顺序有所不同。PyTorch 的图像处理顺序通常遵循 [C, H, W] 的维度顺序,即:

  • C:通道数(Channels),例如 RGB 图像有 3 个通道,灰度图像有 1 个通道。

  • H:图像高度(Height)。

  • W:图像宽度(Width)。

2、在使用 PyTorch 处理图像时,通常需要将图像从 [H, W, C] 转换为 [C, H, W] 的格式。以下是常见的处理流程:

python 复制代码
import torch
import numpy as np
from PIL import Image

# 加载图像
image_path = "path/to/image.jpg"
image_pil = Image.open(image_path)

# 转换为 NumPy 数组
image_np = np.array(image_pil)

# 调整维度顺序:从 [H, W, C] 转换为 [C, H, W]
image_np = image_np.transpose((2, 0, 1))

# 转换为 PyTorch 张量
image_tensor = torch.from_numpy(image_np).float()

# 归一化到 [0, 1]
image_tensor = image_tensor / 255.0

print("Image tensor shape:", image_tensor.shape)
print("Image tensor dtype:", image_tensor.dtype)

3、 PyTorch 提供了 torchvision.transforms 模块,可以更方便地处理图像。以下是一个使用 torchvision.transforms 的示例:

python 复制代码
import torch
from torchvision import transforms
from PIL import Image

# 定义图像预处理流程
transform = transforms.Compose([
    transforms.ToTensor(),  # 转换为 [C, H, W] 并归一化到 [0, 1]
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # 标准化
])

# 加载图像
image_path = "path/to/image.jpg"
image_pil = Image.open(image_path)

# 应用预处理
image_tensor = transform(image_pil)

print("Image tensor shape:", image_tensor.shape)
print("Image tensor dtype:", image_tensor.dtype)
相关推荐
安替-AnTi8 分钟前
厚朴 APK 搜索接口分析
python·apk·解析·taobao
山川湖海32 分钟前
AI时代快速学编程语言的陷阱(以Python为例)
大数据·人工智能·python
H Journey35 分钟前
Supervisor 进程管理工具介绍
python·supervisor·linux 运维
jialiguo1 小时前
博客摘录「 尚硅谷Vue3入门到实战,最新版Vue3+TypeScript前端开发教程」2024年8月7日
笔记
三无推导1 小时前
ComfyUI 安装部署教程:Windows 下快速搭建可视化 AI 绘图工作流,零基础也能跑通
人工智能·pytorch·windows·stable diffusion·aigc·ai绘画·持续部署
春日见1 小时前
5分钟入门强化学习之动态规划算法与实现
大数据·人工智能·python·算法·机器学习·计算机视觉
DeniuHe2 小时前
sklearn 中所有交叉验证数据集划分方式完整总结
人工智能·python·sklearn
DeniuHe2 小时前
sklearn中不同交叉验证方法的场景适配
人工智能·python·sklearn
風清掦2 小时前
【STM32学习笔记-14】WDG看门狗 - 14.2 WWDG窗口看门狗
笔记·stm32·单片机·嵌入式硬件·学习·fpga开发
yubo05092 小时前
计算机视觉第三课:在图像上画框、画文字、画圆点
opencv·计算机视觉·目标跟踪