不同框架表示图像时维度顺序的区别:pytorch、keras&tf、opencv、numpy、PIL

在PyTorch、Keras、OpenCV、NumPy和PIL这几个框架中,它们在表示图像时的维度存储顺序有所不同。下面我将逐一解释每个框架中图像维度的存储顺序:

1,PyTorch:

PyTorch中图像的维度顺序通常遵循 N, C, H, W 的格式,也就是channel first格式,其中:

C 代表通道数(channels),例如RGB图像有3个通道。

N 代表批量大小(batch size),即一次处理的图像数量。

pytorch如果遇到channel last格式的输入,可以通过permute来调整维度顺序:

python 复制代码
import torch  

# 假设x是一个形状为(N, H, W, C)的tensor  
x = torch.randn(N, H, W, C)

# 使用permute方法将channel维度移动到第二个位置  
x_channel_first = x.permute(0, 3, 1, 2)  # 形状变为(N, C, H, W)

2,Keras&tf:

Keras通常与TensorFlow一起使用。在TensorFlow中,对于图像数据,默认的维度顺序是 H, W, C。但在构建模型时,Keras允许通过data_format参数来指定维度顺序,可以是'channels_last'(即H, W, C)或'channels_first'(即C, H, W)。

通过如下代码可以设置:

python 复制代码
from keras import backend as K  
  
K.set_image_data_format('channels_first')

3,OpenCV:

OpenCV读取图像时默认的维度顺序是 H, W, C。因此,在OpenCV中,图像的宽度和高度位于通道数之前。

4,NumPy:

NumPy本身并不直接处理图像数据,但它可以用于存储和操作多维数组。在NumPy数组中,维度的顺序完全取决于用户如何定义和填充数组。

5,PIL (Python Imaging Library, 也就是现在的Pillow):

PIL/Pillow在打开图像时,默认的维度顺序是 W, H, C,即宽度、高度和通道数。这与其他一些框架的顺序有所不同。

在编程过程中如果多个库混合使用,例如用OpenCV/PIL打开图像,然后输入pytorch编写的模型,需要注意这方面。

相关推荐
曲幽13 分钟前
FastAPI 身份验证总踩坑?这份 FastAPI Users “避坑指南”请收好
python·fastapi·web·jwt·oauth2·user·authentication
WPF工业上位机18 分钟前
YXGK.FakeVM深度学习之5语义分割
人工智能·深度学习
落叶无情21 分钟前
ICEF认知操作系统:四类约束全维度全覆盖,是全谱系系统化约束体系
人工智能
碳基硅坊23 分钟前
Gemma 4 12B 让AI创作更私密更高效
人工智能·gemma-4-12b
weixin_4684668525 分钟前
大模型新手入门与实战指南
人工智能·深度学习·ai·大模型
装不满的克莱因瓶43 分钟前
掌握 RNN 与 LSTM 模型结构
人工智能·python·rnn·深度学习·神经网络·ai·lstm
jeffer_liu43 分钟前
Spring AI 生产级实战:裁判员
java·人工智能·后端·spring·大模型
何以解忧,唯有..1 小时前
Python包管理工具pip:从入门到精通
开发语言·python·pip
weixin_446260851 小时前
Agent 会自行回避吗?测量 LLM 智能体合规性的带内访问拒绝信号
人工智能
努力学习_小白1 小时前
ResNeXt-50——学习记录
pytorch·深度学习·学习