【PyTorch】基础知识及常用操作

【PyTorch】基础知识及操作

基础知识

tensor的形状(shape)

在数据被加载为tensor时,PyTorch会根据原始的数据内容和形状 来生成tensor。由于tensor的操作依托于PyTorch提供的方法,此时tensor未必符合PyTorch提供方法的输入形状要求,或此tensor经过操作后不是预期结果。

因此,PyTorch在设计方法时大多对tensor进行了一致的形状建模,具体地讲:

  • 1D数据(通常为序列数据)的形状为:( C C C, L i n L_{in} Lin)/(通道数,数据长度)
  • 2D数据(通常为图像数据)的形状为:( C C C, H i n H_{in} Hin, W i n W_{in} Win)/(通道数,数据高度,数据宽度)

在处理tensor时为了提高计算效率,通常会一次性处理一批相同形状的数据。对于这批数据,其形状在单个数据的形状的基础上增加了批次信息,具体来说:

  • 1D数据在批处理时的形状为:( N N N, C C C, L i n L_{in} Lin)/(批处理大小,通道数,数据长度)
  • 2D数据在批处理时的形状为:( N N N, C C C, H i n H_{in} Hin, W i n W_{in} Win)/(批处理大小,通道数,数据高度,数据宽度)

值得注意的是,在使用PyTorch的方法对tensor进行处理时,方法要求的tensor输入形状与上述的通用形状未必一致 ,比如使用PyTorch提供的nn.LSTM模型方法时,1D数据的输入形状被要求为:( L i n L_{in} Lin, N N N, C C C)/(数据长度,批处理大小,通道数)。

因此,使用PyTorch的方法对tensor进行处理时,tensor的具体形状仍需参考方法的描述

常用操作

tensor处理

创建tensor

torch.Tensor() 和 torch.tensor() 是 PyTorch 中两个不同的方法,用于创建张量,但使用方式有一些区别。

torch.Tensor()

创建一个未初始化的张量,默认数据类型为 torch.float32,不能通过dtype 参数指定数据类型。

不初始化数据,即张量的内容是未定义的,可能是内存中的随机值。

用法: 常用于需要创建一个特定大小但未初始化的张量。

torch.tensor()

根据给定的数据创建一个新的张量,可以通过 dtype 参数指定数据类型。

用法: 用于从数据(例如列表或数组)创建张量。[1](#1)

拼接tensor

torch.cat 和 torch.stack 是 PyTorch 中用于拼接张量的两个不同的函数,它们的主要区别在于拼接的方式和创建的维度。[2](#2)

获取tensor中元素数目

pytorch中,numel() 函数用于获取张量中元素数目,其中 numel() 可以理解为是 number of elements 的缩写。[3](#3)

神经网络层使用

卷积层

卷积操作可参照[4](#4)

设备信息获取

复制代码
def gpus(self, model):
    if torch.cuda.device_count() > 1:
        print("Let's use", torch.cuda.device_count(), "GPUs!")
        model = nn.DataParallel(model)
    return model

  1. torch.Tensor() 和 torch.tensor()的区别 ↩︎

  2. Pytorch种torch.cat与torch.stack的区别 ↩︎

  3. pytorch中numel()函数用于获取张量中元素数目 ↩︎

  4. pytorch中Conv1d、Conv2d与Conv3d详解 ↩︎

相关推荐
小雷FansUnion1 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周1 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
思则变2 小时前
[Pytest] [Part 2]增加 log功能
开发语言·python·pytest
叶子爱分享2 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜2 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习
一只鹿鹿鹿2 小时前
信息化项目验收,软件工程评审和检查表单
大数据·人工智能·后端·智慧城市·软件工程
张较瘦_2 小时前
[论文阅读] 人工智能 | 深度学习系统崩溃恢复新方案:DaiFu框架的原位修复技术
论文阅读·人工智能·深度学习
cver1232 小时前
野生动物检测数据集介绍-5,138张图片 野生动物保护监测 智能狩猎相机系统 生态研究与调查
人工智能·pytorch·深度学习·目标检测·计算机视觉·目标跟踪
漫谈网络2 小时前
WebSocket 在前后端的完整使用流程
javascript·python·websocket
学技术的大胜嗷2 小时前
离线迁移 Conda 环境到 Windows 服务器:用 conda-pack 摆脱硬路径限制
人工智能·深度学习·yolo·目标检测·机器学习