【深度学习】Pytorch 系列教程(十):PyTorch数据结构:2、张量操作(Tensor Operations):(4)索引和切片详解

目录

一、前言

二、实验环境

三、PyTorch数据结构

0、分类

1、张量(Tensor)

[2、张量操作(Tensor Operations)](#2、张量操作(Tensor Operations))

[1. 数学运算](#1. 数学运算)

[2. 统计计算](#2. 统计计算)

[3. 张量变形](#3. 张量变形)

[4. 索引和切片](#4. 索引和切片)

使用索引访问单个元素

使用切片访问子集

使用索引和切片进行修改

[布尔索引(Boolean indexing)](#布尔索引(Boolean indexing))

[高级切片(Advanced slicing)](#高级切片(Advanced slicing))


一、前言

ChatGPT:

PyTorch是一个开源的机器学习框架,广泛应用于深度学习领域。它提供了丰富的工具和库,用于构建和训练各种类型的神经网络模型。下面是PyTorch的一些详细介绍:

  1. 动态计算图:PyTorch使用动态计算图的方式进行计算,这意味着在运行时可以动态地定义、修改和调整计算图,使得模型的构建和调试更加灵活和直观。

  2. 强大的GPU加速支持:PyTorch充分利用GPU进行计算,可以大幅提升训练和推理的速度。它提供了针对GPU的优化操作和内存管理,使得在GPU上运行模型更加高效。

  3. 自动求导:PyTorch内置了自动求导的功能,可以根据定义的计算图自动计算梯度。这简化了反向传播算法的实现,使得训练神经网络模型更加便捷。

  4. 大量的预训练模型和模型库:PyTorch生态系统中有许多预训练的模型和模型库可供使用,如TorchVision、TorchText和TorchAudio等,可以方便地加载和使用这些模型,加快模型开发的速度。

  5. 高级抽象接口:PyTorch提供了高级抽象接口,如nn.Modulenn.functional,用于快速构建神经网络模型。这些接口封装了常用的神经网络层和函数,简化了模型的定义和训练过程。

  6. 支持分布式训练:PyTorch支持在多个GPU和多台机器上进行分布式训练,可以加速训练过程,处理大规模的数据和模型。

总体而言,PyTorch提供了一个灵活而强大的平台,使得深度学习的研究和开发更加便捷和高效。它的简洁的API和丰富的功能使得用户可以快速实现复杂的神经网络模型,并在各种任务中取得优秀的性能。

二、实验环境

本系列实验使用如下环境

bash 复制代码
conda create -n DL python=3.7 
bash 复制代码
conda activate DL
bash 复制代码
pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
bash 复制代码
conda install matplotlib

关于配置环境问题,可参考前文的惨痛经历:

三、PyTorch数据结构

0、分类

  • Tensor(张量) :Tensor是PyTorch中最基本的数据结构,类似于多维数组。它可以表示标量、向量、矩阵或任意维度的数组。
    • Tensor的操作:PyTorch提供了丰富的操作函数,用于对Tensor进行各种操作,如数学运算、统计计算、张量变形、索引和切片等。这些操作函数能够高效地利用GPU进行并行计算,加速模型训练过程。
  • Variable(变量):Variable是对Tensor的封装,用于自动求导。在PyTorch中,Variable会自动跟踪和记录对其进行的操作,从而构建计算图并支持自动求导。在PyTorch 0.4.0及以后的版本中,Variable被废弃,可以直接使用Tensor来进行自动求导。
  • Dataset(数据集):Dataset是一个抽象类,用于表示数据集。通过继承Dataset类,可以自定义数据集,并实现数据加载、预处理和获取样本等功能。PyTorch还提供了一些内置的数据集类,如MNIST、CIFAR-10等,用于方便地加载常用的数据集。
  • DataLoader(数据加载器):DataLoader用于将Dataset中的数据按批次加载,并提供多线程和多进程的数据预读功能。它可以高效地加载大规模的数据集,并支持数据的随机打乱、并行加载和数据增强等操作。
  • Module(模块):Module是PyTorch中用于构建模型的基类。通过继承Module类,可以定义自己的模型,并实现前向传播和反向传播等方法。Module提供了参数管理、模型保存和加载等功能,方便模型的训练和部署。

1、张量( Tensor**)**

【深度学习】Pytorch 系列教程(一):PyTorch数据结构:1、Tensor(张量):维度(Dimensions)、数据类型(Data Types)_QomolangmaH的博客-CSDN博客https://blog.csdn.net/m0_63834988/article/details/132909219?spm=1001.2014.3001.5501https://blog.csdn.net/m0_63834988/article/details/132909219?spm=1001.2014.3001.5501编辑https://blog.csdn.net/m0_63834988/article/details/132909219?spm=1001.2014.3001.5501编辑https://blog.csdn.net/m0_63834988/article/details/132909219?spm=1001.2014.3001.5501https://blog.csdn.net/m0_63834988/article/details/132909219?spm=1001.2014.3001.5501

2、张量操作(Tensor Operations)

PyTorch提供了丰富的操作函数,用于对Tensor进行各种操作,如数学运算、统计计算、张量变形、索引和切片等。这些操作函数能够高效地利用GPU进行并行计算,加速模型训练过程。

1. 数学运算

2. 统计计算

3. 张量变形

4. 索引和切片

在PyTorch中,可以使用索引和切片操作来访问和修改张量的特定元素或子集。

使用索引访问单个元素

使用方括号和索引值来访问张量中的单个元素。索引值从0开始,并沿着每个维度进行指定。

python 复制代码
import torch

x = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(x[0, 1])  # 访问第0行、第1列的元素

输出:

python 复制代码
tensor(2)

使用切片访问子集

可以使用冒号(:)进行切片操作,以访问张量的子集。冒号可以用来指定起始索引、结束索引和步长。

python 复制代码
import torch

x = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(x[:, 1:])  # 访问所有行的第1列及之后的元素

输出:

python 复制代码
tensor([[2, 3],
        [5, 6]])

使用索引和切片进行修改

可以使用索引和切片操作来修改张量中的特定元素或子集。

python 复制代码
import torch

x = torch.tensor([[1, 2, 3], [4, 5, 6]])
x[0, 1] = 9  # 修改第0行、第1列的元素为9
print(x)

输出:

python 复制代码
tensor([[1, 9, 3],
        [4, 5, 6]])

布尔索引(Boolean indexing)

使用布尔张量作为索引,可以选择与布尔张量中相应位置为True的元素。布尔张量的形状必须与被索引的张量的形状相匹配。

python 复制代码
import torch

tensor = torch.tensor([[1, 2, 3],
                       [4, 5, 6],
                       [7, 8, 9]])

# 使用布尔索引选择元素
bool_index = tensor[tensor > 5]
print("布尔索引选择的元素:", bool_index)

输出:

python 复制代码
tensor([6, 7, 8, 9])

高级切片(Advanced slicing)

除了基本的切片操作外,还可以使用逗号将多个切片组合在一起,实现对不同维度的切片操作。

python 复制代码
import torch

tensor = torch.tensor([[1, 2, 3],
                       [4, 5, 6],
                       [7, 8, 9]])

# 使用高级切片选择子集
advanced_slice = tensor[1:, ::2]
print("高级切片选择的子集:\n", advanced_slice)

输出:

python 复制代码
tensor([[4, 6],
        [7, 9]])

使用高级切片选择了张量中从第二行开始到最后一行的子集,并且每隔一列选择一个元素。

相关推荐
Java后端的Ai之路1 分钟前
【神经网络基础】-前向传播说明指南
人工智能·深度学习·神经网络·前向传播
熊猫钓鱼>_>16 分钟前
GLM4.6多工具协同开发实践:AI构建智能任务管理系统的完整指南
人工智能·python·状态模式·ai编程·glm·分类系统·开发架构
川西胖墩墩18 分钟前
中文PC端跨职能流程图模板免费下载
大数据·论文阅读·人工智能·架构·流程图
Keep_Trying_Go29 分钟前
MaskGIT掩码生成图算法详解(MaskGIT: Masked Generative Image Transformer)
人工智能·深度学习·transformer
致Great30 分钟前
大模型对齐核心技术:从第一性原理完整推导 PPO 算法!
人工智能·算法·大模型·agent·智能体
Darken0334 分钟前
基于STM32---编码器测速(利用GPIO模拟脉冲信号)
人工智能·stm32·串口助手·gpio模拟编码器
Mintopia34 分钟前
🪄 生成式应用的 **前端 orchestration 层(编排层)指南**
人工智能·llm·aigc
雍凉明月夜39 分钟前
深度学习之常用归一化(Normalization)
人工智能·深度学习·计算机视觉
沃达德软件40 分钟前
视频标注技术全解析
人工智能·目标检测·计算机视觉·视觉检测·音视频·实时音视频·视频编解码
Buxxxxxx42 分钟前
DAY 44 简单CNN
人工智能·神经网络·cnn