PyTorch张量索引

文章目录

1、简介
2、简单行、列索引
3、列表索引
4、范围索引
5、布尔索引
6、多维索引

🍃作者介绍：双非本科大三网络工程专业在读，阿里云专家博主，专注于Java领域学习，擅长web应用开发、数据结构和算法，初步涉猎人工智能和前端开发。

🦅个人主页：@逐梦苍穹

📕所属专栏：人工智能

🌻gitee地址：xzl的人工智能代码仓库

✈ 您的一键三连，是我创作的最大动力🌹

1、简介

我们在操作张量时，经常需要去进行获取或者修改操作，掌握张量的花式索引操作是必须的一项能力。

张量索引是指从多维数组（即张量）中访问特定元素、子张量或切片的过程。理解张量索引是操作和处理张量数据的基础。下面是一些关于张量索引的理论知识：

1.1、基本概念

张量：张量是多维数组的泛化，可以是标量、向量、矩阵或更高维度的数组。例如，标量是0维张量，向量是1维张量，矩阵是2维张量，三维及更高维度的数组也是张量。
维度（Dimension）：张量的维度数，表示数组在每个方向上的大小。
形状（Shape）：描述张量在每个维度上的大小。例如，形状为(2, 3, 4)的张量表示它有3个维度，每个维度分别有2、3、4个元素。

1.2、索引类型

张量索引主要有以下几种类型：

整型索引（Integer Indexing）：
- 使用一个或多个整型值来访问张量中的特定元素或子张量。
- 例如，对于一个形状为(3, 4)的二维张量A，A[1, 2]访问的是第二行第三列的元素（索引从0开始）。
切片索引（Slicing）：
- 使用冒号:表示范围，来访问张量的子集。
- 例如，对于一个形状为(3, 4)的二维张量A，A[1:3, :]访问的是第二行和第三行的所有列。
高级索引（Advanced Indexing）：
- 使用数组或张量作为索引，以访问特定模式的元素。
- 例如，对于一个形状为(3, 4)的二维张量A，A[[0, 2], [1, 3]]访问的是(0,1)和(2,3)位置的元素。
布尔索引（Boolean Indexing）：
- 使用布尔数组或张量来筛选符合条件的元素。
- 例如，对于一个形状为(3, 4)的二维张量A，A[A > 5]访问的是所有大于5的元素。

1.3、数据准备

下面在进行代码演示之前，先准备一份数据：

python 复制代码

import torch
data = torch.randint(0, 10, [4, 5])
print(data)
print('-' * 50)

1.4、技术摘要⭐

索引类型	描述	代码方法
整型索引	使用一个或多个整型值来访问张量中的特定元素或子张量	`tensor[index]` 访问张量 `tensor` 的特定元素或子张量，
例如 `tensor[1, 2]` 访问二维张量的第二行第三列元素
切片索引	使用冒号 `:` 表示范围，访问张量的子集	`tensor[start:stop:step]` 访问 `tensor` 的子集，
例如 `tensor[1:3, :]` 访问二维张量的第二行和第三行的所有列
高级索引	使用数组或张量作为索引，以访问特定模式的元素	`tensor[indices]` 访问 `tensor` 的特定模式元素，
例如 `tensor[[1, 2], [2, 3]]` 访问特定位置的元素
布尔索引	使用布尔数组作为掩码，访问满足条件的元素	`tensor[mask]` 访问 `tensor` 中满足 `mask` 条件的元素，
例如 `tensor[tensor > 0]` 访问所有大于0的元素

2、简单行、列索引

data[0] 获取并打印张量的第一行。
data[:, 0] 获取并打印张量的第一列。

python 复制代码

def test01():
    print(data[0])
    print(data[:, 0])
    print('-' * 50)

3、列表索引

在PyTorch和其他基于NumPy的库中，列表索引是一种高级索引方式，允许使用列表或数组中的索引来选择张量中的特定元素。

这种索引方式可以比传统的切片更灵活、更强大。
基本概念：

列表索引：使用一个或多个列表来索引张量，提取出特定的元素。
广播机制：当列表索引的形状不匹配时，会自动 扩展（广播） 这些索引，使得它们可以一起使用。

python 复制代码

def test02():
    # 返回 (0, 1)、(1, 2) 两个位置的元素
    print(data[[0, 1], [1, 2]])
    print('-' * 50)

    # 返回 0、1 行的 1、2 列共4个元素
    print(data[[[0], [1]], [1, 2]])
    print(data[[[2], [3]], [1, 2]])
    print(data[[[0, 1], [1, 2]], [1, 2]])
    print(data[[[0, 1], [2, 3]], [1, 2]])

输出：

复制代码

E:\anaconda3\python.exe D:\Python\AI\PyTorch\12-行-列索引.py 
tensor([[2, 4, 2, 0, 4],
        [0, 8, 4, 7, 6],
        [8, 7, 3, 7, 3],
        [0, 2, 6, 2, 9]])
tensor(3)
--------------------------------------------------
tensor([4, 4])
--------------------------------------------------
tensor([[4, 2],
        [8, 4]])
tensor([[7, 3],
        [2, 6]])
tensor([[4, 4],
        [8, 3]])
tensor([[4, 4],
        [7, 6]])

Process finished with exit code 0

下面我会详细介绍下面这四个数据的计算过程：

如下所示：

4、范围索引

python 复制代码

# 3. 范围索引
def test03():
    # 前3行的前2列数据
    print(data[:3, :2])
    # 第2行到最后的前2列数据
    print(data[2:, :2])
if __name__ == '__main__':
    test03()

5、布尔索引

python 复制代码

# 布尔索引
def test04():
    # 第三列大于5的行数据
    print(data[data[:, 2] > 5])
    # 第二行大于5的列数据
    print(data[:, data[1] > 5])
if __name__ == '__main__':
    test04()

6、多维索引

python 复制代码

# 多维索引
def test05():

    data = torch.randint(0, 10, [3, 4, 5])
    print(data)
    print('-' * 50)

    print(data[0, :, :])
    print(data[:, 0, :])
    print(data[:, :, 0])

if __name__ == '__main__':
    test05()

输出：

复制代码

E:\anaconda3\python.exe D:\Python\AI\PyTorch\12-行-列索引.py 
tensor([[[9, 2, 4, 0, 9],
         [3, 6, 7, 1, 9],
         [9, 3, 8, 3, 3],
         [5, 6, 8, 2, 0]],

        [[4, 1, 7, 8, 1],
         [2, 1, 3, 3, 5],
         [7, 2, 6, 0, 1],
         [7, 0, 3, 2, 4]],

        [[0, 1, 7, 3, 3],
         [1, 0, 0, 9, 9],
         [8, 7, 9, 9, 7],
         [1, 9, 1, 3, 1]]])
--------------------------------------------------
tensor([[9, 2, 4, 0, 9],
        [3, 6, 7, 1, 9],
        [9, 3, 8, 3, 3],
        [5, 6, 8, 2, 0]])
tensor([[9, 2, 4, 0, 9],
        [4, 1, 7, 8, 1],
        [0, 1, 7, 3, 3]])
tensor([[9, 3, 9, 5],
        [4, 2, 7, 7],
        [0, 1, 8, 1]])

Process finished with exit code 0