文章目录
🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初步涉猎人工智能和前端开发。
🦅个人主页:@逐梦苍穹
📕所属专栏:人工智能
🌻gitee地址:xzl的人工智能代码仓库
✈ 您的一键三连,是我创作的最大动力🌹
1、简介
我们在操作张量时,经常需要去进行获取或者修改操作,掌握张量的花式索引操作是必须的一项能力。
张量索引是指从多维数组(即张量)中访问特定元素、子张量或切片的过程。理解张量索引是操作和处理张量数据的基础。下面是一些关于张量索引的理论知识:
1.1、基本概念
- 张量:张量是多维数组的泛化,可以是标量、向量、矩阵或更高维度的数组。例如,标量是0维张量,向量是1维张量,矩阵是2维张量,三维及更高维度的数组也是张量。
- 维度(Dimension):张量的维度数,表示数组在每个方向上的大小。
- 形状(Shape):描述张量在每个维度上的大小。例如,形状为(2, 3, 4)的张量表示它有3个维度,每个维度分别有2、3、4个元素。
1.2、索引类型
张量索引主要有以下几种类型:
- 整型索引(Integer Indexing):
- 使用一个或多个整型值来访问张量中的特定元素或子张量。
- 例如,对于一个形状为(3, 4)的二维张量
A
,A[1, 2]
访问的是第二行第三列的元素(索引从0开始)。
- 切片索引(Slicing):
- 使用冒号
:
表示范围,来访问张量的子集。 - 例如,对于一个形状为(3, 4)的二维张量
A
,A[1:3, :]
访问的是第二行和第三行的所有列。
- 使用冒号
- 高级索引(Advanced Indexing):
- 使用数组或张量作为索引,以访问特定模式的元素。
- 例如,对于一个形状为(3, 4)的二维张量
A
,A[[0, 2], [1, 3]]
访问的是(0,1)和(2,3)位置的元素。
- 布尔索引(Boolean Indexing):
- 使用布尔数组或张量来筛选符合条件的元素。
- 例如,对于一个形状为(3, 4)的二维张量
A
,A[A > 5]
访问的是所有大于5的元素。
1.3、数据准备
下面在进行代码演示之前,先准备一份数据:
python
import torch
data = torch.randint(0, 10, [4, 5])
print(data)
print('-' * 50)
1.4、技术摘要⭐
索引类型 | 描述 | 代码方法 |
---|---|---|
整型索引 | 使用一个或多个整型值来访问张量中的特定元素或子张量 | tensor[index] 访问张量 tensor 的特定元素或子张量, |
例如 tensor[1, 2] 访问二维张量的第二行第三列元素 |
||
切片索引 | 使用冒号 : 表示范围,访问张量的子集 |
tensor[start:stop:step] 访问 tensor 的子集, |
例如 tensor[1:3, :] 访问二维张量的第二行和第三行的所有列 |
||
高级索引 | 使用数组或张量作为索引,以访问特定模式的元素 | tensor[indices] 访问 tensor 的特定模式元素, |
例如 tensor[[1, 2], [2, 3]] 访问特定位置的元素 |
||
布尔索引 | 使用布尔数组作为掩码,访问满足条件的元素 | tensor[mask] 访问 tensor 中满足 mask 条件的元素, |
例如 tensor[tensor > 0] 访问所有大于0的元素 |
2、简单行、列索引
data[0]
获取并打印张量的第一行。
data[:, 0]
获取并打印张量的第一列。
python
def test01():
print(data[0])
print(data[:, 0])
print('-' * 50)
3、列表索引
在PyTorch和其他基于NumPy的库中,列表索引是一种高级索引方式,允许使用列表或数组中的索引来选择张量中的特定元素。
这种索引方式可以比传统的切片更灵活、更强大。
基本概念:
- 列表索引:使用一个或多个列表来索引张量,提取出特定的元素。
- 广播机制:当列表索引的形状不匹配时,会自动
扩展(广播)
这些索引,使得它们可以一起使用。
python
def test02():
# 返回 (0, 1)、(1, 2) 两个位置的元素
print(data[[0, 1], [1, 2]])
print('-' * 50)
# 返回 0、1 行的 1、2 列共4个元素
print(data[[[0], [1]], [1, 2]])
print(data[[[2], [3]], [1, 2]])
print(data[[[0, 1], [1, 2]], [1, 2]])
print(data[[[0, 1], [2, 3]], [1, 2]])
输出:
E:\anaconda3\python.exe D:\Python\AI\PyTorch\12-行-列索引.py
tensor([[2, 4, 2, 0, 4],
[0, 8, 4, 7, 6],
[8, 7, 3, 7, 3],
[0, 2, 6, 2, 9]])
tensor(3)
--------------------------------------------------
tensor([4, 4])
--------------------------------------------------
tensor([[4, 2],
[8, 4]])
tensor([[7, 3],
[2, 6]])
tensor([[4, 4],
[8, 3]])
tensor([[4, 4],
[7, 6]])
Process finished with exit code 0
下面我会详细介绍下面这四个数据的计算过程:
如下所示:
4、范围索引
python
# 3. 范围索引
def test03():
# 前3行的前2列数据
print(data[:3, :2])
# 第2行到最后的前2列数据
print(data[2:, :2])
if __name__ == '__main__':
test03()
5、布尔索引
python
# 布尔索引
def test04():
# 第三列大于5的行数据
print(data[data[:, 2] > 5])
# 第二行大于5的列数据
print(data[:, data[1] > 5])
if __name__ == '__main__':
test04()
6、多维索引
python
# 多维索引
def test05():
data = torch.randint(0, 10, [3, 4, 5])
print(data)
print('-' * 50)
print(data[0, :, :])
print(data[:, 0, :])
print(data[:, :, 0])
if __name__ == '__main__':
test05()
输出:
E:\anaconda3\python.exe D:\Python\AI\PyTorch\12-行-列索引.py
tensor([[[9, 2, 4, 0, 9],
[3, 6, 7, 1, 9],
[9, 3, 8, 3, 3],
[5, 6, 8, 2, 0]],
[[4, 1, 7, 8, 1],
[2, 1, 3, 3, 5],
[7, 2, 6, 0, 1],
[7, 0, 3, 2, 4]],
[[0, 1, 7, 3, 3],
[1, 0, 0, 9, 9],
[8, 7, 9, 9, 7],
[1, 9, 1, 3, 1]]])
--------------------------------------------------
tensor([[9, 2, 4, 0, 9],
[3, 6, 7, 1, 9],
[9, 3, 8, 3, 3],
[5, 6, 8, 2, 0]])
tensor([[9, 2, 4, 0, 9],
[4, 1, 7, 8, 1],
[0, 1, 7, 3, 3]])
tensor([[9, 3, 9, 5],
[4, 2, 7, 7],
[0, 1, 8, 1]])
Process finished with exit code 0