pytorch张量高级索引介绍

PyTorch 中,张量索引操作可以使用高级索引(advanced indexing),其中索引可以是另一个张量。使用这种索引方式时,返回值的维度由索引张量的形状和原始张量的形状共同决定。以下是具体的规则和解释:

1. 基本概念

假设我们有一个张量 x 和索引张量 indices,我们通过 x[indices] 进行高级索引操作。

规则:

  • 索引张量的形状将决定返回值的形状。
  • 返回值的维度由索引张量的维度代替索引位置后的张量维度。

2. 示例讲解

示例 1:一维索引

复制代码
x = torch.tensor([[10, 20, 30], [40, 50, 60]])
indices = torch.tensor([0, 1])
result = x[indices]
  • x 的形状是 (2, 3)
  • indices 是一维张量,形状是 (2,)
  • 索引 x[indices] 的结果:
    • 取出 x 的第 0 行和第 1 行。
    • 返回值的形状是 (2, 3)

示例 2:多维索引

复制代码
x = torch.tensor([[10, 20, 30], [40, 50, 60]])
indices = torch.tensor([[0, 1], [1, 0]])
result = x[indices]

print(f"x.shape:{x.shape}")
print(f"index.shape:{index.shape}")
print(f"result.shape:{result.shape}")
print(result)

输出:

复制代码
x.shape:torch.Size([2, 3])
index.shape:torch.Size([2, 2])
result.shape:torch.Size([2, 2, 3])
tensor([[[10, 20, 30],
         [40, 50, 60]],

        [[40, 50, 60],
         [10, 20, 30]]])

示例 3:多维组合索引

复制代码
x = torch.tensor([[10, 20, 30], [40, 50, 60]])
rows = torch.tensor([0, 1])
cols = torch.tensor([1, 2])
result = x[rows, cols]
  • x 的形状是 (2, 3)
  • rowscols 都是一维张量,形状为 (2,)
  • 索引 x[rows, cols]
    • 分别取出 x[0, 1]x[1, 2]
    • 返回值是 (20, 60),形状为 (2,)

示例 4:广播索引

复制代码
x = torch.tensor([[10, 20, 30], [40, 50, 60]])
rows = torch.tensor([[0], [1]])
cols = torch.tensor([0, 2])
result = x[rows, cols]
  • x 的形状是 (2, 3)
  • rows 的形状是 (2, 1)cols 的形状是 (2,)
  • 索引 x[rows, cols]
    • rowscols 会广播成 (2, 2)
    • 返回值的形状是 (2, 2)

示例 5:更复杂的张量索引操作

AF3 AtomAttentionEncoder类的init_pair_repr方法解读-CSDN博客中的 张量的高级索引

总结:

  • 索引张量的形状直接决定了返回张量的形状。
  • 当多个索引张量时,它们会广播以匹配维度,然后返回广播后形状的张量。
相关推荐
aircrushin1 小时前
三分钟说清楚 ReAct Agent 的技术实现
人工智能
tjjucheng1 小时前
靠谱的小程序定制开发哪个好
python
num_killer2 小时前
小白的Langchain学习
java·python·学习·langchain
WangYaolove13142 小时前
基于深度学习的中文情感分析系统(源码+文档)
python·深度学习·django·毕业设计·源码
技术狂人1682 小时前
工业大模型工程化部署实战!4 卡 L40S 高可用集群(动态资源调度 + 监控告警 + 国产化适配)
人工智能·算法·面试·职场和发展·vllm
好奇龙猫2 小时前
【人工智能学习-AI入试相关题目练习-第三次】
人工智能
柳杉2 小时前
建议收藏 | 2026年AI工具封神榜:从Sora到混元3D,生产力彻底爆发
前端·人工智能·后端
狮子座明仔2 小时前
Engram:DeepSeek提出条件记忆模块,“查算分离“架构开启LLM稀疏性新维度
人工智能·深度学习·语言模型·自然语言处理·架构·记忆
阿湯哥3 小时前
AgentScope Java 集成 Spring AI Alibaba Workflow 完整指南
java·人工智能·spring
自学不成才3 小时前
深度复盘:一次flutter应用基于内存取证的黑盒加密破解实录并完善算法推理助手
c++·python·算法·数据挖掘