torch.gather的使用

torch.gather 函数的作用是按照指定的维度 dim 和索引 index 从输入张量 input 中收集数值。这个操作通常用于根据索引从一个维度中选择元素,并生成一个新的张量作为输出

1. 介绍

1.1 参数说明

  • input: 需要从中选取元素的原始张量。
  • dim: 沿着此维度选取元素。例如,如果 dim=0,则沿着第一个维度(通常是)选取;如果 dim=1,则沿着第二个维度(通常是)选取。
  • index: 一个长整型张量,包含要选取的索引。index 的形状应该与 input 的形状相同,或者可以广播到 input 的形状。

1.2. 索引张量 index 的作用

  • index 张量中的每个元素指定了在 input 张量中 dim 维度上的位置。例如,如果 dim=1(列) 并且 index[i, j] 的值为 k,则从第 i 行的第 k 列选取元素
  • 根据 index 张量中的索引,在 input 张量中沿着 dim 维度收集元素。
  • 输出张量的形状与 index 张量的形状相同。这意味着除了 dim 维度之外,其他所有维度的大小都与 index 相同。

2. 示例

py 复制代码
import torch

# 创建一个输入张量
input_tensor = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 创建一个索引张量,其形状与输入张量相同
index_tensor = torch.tensor([[0, 2, 1], [2, 0, 1], [1, 0, 2]])

# 使用 torch.gather 收集元素,沿着列(dim=1)
output_tensor = torch.gather(input_tensor, 1, index_tensor)

print(output_tensor)

说明

在上面的示例中,torch.gather(input_tensor, 1, index_tensor) 的输出将是:

  • 对于第 0 行,列索引(dim为1)为 [0, 2, 1],所以收集的元素是 [1, 3, 2]。
  • 对于第 1 行,列索引为 [2, 0, 1],所以收集的元素是 [6, 4, 5]。
  • 对于第 2 行,列索引为 [1, 0, 2],所以收集的元素是 [8, 7, 9]。

因此,输出张量将是:

shell 复制代码
tensor([[1, 3, 2],
        [6, 4, 5],
        [8, 7, 9]])

注意事项:确保 index 中的所有值都在有效范围内,即从 0 到 input.size(dim) - 1。如果 index 中有任何值超出了这个范围,将会引发错误。

相关推荐
码路飞3 小时前
FastMCP 实战:一个 .py 文件,给 Claude Code 装上 3 个超实用工具
python·ai编程·mcp
CoovallyAIHub3 小时前
OpenClaw 近 2000 个 Skills,为什么没有一个好用的视觉检测工具?
深度学习·算法·计算机视觉
CoovallyAIHub4 小时前
CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注
深度学习·算法·计算机视觉
CoovallyAIHub4 小时前
Claude Code 突然变成了 66 个专家?这个 5.8k Star 的开源项目,让我重新理解了什么叫"会用 AI"
深度学习·算法·计算机视觉
dev派4 小时前
AI Agent 系统中的常用 Workflow 模式(2) Evaluator-Optimizer模式
python·langchain
前端付豪6 小时前
AI 数学辅导老师项目构想和初始化
前端·后端·python
用户0332126663676 小时前
将 PDF 文档转换为图片【Python 教程】
python
悟空爬虫8 小时前
UV实战教程,我啥要从Anaconda切换到uv来管理包?
python
dev派8 小时前
AI Agent 系统中的常用 Workflow 模式(1)
python·langchain
明月_清风10 小时前
从“能用”到“专业”:构建生产级装饰器与三层逻辑拆解
后端·python