pytorch中的gather函数的定义和作用是什么?

在PyTorch中,gather函数是一个用于从张量(tensor)中收集特定索引位置上的元素的函数。它主要用于高级索引和从张量中提取特定信息。

定义(python)

gather函数的基本定义如下:

|---|-------------------------------------------------|
| | torch.gather(input, dim, index, out=None) |

  • input (Tensor): 输入张量。
  • dim (int): 沿其收集元素的维度。
  • index (LongTensor): 索引张量,其形状与input在除了dim维度外的所有维度上都相同。
  • out (Tensor, optional): 输出张量。

作用

gather函数的作用是根据index张量中的索引值,从input张量中沿着指定的dim维度收集元素。这可以用于提取张量中特定位置的值。

举例讲解

假设我们有一个形状为(3, 3)的二维张量input,我们想要沿着第0个维度(即行的维度)收集元素。我们还需要一个索引张量index,它告诉我们从每一行中收集哪个元素。

|---|-------------------------------------------------------------|
| | import torch |
| | |
| | # 创建一个形状为 (3, 3) 的输入张量 |
| | input = torch.tensor([[1, 2, 3], |
| | [4, 5, 6], |
| | [7, 8, 9]]) |
| | |
| | # 创建一个索引张量,它告诉我们在每一行中收集哪个元素 |
| | # 例如,第0行收集第2个元素(值为3),第1行收集第0个元素(值为4),第2行收集第1个元素(值为8) |
| | index = torch.tensor([[2], |
| | [0], |
| | [1]]) |
| | |
| | # 使用 gather 函数 |
| | output = torch.gather(input, dim=0, index=index) |
| | |
| | print(output) |

输出将会是:

tensor:

|---|-------------|
| | [4], |
| | [8]]) |

在这个例子中,gather函数沿着第0个维度(行)收集元素。对于每一行,它都使用index张量中对应的索引值来确定要收集哪个元素。因此,输出张量中的每个元素都是input张量中特定行和列的元素的组合。

注意,index张量的形状是(3, 1),这与input张量在除了第0个维度外的所有维度上的形状相匹配。这是因为我们沿着第0个维度收集元素,所以其他维度的大小必须相同。

相关推荐
绒绒毛毛雨4 分钟前
On the Plasticity and Stability for Post-Training Large Language Models
人工智能·机器学习·语言模型
ZTLJQ7 小时前
序列化的艺术:Python JSON处理完全解析
开发语言·python·json
H5css�海秀8 小时前
今天是自学大模型的第一天(sanjose)
后端·python·node.js·php
SuniaWang8 小时前
《Spring AI + 大模型全栈实战》学习手册系列 · 专题六:《Vue3 前端开发实战:打造企业级 RAG 问答界面》
java·前端·人工智能·spring boot·后端·spring·架构
阿贵---8 小时前
使用XGBoost赢得Kaggle比赛
jvm·数据库·python
无敌昊哥战神8 小时前
【LeetCode 257】二叉树的所有路径(回溯法/深度优先遍历)- Python/C/C++详细题解
c语言·c++·python·leetcode·深度优先
IDZSY04309 小时前
AI社交平台进阶指南:如何用AI社交提升工作学习效率
人工智能·学习
七七powerful9 小时前
运维养龙虾--AI 驱动的架构图革命:draw.io MCP 让运维画图效率提升 10 倍,使用codebuddy实战
运维·人工智能·draw.io
水星梦月9 小时前
大白话讲解AI/LLM核心概念
人工智能
温九味闻醉9 小时前
关于腾讯广告算法大赛2025项目分析1 - dataset.py
人工智能·算法·机器学习