pytorch scatter_ 函数介绍

scatter_ 是 PyTorch 中的一个原地操作函数,用于在给定的索引处将某些值填充到张量的指定维度中。它的常见用途之一是将类别标签转换为 one-hot 编码,不过它也适用于其他场景,如在特定索引处更新张量的值。

scatter_ 函数的签名如下:

复制代码
scatter_(dim, index, src)
  • dim:指定操作的维度。即在这个维度上更新值。
  • index:包含索引的张量,指定要更新值的位置。
  • src:要填入的值。可以是一个标量(单个值),也可以是一个张量。

使用示例

1. 使用 scatter_ 实现 one-hot 编码

我们可以通过 scatter_ 将类别标签转换为 one-hot 编码。

代码示例:

复制代码
import torch

# logits 模拟网络输出 [batch_size, num_classes]
logits = torch.tensor([[2.0, 1.0, 0.1], [1.5, 2.5, 0.5]])  # 形状 [2, 3]

# target 是真实的类别标签 [batch_size]
target = torch.tensor([0, 2])  # 形状 [2]

# 创建一个与 logits 相同大小的全零张量
target_onehot = torch.zeros_like(logits)  # 形状 [2, 3]

# 使用 scatter_ 函数在第 1 维(类别维度)根据 target 的索引设置为 1
target_onehot.scatter_(1, target.view(-1, 1), 1)

print("one-hot 编码:")
print(target_onehot)

注:target.view(-1, 1) 中的 1 指的是将 target 张量的形状重新调整为 两维 ,并且使得第二个维度的大小固定为 1

输出:

复制代码
tensor([[1., 0., 0.],  # 第一个样本,类别为 0
        [0., 0., 1.]])  # 第二个样本,类别为 2
2. 使用 scatter_ 更新指定位置的值

你还可以用 scatter_ 在张量的指定位置填充任意值。这里是一个简单的例子,将特定索引的位置设置为自定义的数值:

代码示例:

复制代码
import torch

# 创建一个 3x3 的全零张量
tensor = torch.zeros(3, 3)

# 定义索引
index = torch.tensor([[0, 2, 1]])  # 每行对应位置的索引

# 要填入的值
src = torch.tensor([[5, 9, 7]])

# 使用 scatter_ 在第 1 维(列)填充 src 的值到指定索引位置
tensor.scatter_(1, index, src)

print("填充值后的张量:")
print(tensor)

输出:

复制代码
tensor([[5., 7., 9.],  # 在索引 0 处填 5,索引 1 处填 7,索引 2 处填 9
        [5., 7., 9.],
        [5., 7., 9.]])
3. scatter_ 与广播

scatter_ 支持广播机制。你可以使用一个标量值来替换指定的索引位置,也可以使用一个与 index 兼容的张量来填充不同的值。

代码示例:

复制代码
import torch

# 创建一个 4x3 的全零张量
tensor = torch.zeros(4, 3)

# 定义索引
index = torch.tensor([[0, 2, 1], [2, 1, 0], [1, 0, 2], [2, 1, 0]])  # 4x3 的索引

# 要填入的值
src = torch.tensor([5, 9, 7])  # 广播到每一行

# 使用 scatter_ 在第 1 维(列)填充 src 的值到指定索引位置
tensor.scatter_(1, index, src)

print("填充值后的张量:")
print(tensor)

输出:

复制代码
tensor([[5., 7., 9.],
        [7., 9., 5.],
        [9., 5., 7.],
        [7., 9., 5.]])

总结

scatter_ 函数可以根据指定的索引,在目标张量的某个维度上填充源张量或标量的值。它的常见应用包括:

  • one-hot 编码:将类别标签转换为 one-hot 格式。
  • 更新张量特定位置的值:可以根据索引在张量的某些特定位置填入新的值。

它灵活且高效,适合用于需要对张量的特定索引进行操作的场景。

相关推荐
董厂长29 分钟前
langchain :记忆组件混淆概念澄清 & 创建Conversational ReAct后显示指定 记忆组件
人工智能·深度学习·langchain·llm
亿牛云爬虫专家1 小时前
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
分布式·python·架构·kubernetes·爬虫代理·监测·采集
G皮T4 小时前
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析
人工智能·chatgpt·llm·大语言模型·deepseek·deepseek-v3·deepseek-r1
九年义务漏网鲨鱼4 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
元宇宙时间4 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享4 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾5 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性
老任与码5 小时前
Spring AI Alibaba(1)——基本使用
java·人工智能·后端·springaialibaba
蹦蹦跳跳真可爱5895 小时前
Python----OpenCV(图像増强——高通滤波(索贝尔算子、沙尔算子、拉普拉斯算子),图像浮雕与特效处理)
人工智能·python·opencv·计算机视觉
nananaij5 小时前
【Python进阶篇 面向对象程序设计(3) 继承】
开发语言·python·神经网络·pycharm