【pytorch】keepdim参数解析

keepdim 是 PyTorch 中的一个参数,常用于各种归约操作(如求和、求均值、求最大值等)。当我们对张量进行归约时,通常会减少该维度的大小,但有时我们希望保持归约后的维度不变,这时就会用到 keepdim=True

举个例子

假设我们有一个 2x3 的张量 x

python 复制代码
import torch

x = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(x)

输出:

复制代码
tensor([[1, 2, 3],
        [4, 5, 6]])
1. 不使用 keepdim

我们对张量的某个维度进行求均值操作,例如对维度 1(列)求均值:

python 复制代码
mean_without_keepdim = x.mean(dim=1)
print(mean_without_keepdim)

输出:

复制代码
tensor([2., 5.])

在这种情况下,原本的 2x3 的张量被压缩成了 1D 的张量 [2., 5.],原来的维度 1(列)被"消除"了。

2. 使用 keepdim=True
python 复制代码
mean_with_keepdim = x.mean(dim=1, keepdim=True)
print(mean_with_keepdim)

输出:

复制代码
tensor([[2.],
        [5.]])

在这种情况下,虽然我们在维度 1 上进行了均值操作,但 keepdim=True 保持了维度结构,所以结果仍然是 2x1 的张量,而不是被压缩成 1D 的张量。即原来的维度 1 被保留,只是大小从 3 变成了 1。

总结

  • keepdim=False(默认值):归约操作后,所归约的维度会被移除,张量的维度会减少。
  • keepdim=True:归约操作后,所归约的维度会被保留,张量的维度不变,但该维度的大小变为 1。

这是在处理张量形状时非常有用的功能,尤其是在需要保持张量形状一致性的场景下(比如在某些层归一化操作或在神经网络中)。

相关推荐
xian_wwq5 分钟前
【学习笔记】「大模型安全:攻击面演化史」第 07 篇-安全左移
人工智能·笔记·学习
马拉AI21 分钟前
我把科研人用AI的水平,分成了5个阶段
人工智能
武子康24 分钟前
调查研究-164-NVIDIA DGX Station for Windows 解析:不是新显卡,而是企业本地 AI 超算
人工智能·openai
AndrewHZ30 分钟前
【LLM技术全景】预训练与微调:大模型如何“学习“
人工智能·深度学习·大模型·llm·微调·预训练·rlhf
audyxiao00131 分钟前
ICLR 2026论文分享 | WorldGym:用世界模型打造机器人策略评估新范式
大数据·人工智能·大模型·智能体·世界模型
泠不丁33 分钟前
用 Obsidian 双链笔记管理智能家居技术知识体系
人工智能
泠不丁34 分钟前
智能家居 Zigbee 协议在高并发传感数据时的丢包率实测
人工智能
螺丝钉code35 分钟前
JAVA项目 Claude code CLAUDE.md 到底应该怎么写
java·人工智能·claude code
武子康1 小时前
调查研究-163-MiniMax M3 正式发布:1M 上下文、多模态、Coding Agent 与 Sparse Attention 到底意味着什么?
人工智能·openai
Cosolar1 小时前
LlamaIndex 文档解析与分块策略深度解析
人工智能·面试·架构