【pytorch】keepdim参数解析

keepdim 是 PyTorch 中的一个参数,常用于各种归约操作(如求和、求均值、求最大值等)。当我们对张量进行归约时,通常会减少该维度的大小,但有时我们希望保持归约后的维度不变,这时就会用到 keepdim=True

举个例子

假设我们有一个 2x3 的张量 x

python 复制代码
import torch

x = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(x)

输出:

复制代码
tensor([[1, 2, 3],
        [4, 5, 6]])
1. 不使用 keepdim

我们对张量的某个维度进行求均值操作,例如对维度 1(列)求均值:

python 复制代码
mean_without_keepdim = x.mean(dim=1)
print(mean_without_keepdim)

输出:

复制代码
tensor([2., 5.])

在这种情况下,原本的 2x3 的张量被压缩成了 1D 的张量 [2., 5.],原来的维度 1(列)被"消除"了。

2. 使用 keepdim=True
python 复制代码
mean_with_keepdim = x.mean(dim=1, keepdim=True)
print(mean_with_keepdim)

输出:

复制代码
tensor([[2.],
        [5.]])

在这种情况下,虽然我们在维度 1 上进行了均值操作,但 keepdim=True 保持了维度结构,所以结果仍然是 2x1 的张量,而不是被压缩成 1D 的张量。即原来的维度 1 被保留,只是大小从 3 变成了 1。

总结

  • keepdim=False(默认值):归约操作后,所归约的维度会被移除,张量的维度会减少。
  • keepdim=True:归约操作后,所归约的维度会被保留,张量的维度不变,但该维度的大小变为 1。

这是在处理张量形状时非常有用的功能,尤其是在需要保持张量形状一致性的场景下(比如在某些层归一化操作或在神经网络中)。

相关推荐
闲云一鹤19 分钟前
Python 入门(二)- 使用 FastAPI 快速生成后端 API 接口
python·fastapi
我要改名叫嘟嘟21 分钟前
年后上班三天之后,忽然想作的一次记录
人工智能·程序员
飞哥数智坊1 小时前
SWE-bench 退役:当 AI 评测沦为“刷题游戏”,我们还能信谁?
人工智能
Rockbean1 小时前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
爱可生开源社区1 小时前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
曲幽2 小时前
FastAPI + Ollama 实战:搭一个能查天气的AI助手
python·ai·lora·torch·fastapi·web·model·ollama·weatherapi
AI布道官3 小时前
手把手安装教程(2026最新版)
人工智能
用户60648767188963 小时前
国内开发者如何接入 Claude API?中转站方案实战指南(Python/Node.js 完整示例)
人工智能·python·api
用户5191495848453 小时前
Citrix NetScaler内存泄漏漏洞利用工具 (CVE-2025-5777)
人工智能·aigc
星纬智联技术3 小时前
Codex 增强版:对标 Claude Code 新增 Agent Teams、Hooks、anthropic api Agent 、WebUI
人工智能