【内涵】深度学习中的三种变量及pytorch中对应的三种tensor

学弟2026-04-21 20:11

程序是对现实世界/需求的映射，pytorch也不例外。在深度学习领域中，一般所需要的三种变量及pytorch中对应的三种tensor总结如下：

不需要反向传播来更新，也不需要保存在模型的文件参数中：这种对应的就是普通的tensor, 例如模型的图片输入tensor和模型的标签tensor。
不需要反向传播来更新，但是需要保存在模型的文件参数中用于推理的时候加载：这种就对应nn.Module.buffer，最经典的如batch noarm层中的mean和std，这在训练的时候不是反向传播更新而是计算出来的，模型训练完成后，会保存在参数文件中，模型被加载推理的时候，可以被取到。另外，就是如果之前做过目标检测任务的话，有一篇经典的文章gfl, 它也用到了这种变量：
复制代码
```
     self.register_buffer('project',
                          torch.linspace(0, self.reg_max, self.reg_max + 1))
```

这样的话，就会有一个project变量被保存在参数文件中。

需要反向传播，也需要保存在模型参数文件中用于推理的时候加载：这种就对应nn.Parameter。当然所有层的weights, bias都是这样的变量。另外一个例子，比如说vit论文中的可学习的一个cls token也是这种变量

self.cls_token = nn.Parameter(torch.randn(num_cls_tokens, dim))

这种也不用记忆，尤其是大模型时代。但是一般想好自己的需要（是否反向传播，是否保存至模型参数文件中），这种如何prompt，如何选择还是要知道，因此总结一下这个小点，作为自己的笔记。

上一篇：014、隐私增强技术：零知识证明与混合网络在网关中的应用

下一篇：独立开发复盘：我用 Uni-app + Strapi v5 肝了一个“会上瘾”的打卡小程序

热门推荐

01GitHub 镜像站点 022026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 03【AI】2026 年具身智能模型和世界模型总结 04【踩坑记录 | 第一篇】微软商店无法使用时，如何手动安装 OpenAI Codex？附`.msix`文件系统错误解决方法 05Codex 下载安装指南：Windows 和 macOS 官方版下载 06裂开！ChatGPT 居然开始要手机号验证，附详细解决方法 07CC-Switch & Claude 基于 Linux 服务器安装使用指南 08Codex 接入 DeepSeek API 完整配置文档 09几个好用的ip纯净度检测网站 10CC-Switch 下载、安装与使用配置指南【2026.5.29】