pytorch中的register_buffer

复制代码
今天在一个模型的init中遇到了self.register_buffer(‘running_mean’, torch.zeros(num_features))

register_buffer(self, name, tensor)是一个PyTorch中的方法,它的作用是向模块(module)中添加一个持久的缓冲区(buffer)

缓冲区是一种不被视为模型参数(model parameter)的张量(tensor),它不会在训练过程中更新梯度(gradient),但是会作为模块的状态(state)被保存和迁移

通常,缓冲区用于存储一些与模型相关但不需要学习的量,例如BatchNorm层的running_mean和running_var,它们是根据数据的统计信息计算得到的

缓冲区可以通过给定的名称作为属性(attribute)被访问,例如self.running_mean

参数name是一个字符串,表示缓冲区的名称。通过这个名称,可以从模块中获取缓冲区。

参数tensor是一个张量,表示缓冲区的初始值。当模块被创建时,缓冲区会被赋值为这个张量。

示例中,使用self.register_buffer('running_mean', torch.zeros(num_features))向模块中添加了一个名为running_mean的缓冲区,它的初始值是一个全零的张量,维度为num_features

缓冲区的创建和销毁是在什么时候?

相关推荐
Rubin智造社几秒前
Claude Code开发者大会系列8:从脚本到智能体——独立开发者的“AI原生”工作流转型
数据库·人工智能·独立开发者·agentic工作流·ai原生开发·实操指南
人工智能导论实践课几秒前
奥比中光深度相机astra pro的初步ros包开发
人工智能·python
yoona10202 分钟前
AI × Web3 项目拆解笔记
人工智能·笔记·web3
观测云3 分钟前
观测云产品更新 | Obsy AI、统一目录、场景、日志查看器、故障中心等
人工智能·观测云·迭代更新
扫地的小何尚4 分钟前
掌握 Agentic AI 技术:AI Agent 定制方法全景与实践路径
大数据·人工智能·算法·ai·llm·agent·nvidia
拓朗工控4 分钟前
从“数据搬运工”到“现场大脑”:边缘计算时代,工业算力底座正在经历什么?
人工智能·边缘计算·工控机·工业电脑
互联圈运营观察4 分钟前
泛微发布300+可落地AI应用 让组织业务数智升级
大数据·人工智能
随风丶飘5 分钟前
AI 编程工作流搭建:我的日常开发 SOP
人工智能
火山引擎开发者社区7 分钟前
Agent 也能玩狼人杀高阶博弈?一场游戏看懂 OpenViking 长程记忆的实力!
人工智能
情绪总是阴雨天~1 小时前
OpenClaw 核心机制深度讲解:开源个人 AI 智能体全解析
人工智能·开源