pytorch中的register_buffer

子燕若水2023-08-23 22:49

复制代码

今天在一个模型的init中遇到了self.register_buffer(‘running_mean’, torch.zeros(num_features))

register_buffer(self, name, tensor)是一个PyTorch中的方法，它的作用是向模块（module）中添加一个持久的缓冲区（buffer）

缓冲区是一种不被视为模型参数（model parameter）的张量（tensor），它不会在训练过程中更新梯度（gradient），但是会作为模块的状态（state）被保存和迁移

通常，缓冲区用于存储一些与模型相关但不需要学习的量，例如BatchNorm层的running_mean和running_var，它们是根据数据的统计信息计算得到的

缓冲区可以通过给定的名称作为属性（attribute）被访问，例如self.running_mean

参数name是一个字符串，表示缓冲区的名称。通过这个名称，可以从模块中获取缓冲区。

参数tensor是一个张量，表示缓冲区的初始值。当模块被创建时，缓冲区会被赋值为这个张量。

示例中，使用self.register_buffer('running_mean', torch.zeros(num_features))向模块中添加了一个名为running_mean的缓冲区，它的初始值是一个全零的张量，维度为num_features