深度学习参数管理

1.访问参数

我们从已有模型中访问参数。当通过`Sequential`类定义模型时,我们可以通过索引来访问模型的任意层。

· 检查第二个全连接层的参数。

print(net[2].state_dict())

print(net[2].bias)

print(net[2].bias.data)

net[2].weight

print(*[(name, param.shape) for name, param in net[0].named_parameters()])

print(*[(name, param.shape) for name, param in net.named_parameters()])

2.参数初始化

· 内置初始化

def init_normal(m):

if type(m) == nn.Linear:

nn.init.normal_(m.weight, mean=0, std=0.01)

nn.init.zeros_(m.bias)

net.apply(init_normal)

net[0].weight.data[0], net[0].bias.data[0] #输出

· 不同的层采用不同的初始化

def init_xavier(m):

if type(m) == nn.Linear:

nn.init.xavier_uniform_(m.weight)

def init_42(m):

if type(m) == nn.Linear:

nn.init.constant_(m.weight, 42)

net[0].apply(init_xavier)

net[2].apply(init_42)

print(net[0].weight.data[0])

print(net[2].weight.data)

3.共享参数

我们需要给共享层一个名称,以便可以引用它的参数

shared = nn.Linear(8, 8)

net = nn.Sequential(nn.Linear(4, 8), nn.ReLU(),

shared, nn.ReLU(),

shared, nn.ReLU(),

nn.Linear(8, 1))

net(X)

检查参数是否相同

print(net[2].weight.data[0] == net[4].weight.data[0])

net[2].weight.data[0, 0] = 100

确保它们实际上是同一个对象,而不只是有相同的值

print(net[2].weight.data[0] == net[4].weight.data[0])

相关推荐
junior_Xin1 天前
Flask框架beginning4
python·flask
qq_370773091 天前
python实现人脸识别
开发语言·python·opencv
肾透侧视攻城狮1 天前
《解码AI“乐高”:深入理解TensorFlow张量操作与广播机制》
深度学习·tensorflow 张量操作·张量 的基本特性·创建张量的常用方法·张量的基本操作·张量的广播机制·张量的聚合操作
Liue612312311 天前
胚胎显微图像检测与识别改进Grid-RCNN模型实现
python
gc_22991 天前
学习python调用olefile库解析ole文件的基本用法
python·ole·olefile
m0_603888711 天前
MPA Multimodal Prototype Augmentation for Few-Shot Learning
人工智能·深度学习·ai·原型模式·论文速览
-小麦子-1 天前
Python 里的 range 是干嘛的?
开发语言·python
devlogix011 天前
1 Numpy基础 & 安装
python
MemOS1 天前
MemOS OpenClaw 插件测评结果来啦!Tokens 消耗降低 72%+
python·github
喵手1 天前
Python爬虫实战:研究生招生简章智能采集系统 - 破解考研信息不对称的技术方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集研究生招生简章·考研信息不对称·采集考研信息数据csv导出