【pytorch】权重为0的情况

py 复制代码
import torch
import torch.nn as nn

# 定义简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(2, 2)  # 隐藏层
        self.fc2 = nn.Linear(2, 1)  # 输出层
        
        # 将隐藏层权重和偏置初始化为0
        self.fc1.weight.data.fill_(0)
        self.fc1.bias.data.fill_(0)
        
        # 将输出层权重和偏置初始化为0
        self.fc2.weight.data.fill_(0)
        self.fc2.bias.data.fill_(0)

    def forward(self, x):
        x = torch.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

# 创建网络实例
net = SimpleNN()

# 输入数据
input_data = torch.tensor([[1.0, 2.0], [3.0, 4.0]])

# 前向传播
output = net(input_data)
print("Output:", output)

记录一下上述代码,体现了隐含层和输出层的权重为全0时的结果,可惜奇怪的是李沐的例子中权重改为全0仍然能够成功训练,目前还不知道为什么。

相关推荐
魏祖潇10 分钟前
DDD、TDD、SDD——AI 时代工程师的三件秩序乐器
人工智能·ai编程
Bigfish_coding10 分钟前
前端转agent-【python】-18 Agent 与本地应用结合:让 AI 操作你的浏览器
人工智能
网易云信11 分钟前
OpenClaw最佳实践:部署在圈组的AI团队
人工智能·agent
爱读源码的大都督13 分钟前
Claude Code源码解析(一):为什么Claude Code系统提示词中需要有tools?
人工智能
没落英雄20 分钟前
2. 让 Agent 能读写文件、执行命令 —— LocalShellBackend 实战
前端·人工智能·架构
Daybreak21 分钟前
一次阿里云百炼异常扣费的排查和修复总结
人工智能
十九画生23 分钟前
LLM 是怎么预测下一个词的?从 Token 到 Transformer 的内部流程
人工智能
程序员cxuan24 分钟前
Anthropic 大面积封号,连大 V 都忍不了开喷了。
人工智能·后端·程序员
用户8524950718425 分钟前
大模型是怎么学会"接话"的?从 Token 到自注意力一次讲清楚
人工智能