【pytorch】权重为0的情况

py 复制代码
import torch
import torch.nn as nn

# 定义简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(2, 2)  # 隐藏层
        self.fc2 = nn.Linear(2, 1)  # 输出层
        
        # 将隐藏层权重和偏置初始化为0
        self.fc1.weight.data.fill_(0)
        self.fc1.bias.data.fill_(0)
        
        # 将输出层权重和偏置初始化为0
        self.fc2.weight.data.fill_(0)
        self.fc2.bias.data.fill_(0)

    def forward(self, x):
        x = torch.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

# 创建网络实例
net = SimpleNN()

# 输入数据
input_data = torch.tensor([[1.0, 2.0], [3.0, 4.0]])

# 前向传播
output = net(input_data)
print("Output:", output)

记录一下上述代码,体现了隐含层和输出层的权重为全0时的结果,可惜奇怪的是李沐的例子中权重改为全0仍然能够成功训练,目前还不知道为什么。

相关推荐
程序员cxuan1 天前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan1 天前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合1 天前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος19001 天前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌1 天前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端
lqqjuly1 天前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_20021 天前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能
分布式存储与RustFS1 天前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路
人工智能·开源·minio·dpu·rustfs·ai存储·s3 table
DevOpenClub1 天前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI1 天前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体