【pytorch】权重为0的情况

py 复制代码
import torch
import torch.nn as nn

# 定义简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(2, 2)  # 隐藏层
        self.fc2 = nn.Linear(2, 1)  # 输出层
        
        # 将隐藏层权重和偏置初始化为0
        self.fc1.weight.data.fill_(0)
        self.fc1.bias.data.fill_(0)
        
        # 将输出层权重和偏置初始化为0
        self.fc2.weight.data.fill_(0)
        self.fc2.bias.data.fill_(0)

    def forward(self, x):
        x = torch.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

# 创建网络实例
net = SimpleNN()

# 输入数据
input_data = torch.tensor([[1.0, 2.0], [3.0, 4.0]])

# 前向传播
output = net(input_data)
print("Output:", output)

记录一下上述代码,体现了隐含层和输出层的权重为全0时的结果,可惜奇怪的是李沐的例子中权重改为全0仍然能够成功训练,目前还不知道为什么。

相关推荐
西柚小萌新几秒前
【论文阅读】--PEACE:基于多模态大语言模型的地质图全息理解赋能框架
人工智能·语言模型·自然语言处理
Ai野生菌4 分钟前
论文解读 | 当“提示词”学会绕路:用拓扑学方法一次击穿多智能体安全防线
人工智能·深度学习·安全·语言模型·拓扑学
狮子座明仔7 分钟前
MegaBeam-Mistral-7B:扩展上下文而非参数的高效长文本处理
人工智能·深度学习·自然语言处理·知识图谱
有赞技术16 分钟前
有赞AI研发全流程落地实践
人工智能
Mintopia16 分钟前
🧭 一、全栈能力的重心正在从“实现” → “指令 + 验证”转移
前端·人工智能·全栈
产品设计大观18 分钟前
数据分析后台/移动端设计要点梳理,附AI生成原型图实战案例
大数据·人工智能·数据分析·产品经理·墨刀·数据分析后台·ai生成原型图
前端程序猿之路24 分钟前
30天大模型学习之Day 2:Prompt 工程基础系统
大数据·人工智能·学习·算法·语言模型·prompt·ai编程
Mintopia24 分钟前
2025,我的「Vibe Coding」时刻
前端·人工智能·aigc
创客匠人老蒋29 分钟前
从“经验驱动”到“系统智能”:实体门店经营的结构性升级
大数据·人工智能
安达发公司31 分钟前
安达发|APS自动排产排程排单软件:让汽车零部件厂排产不“卡壳”
大数据·人工智能·汽车·aps高级排程·aps排程软件·aps自动排产排程排单软件