【pytorch】权重为0的情况

py 复制代码
import torch
import torch.nn as nn

# 定义简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(2, 2)  # 隐藏层
        self.fc2 = nn.Linear(2, 1)  # 输出层
        
        # 将隐藏层权重和偏置初始化为0
        self.fc1.weight.data.fill_(0)
        self.fc1.bias.data.fill_(0)
        
        # 将输出层权重和偏置初始化为0
        self.fc2.weight.data.fill_(0)
        self.fc2.bias.data.fill_(0)

    def forward(self, x):
        x = torch.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

# 创建网络实例
net = SimpleNN()

# 输入数据
input_data = torch.tensor([[1.0, 2.0], [3.0, 4.0]])

# 前向传播
output = net(input_data)
print("Output:", output)

记录一下上述代码,体现了隐含层和输出层的权重为全0时的结果,可惜奇怪的是李沐的例子中权重改为全0仍然能够成功训练,目前还不知道为什么。

相关推荐
go546315846512 分钟前
修改Spatial-MLLM项目,使其专注于无人机航拍视频的空间理解
人工智能·算法·机器学习·架构·音视频·无人机
点我头像干啥39 分钟前
用 PyTorch 构建液态神经网络(LNN):下一代动态深度学习模型
pytorch·深度学习·神经网络
IT古董41 分钟前
【第三章:神经网络原理详解与Pytorch入门】01.神经网络算法理论详解与实践-(2)神经网络整体结构
pytorch·神经网络·算法
还有糕手1 小时前
西南交通大学【机器学习实验2】
人工智能·机器学习
jndingxin1 小时前
OpenCV CUDA模块设备层-----在 GPU 上执行类似于 std::copy 的操作函数warpCopy()
人工智能·opencv·计算机视觉
weixin_377634841 小时前
【数据增强】精细化贴图数据增强
人工智能·目标检测·贴图
老A技术联盟1 小时前
超实用的Cursor使用技巧之案列分析-教你基于Cursor零代码开发一个chrome插件
人工智能·cursor
慧星云1 小时前
ComfyUI工作流 :一键换背景体验不同场景
人工智能
程序员的小马甲1 小时前
如何编写AI提示词
人工智能·程序员·产品经理
算家计算1 小时前
4 位量化 + FP8 混合精度:ERNIE-4.5-0.3B-Paddle本地部署,重新定义端侧推理效率
人工智能·开源