pytorch中神经网络的定义方法

1. 继承 torch.nn.Module 类(推荐方法)

最常见和推荐的方式是通过继承 torch.nn.Module 类来创建一个自定义的神经网络模型。在这种方式下,你需要定义 __init__() 方法来初始化网络层,并在 forward() 方法中定义前向传播逻辑。

示例:一个简单的全连接神经网络
python 复制代码
import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        # 定义网络层
        self.fc1 = nn.Linear(784, 128)  # 输入层:28x28 图像展平为 784
        self.fc2 = nn.Linear(128, 64)   # 隐藏层
        self.fc3 = nn.Linear(64, 10)    # 输出层:10 类分类

        # 激活函数
        self.relu = nn.ReLU()

    def forward(self, x):
        # 前向传播逻辑
        x = self.relu(self.fc1(x))  # 输入 -> 第一层 -> 激活
        x = self.relu(self.fc2(x))  # 第二层 -> 激活
        x = self.fc3(x)             # 输出层
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • __init__() :在这个方法中定义了神经网络的层(如 nn.Linear),并且可以定义激活函数(如 nn.ReLU())。
  • forward():定义了数据从输入到输出的传播方式。

这种方式非常灵活,可以用于复杂的网络结构设计。

2. 使用 nn.Sequential(顺序模型)

如果你的网络是一个简单的按顺序排列的层,nn.Sequential 提供了一种更加简洁的方式来定义模型。nn.Sequential 允许你将多个层按顺序进行组合,自动处理前向传播的顺序。

示例:使用 nn.Sequential 定义一个简单的全连接神经网络
python 复制代码
import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        # 使用 nn.Sequential 顺序堆叠层
        self.model = nn.Sequential(
            nn.Linear(784, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        return self.model(x)

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • nn.Sequential:这种方式会将层按顺序堆叠在一起,并且自动处理前向传播。
  • 适用于结构简单、每一层都执行相同操作(如全连接层 + 激活函数)的模型。

3. 使用 torch.nn.ModuleListtorch.nn.ModuleDict

如果你的网络包含多个层,但它们的顺序不是简单的顺序堆叠,或者你需要在网络中使用循环和条件语句,nn.ModuleListnn.ModuleDict 提供了更大的灵活性。

  • ModuleList:用于存储层的列表,可以通过索引访问这些层。
  • ModuleDict:用于存储层的字典,可以通过键来访问层。
示例:使用 ModuleList 定义一个多层感知机(MLP)
python 复制代码
import torch
import torch.nn as nn

class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        # 使用 ModuleList 来存储多个全连接层
        self.layers = nn.ModuleList([
            nn.Linear(784, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 10)
        ])

    def forward(self, x):
        for layer in self.layers:
            x = layer(x)  # 按顺序执行每一层
        return x

# 创建模型实例
model = MLP()
print(model)
解释:
  • ModuleListModuleList 可以存储多个层,这些层可以通过 for 循环逐一执行。
  • forward() 方法中,我们使用 for 循环按顺序执行每一层。

4. 使用 torch.nn.functional(函数式接口)

torch.nn.functional 包含了很多与神经网络相关的函数,这些函数不需要创建层实例,而是可以在 forward() 方法中直接调用。通过这种方式,你可以避免显式地使用 nn.Module 中的层类,减少代码量。

示例:使用 torch.nn.functional 定义一个简单的网络
python 复制代码
import torch
import torch.nn.functional as F
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        # self.relu = nn.ReLU()

    def forward(self, x):
        # 使用 nn.functional 进行激活函数处理而不是在init中定义激活层
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • torch.nn.functional :在 forward() 中使用 F.relu() 等函数式接口,避免显式地调用 nn.ReLU() 层实例。这种方式适合你只需要用函数对数据进行操作的场景。

5. 自定义层

除了 nn.Modulenn.Sequential,你还可以通过继承 nn.Module 来定义自定义的层。这样你可以封装复杂的操作,形成可复用的模块。

示例:自定义一个激活函数层
python 复制代码
import torch
import torch.nn as nn

class MyReLU(nn.Module):
    def __init__(self):
        super(MyReLU, self).__init__()

    def forward(self, x):
        return torch.maximum(x, torch.tensor(0.0))  # 自定义 ReLU 激活

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        self.relu = MyReLU()  # 使用自定义的激活函数层

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • 自定义层 :你可以继承 nn.Module 来定义自己的层,并在 forward() 方法中定义自定义的前向传播行为。这种方式适用于特殊的操作,如自定义的激活函数、正则化、特殊的损失函数等。

总结

在 PyTorch 中定义神经网络的常见方法有:

  1. 继承 torch.nn.Module:适用于复杂的网络结构,最常用的方式。
  2. 使用 nn.Sequential:适用于结构简单、按顺序堆叠的层。
  3. 使用 ModuleListModuleDict:适用于网络中有循环或更复杂结构的场景。
  4. 使用 torch.nn.functional :在 forward() 方法中直接使用函数式接口来定义前向传播,减少代码量。
  5. 自定义层:封装特定的操作,形成可复用的模块,适用于需要自定义操作的场景。
相关推荐
J2虾虾1 分钟前
Spring AI Alibaba - Structured Output 结构化输出
人工智能·python·spring
guslegend6 分钟前
第2节:AI编辑器底层技术全景导览
人工智能·编辑器
beyond阿亮13 分钟前
PicoClaw(皮皮虾)超轻量AI智能体 安装&使用教程
人工智能·ai·openclaw·picoclaw
广州灵眸科技有限公司20 分钟前
瑞芯微RV1126B开发板(EASY-EAI-PI2) 开发套件组装上电
网络·数据库·人工智能·算法·飞书
AI_yangxi24 分钟前
短视频矩阵系统服务商
大数据·人工智能·矩阵
Ada's27 分钟前
方法论01:如何写好一篇期刊论文
人工智能
szxinmai主板定制专家27 分钟前
基于 ARM+FPGA精密多轴实时运动控制卡设计方案,适用于半导体设备等高精度领域(一)
arm开发·人工智能·嵌入式硬件·fpga开发·架构·语音识别
2601_9583529033 分钟前
车载蓝牙通话的声学突围:A-29P 在智能座舱语音处理中的核心技术优势解析
人工智能·回音消除·音频处理模块·智能车载硬件
mykj155139 分钟前
AI旅拍小程序定制开发,解锁文旅变现新赛道
人工智能·小程序
voidmort41 分钟前
9. 微调(Fine-tuning)的数学原理
人工智能·算法·机器学习