pytorch中神经网络的定义方法

1. 继承 torch.nn.Module 类(推荐方法)

最常见和推荐的方式是通过继承 torch.nn.Module 类来创建一个自定义的神经网络模型。在这种方式下,你需要定义 __init__() 方法来初始化网络层,并在 forward() 方法中定义前向传播逻辑。

示例:一个简单的全连接神经网络
python 复制代码
import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        # 定义网络层
        self.fc1 = nn.Linear(784, 128)  # 输入层:28x28 图像展平为 784
        self.fc2 = nn.Linear(128, 64)   # 隐藏层
        self.fc3 = nn.Linear(64, 10)    # 输出层:10 类分类

        # 激活函数
        self.relu = nn.ReLU()

    def forward(self, x):
        # 前向传播逻辑
        x = self.relu(self.fc1(x))  # 输入 -> 第一层 -> 激活
        x = self.relu(self.fc2(x))  # 第二层 -> 激活
        x = self.fc3(x)             # 输出层
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • __init__() :在这个方法中定义了神经网络的层(如 nn.Linear),并且可以定义激活函数(如 nn.ReLU())。
  • forward():定义了数据从输入到输出的传播方式。

这种方式非常灵活,可以用于复杂的网络结构设计。

2. 使用 nn.Sequential(顺序模型)

如果你的网络是一个简单的按顺序排列的层,nn.Sequential 提供了一种更加简洁的方式来定义模型。nn.Sequential 允许你将多个层按顺序进行组合,自动处理前向传播的顺序。

示例:使用 nn.Sequential 定义一个简单的全连接神经网络
python 复制代码
import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        # 使用 nn.Sequential 顺序堆叠层
        self.model = nn.Sequential(
            nn.Linear(784, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        return self.model(x)

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • nn.Sequential:这种方式会将层按顺序堆叠在一起,并且自动处理前向传播。
  • 适用于结构简单、每一层都执行相同操作(如全连接层 + 激活函数)的模型。

3. 使用 torch.nn.ModuleListtorch.nn.ModuleDict

如果你的网络包含多个层,但它们的顺序不是简单的顺序堆叠,或者你需要在网络中使用循环和条件语句,nn.ModuleListnn.ModuleDict 提供了更大的灵活性。

  • ModuleList:用于存储层的列表,可以通过索引访问这些层。
  • ModuleDict:用于存储层的字典,可以通过键来访问层。
示例:使用 ModuleList 定义一个多层感知机(MLP)
python 复制代码
import torch
import torch.nn as nn

class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        # 使用 ModuleList 来存储多个全连接层
        self.layers = nn.ModuleList([
            nn.Linear(784, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 10)
        ])

    def forward(self, x):
        for layer in self.layers:
            x = layer(x)  # 按顺序执行每一层
        return x

# 创建模型实例
model = MLP()
print(model)
解释:
  • ModuleListModuleList 可以存储多个层,这些层可以通过 for 循环逐一执行。
  • forward() 方法中,我们使用 for 循环按顺序执行每一层。

4. 使用 torch.nn.functional(函数式接口)

torch.nn.functional 包含了很多与神经网络相关的函数,这些函数不需要创建层实例,而是可以在 forward() 方法中直接调用。通过这种方式,你可以避免显式地使用 nn.Module 中的层类,减少代码量。

示例:使用 torch.nn.functional 定义一个简单的网络
python 复制代码
import torch
import torch.nn.functional as F
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        # self.relu = nn.ReLU()

    def forward(self, x):
        # 使用 nn.functional 进行激活函数处理而不是在init中定义激活层
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • torch.nn.functional :在 forward() 中使用 F.relu() 等函数式接口,避免显式地调用 nn.ReLU() 层实例。这种方式适合你只需要用函数对数据进行操作的场景。

5. 自定义层

除了 nn.Modulenn.Sequential,你还可以通过继承 nn.Module 来定义自定义的层。这样你可以封装复杂的操作,形成可复用的模块。

示例:自定义一个激活函数层
python 复制代码
import torch
import torch.nn as nn

class MyReLU(nn.Module):
    def __init__(self):
        super(MyReLU, self).__init__()

    def forward(self, x):
        return torch.maximum(x, torch.tensor(0.0))  # 自定义 ReLU 激活

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        self.relu = MyReLU()  # 使用自定义的激活函数层

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 创建模型实例
model = SimpleNN()
print(model)
解释:
  • 自定义层 :你可以继承 nn.Module 来定义自己的层,并在 forward() 方法中定义自定义的前向传播行为。这种方式适用于特殊的操作,如自定义的激活函数、正则化、特殊的损失函数等。

总结

在 PyTorch 中定义神经网络的常见方法有:

  1. 继承 torch.nn.Module:适用于复杂的网络结构,最常用的方式。
  2. 使用 nn.Sequential:适用于结构简单、按顺序堆叠的层。
  3. 使用 ModuleListModuleDict:适用于网络中有循环或更复杂结构的场景。
  4. 使用 torch.nn.functional :在 forward() 方法中直接使用函数式接口来定义前向传播,减少代码量。
  5. 自定义层:封装特定的操作,形成可复用的模块,适用于需要自定义操作的场景。
相关推荐
qq_273900238 分钟前
pytorch索引操作函数介绍
人工智能·pytorch·python
HelloZheQ16 分钟前
Java与AI:构建智能应用的强大组合
java·开发语言·人工智能
硬件技术我知道42 分钟前
产品 防尘防水IP等级 划分与实验方法
网络·人工智能·嵌入式硬件·物联网·计算机视觉·硬件工程·智慧城市
数据分析能量站44 分钟前
生成模型的现状&2025年的新兴趋势
人工智能
绍兴贝贝1 小时前
代码随想录算法训练营第五十二天|KM101.孤岛的总面积|KM102.沉没孤岛|KM103.水流问题|KM104.建造最大岛屿
数据结构·人工智能·python·算法·力扣
hellocode_1 小时前
ChatGPT 主流模型GPT-4/GPT-4o mini的参数规模是多大?
人工智能·chatgpt
智写AI1 小时前
Gemini和ChatGPT全面对比分析,有什么区别和优势?
人工智能·chatgpt·ai写作·gemini·ai写论文
Yunlord1 小时前
(二)元问题和元指令:问GPT怎么问
人工智能·gpt
泡芙萝莉酱1 小时前
中国区域创新创业指数IRIEC数据(省级、地市级)1990-2020年-社科数据
大数据·人工智能·深度学习·数据挖掘·数据分析·毕业论文·iriec