14.神经网络的基本骨架 - nn.Module 的使用

神经网络的基本骨架 - nn.Module 的使用

Pytorch官网左侧:Python API(相当于package,提供了一些不同的工具)

关于神经网络的工具主要在torch.nn里

网站地址:torch.nn --- PyTorch 1.8.1 documentation

Containers

Containers 包含6个模块:

  • Module
  • Sequential
  • ModuleList
  • ModuleDict
  • ParameterList
  • ParameterDict

其中最常用的是 Module 模块 (为所有神经网络提供基本骨架)

复制代码
CLASS torch.nn.Module  #搭建的Model都必须继承该类

模板:

复制代码
import torch.nn as nn
import torch.nn.functional as F
 
class Model(nn.Module):   #搭建的神经网络 Model继承了 Module类(父类)
    def __init__(self):   #初始化函数
        super(Model, self).__init__()   #必须要这一步,调用父类的初始化函数
        self.conv1 = nn.Conv2d(1, 20, 5)
        self.conv2 = nn.Conv2d(20, 20, 5)
 
    def forward(self, x):   #前向传播(为输入和输出中间的处理过程),x为输入
        x = F.relu(self.conv1(x))   #conv为卷积,relu为非线性处理
        return F.relu(self.conv2(x))

代码中比较重要:

前向传播 forward(在所有子类中进行重写)

反向传播 backward

实战

先介绍pycharm的实用工具,使用 Code ---> Generate ---> Override Methods 可以自动补全代码

例子:

复制代码
import torch
from torch import nn
 
 
class Tudui(nn.Module):
    def __init__(self):
        super().__init__()
 
    # def __init__(self):
    #     super(Tudui, self).__init__()
 
    def forward(self,input):
        output = input + 1
        return output
 
tudui = Tudui()   #拿Tudui模板创建出的神经网络
x = torch.tensor(1.0)  #将1.0这个数转换成tensor类型
output = tudui(x)
print(output)

上面的代码根据网站所提供的案例模版得到

运行结果:

debug看流程

在下列语句前打断点:

复制代码
tudui = Tudui()   #整个程序的开始

然后点击蜘蛛,点击 Step into My Code,可以看到代码每一步的执行过程

i() #整个程序的开始

复制代码
然后点击蜘蛛,点击 Step into My Code,可以看到代码每一步的执行过程

[外链图片转存中...(img-8Rp3mCOt-1724861486484)]
相关推荐
卷福同学27 分钟前
【养虾日记】Openclaw操作浏览器自动化发文
人工智能·后端·算法
春日见1 小时前
如何入门端到端自动驾驶?
linux·人工智能·算法·机器学习·自动驾驶
光锥智能1 小时前
从自动驾驶到 AI 能力体系,元戎启行 GTC 发布基座模型新进展
人工智能
luoganttcc1 小时前
自动驾驶 世界模型 有哪些
人工智能·机器学习·自动驾驶
禁默1 小时前
光学与机器视觉:解锁“机器之眼”的核心密码-《第五届光学与机器视觉国际学术会议(ICOMV 2026)》
人工智能·计算机视觉·光学
深小乐1 小时前
不是DeepSeek V4!这两个神秘的 Hunter 模型竟然来自小米
人工智能
laozhao4322 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能
rainbow7242442 小时前
AI人才简历评估选型:技术面试、代码评审与项目复盘的综合运用方案
人工智能·面试·职场和发展
张张123y2 小时前
RAG从0到1学习:技术架构、项目实践与面试指南
人工智能·python·学习·面试·架构·langchain·transformer
星爷AG I2 小时前
14-12 动作序列学习(AGI基础理论)
人工智能·学习·agi