神经网络入门实战:(九)分类问题 → 神经网络模型搭建模版和训练四步曲

(一) 神经网络模型搭建官方文档

每一层基本都有权重和偏置,可以仔细看官方文档。

pytorch 官网的库:torch.nn --- PyTorch 2.5 documentation

  • Containers库:用来搭建神经网络框架(包含所有的神经网络的框架);
  • ++特征提取:++
    • Convolution Layers:用来搭建卷积层;
    • Pooling layers:用来搭建池化层;
    • Padding Layers:用来搭建填充层;
  • ++分类:++
    • Linear Layers:用来搭建全连接层。

(二) 神经网络模型模版(Containers库中的nn.Module)

在写代码的过程中,通常会把神经网络定义成一个类(class),其模版就如下所示:

python 复制代码
# 我们的模型类应该继承自nn.Module,这是所有神经网络模块的基类。
# 每个模型类中,都必须要定义以下两个
class LinearModel(torch.nn.Module): # 其中nn是神经网络neural network的缩写
    def __init__(self): # 构造函数,初始化对象时调用的函数,名字也不能变
        super(LinearModel,self).__init__() # 直接写super().__init__()也行
        self.linear = torch.nn.Linear(1,1)
    def forward(self, x): # 前向传播函数,就必须要叫这个名字,因为 nn.Module 类的call方法里调用了名为forward函数
        y_pred = self.linear(x)
        return y_pred
model = LinearModel()

# 其中反向传播的计算,是自动进行的,所有继承自Module的类,都如此。

示例:

python 复制代码
import torch
from torch import nn

class testNet(nn.Module):
	def __init__(self):
		super(testNet, self).__init__()

	def forward(self, input):
		output = input + 4
		return output

first_net = testNet()
x = torch.tensor(1.0)
output = first_net(x) # 因为 nn.Module 类的call方法里调用了名为forward函数,所以这里可以直接将实例当做函数使用。
print(output)
------------------------------------------------------------------------------------------------------------------
# 运行结果
tensor(5.)

(三) 神经网络训练套路(四部曲)

其中的损失函数、优化器,以及训练循环体后面会详细讲解

准备数据集 → 设计模型 → 创建损失函数和优化器 → 写训练循环体。

以逻辑回归为例:


上一篇 下一篇
神经网络入门实战(八) 神经网络入门实战(十)
相关推荐
chatexcel10 分钟前
AI PPT 教程:基于旅游生活场景的提示词设计与生成流程
人工智能·ppt
寻道码路1 小时前
LangChain4j Java AI 应用开发实战(四):提示词工程进阶 - 模板化与结构化 Prompt 设计
java·人工智能·ai·prompt·aigc
Raink老师7 小时前
【AI面试临阵磨枪-70】Agent 系统如何做分布式调度、跨服务协作、故障恢复?
人工智能·面试·职场和发展
tedcloud1237 小时前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr
Raink老师7 小时前
【AI面试临阵磨枪-71】如何用 AI 优化推荐系统、内容审核、广告创意、搜索体验?
人工智能·面试·职场和发展
AI医影跨模态组学7 小时前
Biomarker Res(IF=11.5)安徽医科大学第一医院:基于机器学习的放射组学模型:子宫内膜癌患者的预后预测及机制探索
人工智能·深度学习·论文·医学·医学影像·影像组学
ftpeak7 小时前
Mooncake:以 KVCache 为中心的分离式 LLM 服务架构
人工智能·ai·架构·ai编程·ai开发
lqqjuly7 小时前
Transformer架构详解 - 第一、二部分:基础与核心思想、核心组件详解
深度学习·神经网络·自然语言处理
Terrence Shen7 小时前
Hermes agent的tools是怎么落地应用的系列
人工智能·llm·agent·hermes
Raink老师7 小时前
【AI面试临阵磨枪-72】电商全场景 AI Agent 设计(商品咨询 / 订单 / 物流 / 售后 / 退款)
人工智能·面试·职场和发展