《昇思 25 天学习打卡营第 7 天 | 模型训练 》

《昇思 25 天学习打卡营第 7 天 | 模型训练 》

活动地址:https://xihe.mindspore.cn/events/mindspore-training-camp

签名:Sam9029


模型训练

本章节-结合前几张的内容所讲-算是一节综合实践

  • mindscope 框架使用
  • 张量 数据类型
  • 数据集下载与加载
  • 网络构建
  • 函数式自动微分
    以上内容都会在本节内容中实践体现
  • 模型训练的四个步骤如下:

1.构建数据集。

2.定义神经网络模型。

3.定义超参、损失函数及优化器。

4.输入数据集进行训练与评估。

前言

这一节有一个疑问:深度学习中的 模型和深度学习网络 是什么关系?

  • 在实际应用中,当我们谈论"模型"时,可能是在讨论模型的架构、性能、泛化能力或如何将其应用于特定任务。而当我们谈论"深度学习网络"时,我们可能更侧重于网络的结构和工作原理。
  • 总结来说,深度学习网络是实现深度学习模型的一种方式,而模型是深度学习网络学习得到的能够进行预测或分类的具体实例。在深度学习领域,这两个术语经常可以互换使用,尤其是在讨论具体的神经网络结构时。

模型训练的四个步骤

  1. 构建数据集 :数据是深度学习的基础。使用MindSpore的MnistDataset,我们可以方便地加载和处理MNIST数据集。

    python 复制代码
    from mindspore.dataset import MnistDataset
    train_dataset = MnistDataset("MNIST_Data/train", batch_size=64)
    test_dataset = MnistDataset("MNIST_Data/test", batch_size=64)
  2. 定义神经网络模型 :一个简单的神经网络模型通常包含输入层、隐藏层和输出层。在MindSpore中,我们可以通过nn.SequentialCell来构建顺序模型。

    python 复制代码
    class Network(nn.Cell):
        def init(self):
            super().init()
            self.flatten = nn.Flatten()
            self.dense_relu_sequential = nn.SequentialCell(
                nn.Dense(28*28, 512),
                nn.ReLU(),
                nn.Dense(512, 512),
                nn.ReLU(),
                nn.Dense(512, 10)
            )
    
        def construct(self, x):
            x = self.flatten(x)
            x = self.dense_relu_sequential(x)
            return x
  3. 定义超参、损失函数及优化器:超参数如学习率、批次大小和训练轮次对模型训练至关重要。损失函数评估预测值与实际值的差异,而优化器则用于更新模型参数。

    python 复制代码
    epochs = 3
    batch_size = 64
    learning_rate = 0.01
    loss_fn = nn.CrossEntropyLoss()
    optimizer = nn.SGD(model.trainable_params(), learning_rate=learning_rate)
  4. 训练与评估:通过迭代数据集进行训练,并在每轮结束后评估模型性能。

    python 复制代码
    def train_loop(model, dataset):
        # 训练循环的实现...
    def test_loop(model, dataset, loss_fn):
        # 测试循环的实现...
相关推荐
Lucky_ldy几秒前
C语言学习:动态内存管理(数据结构关键)
c语言·数据结构·学习
咸甜适中1 分钟前
rust语言学习笔记Trait之 AsRef 和 AsMut(引用转换)
笔记·学习·rust
数智工坊1 分钟前
【GPT-4V全面评估】:大语言多模态模型的黎明时代
论文阅读·人工智能·深度学习·计算机视觉·transformer
leon_teacher1 分钟前
HarmonyOS 6 古诗学习宝实战:基于 Preferences 实现错题本自动派生与题级去重系统
学习·华为·harmonyos
weixin_408099672 分钟前
模糊图片怎么变清晰?3种AI方案实测对比(附效果图)
人工智能·图片处理·图像增强·api开发·石榴智能·图片变清晰
大力财经2 分钟前
百度2026年Q1:总营收321亿元 AI业务占比达52%
人工智能·百度
专注数据的痴汉2 分钟前
「数据下载」全国星级旅游饭店统计调查报告(2001-2023)
大数据·人工智能·旅游
今日综合3 分钟前
科技有温度 潮玩有灵魂 ——哩呐呐 AI 社交潮玩智体新品发布会在深举行
人工智能
在繁华处3 分钟前
从零搭建轻灵(三):流式 TUI 终端界面
人工智能
Shadow(⊙o⊙)3 分钟前
进程分析2.0——进程退出、进程等待-Linux重要经典模块
linux·运维·服务器·开发语言·c++·学习