昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
Coder_Boy_3 分钟前
基于SpringAI的在线考试系统-数据库设计核心业务方案(微调)
java·数据库·人工智能·spring boot·领域驱动
_ziva_3 分钟前
大模型面试与实用技巧教学
人工智能
kaoshi100app6 分钟前
2026年注册安全工程师报考条件解读
开发语言·人工智能·职场和发展·学习方法
deepdata_cn7 分钟前
交叉熵损失分类及应用
人工智能·分类·数据挖掘
發糞塗牆10 分钟前
Azure 架构师学习笔记 - Azure AI(2)-Azure机器学习 (Azure ML) 工作区架构
人工智能·azure
Testopia10 分钟前
基于机器学习的保险欺诈检测
人工智能·机器学习·ai编程·分类算法·ai项目周期
攻城狮7号12 分钟前
阿里开源 Qwen3-TTS 系列:技术解析如何去除“机器味”
人工智能·开源模型·语音模型·qwen3-tts·阿里通义千问
无名修道院12 分钟前
AI大模型应用开发-Linux 入门
linux·运维·人工智能·ai大模型应用开发
JXL186013 分钟前
Loss function
人工智能·机器学习
自己的九又四分之三站台13 分钟前
8:大语言模型是无状态以及大语言模型的基石Embedding
人工智能·语言模型·embedding