昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
柳安忆几秒前
OpenAgents 中文文档总结报告(上手导向版)
人工智能
dehuisun几秒前
大模型介绍与分类
人工智能
shangjian0075 分钟前
AI大模型-卷积神经网络-对卷积的理解
人工智能·神经网络·卷积
pumpkin8451415 分钟前
Go 学习全景引子:理解设计理念与工程思路
python·学习·golang
sanduo11217 分钟前
AI 原生(AI-Native)&架构极简主义
人工智能·架构·ai-native
zhengfei61142 分钟前
【开源渗透工具】——一个开源的多模态大型语言模型红队框架OpenRT
人工智能·语言模型·开源
WJSKad12351 小时前
工业零件识别与分类:基于lad_r50-paa-r101_fpn_2xb8_coco_1x模型实现
人工智能·分类·数据挖掘
week_泽1 小时前
第5课:短期记忆与长期记忆原理 - 学习笔记_5
java·笔记·学习·ai agent
千汇数据的老司机1 小时前
靠资源拿项目VS靠技术拿项目,二者的深刻区分。
大数据·人工智能·谈单
星期五不见面1 小时前
机器人学习!(二)ROS-基于Gazebo项目(2)2026/01/12
学习·机器人