昇思大模型学习·第一天

茫渡。2024-06-19 23:47

mindspore快速入门回顾

导入mindspore包
处理数据集
- 下载mnist数据集
- 进行数据集预处理
  - MnistDataset()方法
  - train_dataset.get_col_names() 打印列名信息
  - 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
网络构建
- mindspore.nn: 构建所有网络的基类
- 用的层有
  - Flatten
  - Dense
  - ReLU
模型训练
- 正向计算
  - logits:预测结果
  - label:正确标签
  - loss:预测损失
- 反向传播
  - parameters:模型参数
  - grandients:loss梯度
- 参数优化：将梯度更新到参数上。
- 步骤：
  - 定义正向计算函数
  - 使用value_and_grad通过函数变换获得梯度计算函数。
  - 定义训练函数，使用set_train设置为训练模式，执行正向计算、反向传播和参数优化。
保存模型
加载模型

上一篇：PostgreSQL源码分析——常量表达式化简

下一篇：Deformable-DETR

热门推荐

01UV安装并设置国内源 02Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 03KGG转MP3工具|非KGM文件|解密音频 04【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）052025最新国内服务器可用docker源仓库地址大全（2025年8月更新）06蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 09阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！10TRAE Rules 实践：为项目配置 6A 工作流