昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
正宗咸豆花17 小时前
具身智能开源生态:小米机器人VLA模型如何推动物理AI产业化?
人工智能·机器人·开源
啊阿狸不会拉杆17 小时前
《机器学习导论》第 18 章-增强学习
人工智能·python·学习·算法·机器学习·智能体·增强学习
产品经理邹继强17 小时前
VTC财务与投资篇③:投资决策重构——用VTC穿透财务预测的迷雾
大数据·人工智能·重构
查无此人byebye17 小时前
基于DiT+DDPM的MNIST数字生成:模型推理实战教程
人工智能·python·深度学习·nlp·transformer
天使Di María17 小时前
脑电大模型系列——第一弹:BENDR
人工智能·大模型·脑机接口·精准解码
AI智能观察17 小时前
2026交通数字人智能体Top5 :厂商深度解析,赋能智慧交通新生态
人工智能·智慧城市·数字人·智慧交通·智能体
我的xiaodoujiao17 小时前
使用 Python 语言 从 0 到 1 搭建完整 Web UI自动化测试学习系列 48--本地环境部署Jenkins服务
python·学习·测试工具·pytest
冰西瓜60017 小时前
深度学习的数学原理(五)—— 非线性与激活函数
人工智能·深度学习
田里的水稻17 小时前
FA_规划和控制(PC)-D*规划
人工智能·算法·数学建模·机器人·自动驾驶
love530love17 小时前
【OpenClaw 本地实战 Ep.2】零代码对接:使用交互式向导快速连接本地 LM Studio 用 CUDA GPU 推理
人工智能·windows·gpu·cuda·ollama·lm studio·openclaw