昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
迷藏494几秒前
**发散创新:基于 Rust的模型保护机制设计与实践**在人工智能快速发
java·人工智能·python·rust·neo4j
lifallen2 分钟前
Flink Agents:Memory 层级分析 (Sensory, Short-Term, Long-Term)
java·大数据·人工智能·语言模型·flink
一定要AK3 分钟前
HTML5 入门到精通全章节学习笔记
笔记·学习·html5
做个文艺程序员5 分钟前
【2026年度技术风向标】大模型深水区、端侧算力与下一代云原生,正在重塑开发者生态
人工智能
lifallen5 分钟前
Flink Agents:外部副作用一致性 (ActionStateStore) 演进分析
java·大数据·人工智能·语言模型·flink
lisw055 分钟前
家政机器人发展现状、挑战与机遇!
人工智能·机器学习·机器人
程序员zgh6 分钟前
C/C++ 单元测试系统 构建
c语言·开发语言·c++·学习·单元测试
love530love6 分钟前
从零搭建本地版 Claurst:基于 Rust 重构的 Claude Code 终端编码助手 + LM Studio 模型接入测试
开发语言·人工智能·windows·重构·rust·lm studio·claude code
人工智能AI技术7 分钟前
微软2026年Win11路线图梳理:18项关键改进,重塑用户体验
人工智能
码农阿豪8 分钟前
Codex 配置自定义 AI API 完整指南:从零到一接入你的专属模型
人工智能·codex