昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
Qhumaing几秒前
Java学习——第五章 异常处理与输入输出流笔记
java·笔记·学习
SAP工博科技4 分钟前
装备制造SAP Cloud ERP实施指南:基于海铑机电的全流程落地方案
大数据·人工智能·制造
视***间4 分钟前
视程空间算力模块Jetson AGX 275TOPS应用到人形机器人上
大数据·人工智能·边缘计算·ai算力开发板
weixin_437497776 分钟前
部分LLM小参数模型特征汇总
人工智能·语言模型
科技云报道7 分钟前
科技云报到:2026,AI开启“共生智能”新纪元
大数据·人工智能·科技
综合热讯8 分钟前
中国企业追光科技亮相CES 2026,聚焦消费电子低碳供能
人工智能·科技
byzh_rc8 分钟前
[深度学习网络从入门到入土] 神经网络发展脉络
人工智能·深度学习·神经网络
世人万千丶10 分钟前
鸿蒙跨端框架 Flutter 学习 iverpod 实战:超越 Provider 的响应式状态管理
学习·flutter·华为·交互·harmonyos·鸿蒙
聊聊科技10 分钟前
编曲伴奏软件有哪些,音乐人分享AI编曲软件助力原创音乐创作
人工智能
xfddlm11 分钟前
再探模型训练,使用LLaMA-Factory实现LLM微调
人工智能·llama