昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
Rocky Ding*11 分钟前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
大山佬12 分钟前
AI 边缘部署:MCU 上的轻量级目标检测,从 YOLO 到 TFLite Micro 的全链路优化
人工智能
旅僧12 分钟前
Π环境部署(运行 且 无理论讲解)
学习
数睿数据无代码开发14 分钟前
深度解析smardaten数据大屏:六大核心功能重塑可视化开发
人工智能·信息可视化
陈猪的杰咪14 分钟前
GitHub Copilot 2026计费新规:AI Credits消耗解析与节省策略
人工智能·ai·架构·github·copilot
jushi899915 分钟前
Lucas Chess R国际象棋、中国象棋、日本将棋、五子棋训练学习工具游戏软件
学习
学术头条22 分钟前
清华团队开源SCAIL-2:角色动画告别骨骼依赖,端到端还原视频中动作细节
人工智能·科技·机器学习·ai·开源·音视频·agi
لا معنى له23 分钟前
世界模型的功能分类法——Renderers, Simulators, Planners, and the Loop That Connects Them
人工智能
华如锦30 分钟前
面了很多 Java转AI Agent方向,一些面试题总结
java·开发语言·人工智能·python·ai
微学AI31 分钟前
大模型与量子纠缠:一场关于“关联“的范式对话与深度研究
人工智能·量子纠缠