昇思大模型学习·第一天

mindspore快速入门回顾

  • 导入mindspore包

  • 处理数据集

    • 下载mnist数据集
    • 进行数据集预处理
      • MnistDataset()方法
      • train_dataset.get_col_names() 打印列名信息
      • 使用create_tuple_iterator 或create_dict_iterator对数据集进行迭代访问
  • 网络构建

    • mindspore.nn: 构建所有网络的基类
    • 用的层有
      • Flatten
      • Dense
      • ReLU
  • 模型训练

    • 正向计算
      • logits:预测结果
      • label:正确标签
      • loss:预测损失
    • 反向传播
      • parameters:模型参数
      • grandients:loss梯度
    • 参数优化:将梯度更新到参数上。
    • 步骤:
      • 定义正向计算函数
      • 使用value_and_grad通过函数变换获得梯度计算函数。
      • 定义训练函数,使用set_train设置为训练模式,执行正向计算、反向传播和参数优化。
  • 保存模型

  • 加载模型

相关推荐
nvd118 分钟前
一个简单的GitHub AI Agent 实现指南
人工智能·langchain
阿里云大数据AI技术18 分钟前
【新模型速递】PAI-Model Gallery云上一键部署DeepSeek-V3.2模型
人工智能
AA陈超24 分钟前
Lyra学习004:GameFeatureData分析
c++·笔记·学习·ue5·虚幻引擎
阿恩.77025 分钟前
2026年1月最新计算机、人工智能、经济管理国际会议:选对会议 = 论文成功率翻倍
人工智能·经验分享·笔记·计算机网络·金融·区块链
高-老师29 分钟前
WRF模式与Python融合技术在多领域中的应用及精美绘图
人工智能·python·wrf模式
xinyu_Jina40 分钟前
ikTok Watermark Remover:客户端指纹、行为建模与自动化逆向工程
前端·人工智能·程序人生·信息可视化
通义灵码1 小时前
Qoder 全形态产品家族正式发布,并开源 Agentic Coding 产品耐用度评测集
人工智能·开源·ai编程
大白的编程笔记1 小时前
推理(Inference)系统解释
人工智能
LeeZhao@1 小时前
【狂飙全模态】狂飙AGI-智能答疑助手
数据库·人工智能·redis·语言模型·aigc·agi
AI浩1 小时前
DeepSeek-V3.2:推动开源大型语言模型的前沿发展
人工智能·语言模型·自然语言处理