昇思MindSpore进阶教程--AOE调优工具

大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。

技术上主攻前端开发、鸿蒙开发和AI算法研究。

努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧

概述

AOE(Ascend Optimization Engine)是一款自动调优工具,作用是充分利用有限的硬件资源,以满足算子和整网的性能要求。AOE工具的详细介绍,请参考AOE简介。本文档主要介绍如何使用AOE工具实现MindSpore训练场景下的调优。

开启调优

配置环境变量。

在set_context接口中设置aoe_tune_mode,即可开启AOE工具进行在线调优。aoe_tune_mode的取值为"online", 开启在线调优。

在set_context接口中设置aoe_config,可设置调优配置。job_type是设置调优类型,取值在["1", "2"]中,默认值是2。其中:

1:表示子图调优。

2:表示算子调优。

举例在线调优的使用方法:

python 复制代码
import mindspore as ms
ms.set_context(aoe_tune_mode="online", aoe_config={"job_type": "2"})

设置好上述context之后,按照正常执行训练脚本方式即可启动调优,用例执行期间,无需任何操作,用例执行结束之后的结果即为调优之后的结果。

查看调优结果

调优开始后,会在执行调优的工作目录下生成命名为aoe_result_opat_{timestamp}_{pidxxx}.json的文件来记录调优过程和调优结果。该文件的具体解析请参考调优结果文件分析。

调优完成后,若满足自定义知识库生成条件,则会生成自定义知识库。如果指定了知识库存储路径的环境变量TUNE_BANK_PATH,调优生成的知识库会在指定目录下生成,否则调优生成的知识库会在如下默认路径中${HOME}/Ascend/latest/data/aoe/custom/graph/${soc_version}

知识库合并

算子调优结束后,生成的调优知识库支持合并以便于再次执行用例使用(或者其他脚本使用)。仅支持相同昇腾AI处理器型号下的自定义知识库合并。具体合并方式请参考CANN开发工具指南中的合并知识库。

使用须知

AOE调优工具在使用时,请注意以下几点:

  1. AOE调优工具只支持在Ascend环境上使用。

  2. 请确保运行环境中执行调优用户的home目录下磁盘可用空间>=20G。

  3. 开启该调优工具后,可以明显感知算子编译时间变长,属于正常现象。

相关推荐
古城小栈2 分钟前
Go + 边缘计算:工业质检 AI 模型部署实践指南
人工智能·golang·边缘计算
SelectDB4 分钟前
Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解
数据库·人工智能·agent
tap.AI7 分钟前
AI时代的云安全(四)云环境中AI模型的安全生命周期管理实践
人工智能·安全
Codebee10 分钟前
技术与业务双引擎驱动:Qoder与TRAE重塑强势软件新范式
人工智能
骄傲的心别枯萎13 分钟前
RV1126 NO.56:ROCKX+RV1126人脸识别推流项目之VI模块和VENC模块讲解
人工智能·opencv·计算机视觉·音视频·rv1126
汉得数字平台15 分钟前
汉得H-AI飞码——前端编码助手V1.1.2正式发布:融业务知识,提开发效能
前端·人工智能·智能编码
资源补给站16 分钟前
论文15 | 深度学习对功能性超声图像进行血管分割案例分析
人工智能·深度学习
AALoveTouch17 分钟前
n8n 2.0 中文汉化版一键部署教程 | 解除Execute Command限制
人工智能·自动化
لا معنى له35 分钟前
学习笔记:Transformer
人工智能·笔记·深度学习·学习·机器学习·transformer
人工智能培训36 分钟前
什么是基于大模型的智能体构建?
人工智能·深度学习·大模型·具身智能·智能体·智能体构建·大模型智能体