大模型时代，如何快速开发AI应用

本文分享自华为云社区《【云享问答】第3期：大模型时代，如何快速开发AI应用》，作者：华为云社区精选。

大模型快速普及应用的当下，AI浪潮汹涌而至，对于开发者来说，开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵，从数据处理、算法开发、模型训练到部署，全方位拆解AI开发全流程，本期【云享问答】通过这14个问题，带你上手华为云一站式AI开发平台ModelArts，实现AI应用的快速开发。

Q1、AI开发的基本流程是怎样的？

一个典型的AI应用开发包括数据处理、算法开发、模型训练、模型部署等，在ModelArts上可以完成以上所有流程。数据处理主要是对上传到云端的数据进行标注和特征分析，算法开发可以使用ModelArts官方发布或自己开发的算法，模型训练即使用云上的CPU/GPU/NPU等资源创建训练作业，最终的模型部署可部署为在线服务或者边缘服务，可以参考这个👉免费案例实操一下。

Q2、零基础小白，也可以快速上手AI开发吗？

零基础小白，可以使用ModelArts进行AI开发体验，推荐尝试ModelArts自动学习功能, 自动学习不需要AI能力和编码能力，只需上传数据，通过图像化界面操作即可完成模型训练和部署，当前支持图像分类、物体检测、预测分析、声音分类和文本分类等任务。 👉指导手册

也可以前往华为云AI开发交流社区------👉AI Gallery，里面有很多算法、模型、notebook等资产（这些资产的运行依赖的就是ModelArts），也有课程和讨论区。

Q3、华为云ModelArts是如何简化AI开发过程的？

简单的说，ModelArts解决了AI开发最关键的算力和算法获取问题：1、作为云平台，它提供非常方便的算力资源；2. AI Gallery作为社区，提供非常多开箱即用的模型。

AI开发包括多个步骤，每个步骤也有很多细节，ModelArts提供足够丰富的功能满足不同的需求。另一方面，ModelArts也提供了工作流能力（Workflow），覆盖数据标注、数据处理、模型开发/训练、模型评估、应用开发、应用评估等AI开发的多个步骤，使用者可以通过可视化配置运行开发好的工作流。

Q4、与本地开发相比, 在云上进行AI应用开发有什么优势？

以华为云一站式AI开发平台ModelArts为例，它的优势体现在：

数据智能标注、团队标注、特征分析，可以提高数据处理的效率；
自动学习、AI Gallery的预置算法，无需编写代码开发算法，可以快速进行实验；
推理部署，不用自己去开发Web服务、用户鉴权等模块，可以快速将模型部署成在线服务；
丰富的案例资料，在AI Gallery上可以学习了解当前热门的AI模型、算法等案例。

Q5、如何从本地IDE连接ModelArts，进行AI应用开发？

ModelArts支持通过本地IDE远程连接到云上的Notebook中，开发基于Pytorch、Tensorflow和MindSpore引擎的AI模型：👉具体操作指导参考

Q6、海量数据处理很繁琐，ModelArts可以简化这个流程吗？

可以的，ModelArts提供数据标注功能，即在云上提供图像、文本、音频、视频等数据的标注作业，除了人工标注外，ModelArts还提供自动标注、团队标注等；另外也提供数据特征分析功能，可以根据数据集中图片特征绘制曲线。

Q7、当前在ModelArts上能获得哪些公开的数据集?

数据集公开在AI Gallery上，一部分是常见的公开数据集，如ImageNet、COCO、CitySpaces、Imdb情感分析等；一部分是华为云以往的AI比赛中使用的数据集，如无人车比赛的交通标志识别、疲劳驾驶检测比赛的视频、OCR比赛的中英文购物小票等；最后就是开发者自发上传的各式数据集。可以去👉AI Gallery逛逛。

Q8、如何将本地训练的模型迁移上云？

我们既可以将模型部署到云上作为Web服务👉参考文档，也支持下发到端边侧
👉参考文档。

如果自己线下训练的模型，部署到ModelArts平台成为一个API服务，不需要做模型转换，可以参考如下👉指导手册。

Q9、其他格式的AI模型支持导入到ModelArts继续训练吗？

1、如果是简单的实验，可以用ModelArts的Notebook，这个环境比较自由，跟你在本地做AI开发差不多，比如Keras模型导入后用Keras API操作就行👉指导手册。

2、如果是正式的训练/推理作业，需要适配ModelArts的规范，建议也是先参考1在Notebook里调通，再创建正式作业，需要注意的点是云上作业存储用的是华为云OBS（代码/数据需要先传到OBS），相关的规范可参考👉参考1；👉参考2

Q10、ModelArts上会有训练好的开放模型吗？提供模型市场或线上调优服务吗？

模型资产发布在AI Gallery中，大部分没有公开权重，但是可以在ModelArts上部署使用，如往届华为云AI大赛的优秀作品；另外值得一提的是，最近火爆的开源大模型也陆续上架到AI Gallery中，如Stable Diffusion、MPT、Falcon等。

Q11、ModelArts中如何进行大规模分布式训练？

ModelArts主要支持数据并行方式的分布式训练，包括单机多卡、多机多卡，与单机单卡相比，借助PyTorch、MindSpore等框架能力，仅需修改几行代码即可。可参考以下链接👉了解详情和查看代码示例。

Q12、目前ModelArts平台支持哪些AI框架？

PyTorch/TensorFlow/MindSpore都支持，CPU/GPU/Ascend版本都有。

Q13、ModelArts是否有像GPT那样的通用生成能力呢？

ModelArts是开发平台，你可以使用ModelArts开放自己的大语言模型，AI Gallery中也有👉ChatGLM这样的案例。

Q14、ModelArts会有一些支持开发者的活动吗？

近期上线了👉昇腾AI·玩转AIGC实战营活动，后续陆续有更多活动推出，敬请期待。

如果你有更多关于AI应用开发的问题，可以前往华为云开发者社区论坛提问，参与每个月的提问活动，有机会赢取精美礼品。

点击关注，第一时间了解华为云新鲜技术~