昇思大模型——MindFormers的使用----从零开始安装配置环境

MindSpore Transformers套件的目标是构建一个大模型训练、微调、评估、推理、部署的全流程开发套件,提供业内主流的Transformer类预训练模型和SOTA下游任务应用,涵盖丰富的并行特性。期望帮助用户轻松的实现大模型训练和创新研发。

MindSpore Transformers套件基于MindSpore内置的并行技术和组件化设计,具备如下特点:

  • 一行代码实现从单卡到大规模集群训练的无缝切换;
  • 提供灵活易用的个性化并行配置;
  • 能够自动进行拓扑感知,高效地融合数据并行和模型并行策略;
  • 一键启动任意任务的单卡/多卡训练、微调、评估、推理流程;
  • 支持用户进行组件化配置任意模块,如优化器、学习策略、网络组装等;
  • 提供Trainer、pipeline、AutoClass等高阶易用性接口;
  • 提供预置SOTA权重自动下载及加载功能;
  • 支持人工智能计算中心无缝迁移部署;

昇思大模型平台 (mindspore.cn)

mindformers: MindSpore Transformers套件的目标是构建一个大模型训练、推理、部署的全流程套件: 提供业内主流的Transformer类预训练模型, 涵盖丰富的并行特性。 期望帮助用户轻松的实现大模型训练。 文档:https://mindformers.readthedocs.io/zh-cn/latest/ (gitee.com)

  1. 安装

在Linux Ubuntu环境下先安装git

复制代码
sudo apt install git

获取mindformers

复制代码
git clone -b r1.1.0 https://gitee.com/mindspore/mindformers.git

进入目录执行脚本

复制代码
cd mindformers

bash build.sh

这个脚本需要安装python的setuptools库,运行链接中的命令

No module named 'distutils.cmd_no module named 'distutils.cmd-CSDN博客

复制代码
sudo apt-get install python3.7-distutils   3.7

Python版本至少要3.7,我建议安装3.9

Ubuntu升级Python至3.7_apt-get 更新python3.7-CSDN博客

复制代码
python3

键入"exit()"回到正常命令行模式

build.h可能会报错ERROR: Invalid requirement: 'mindformers*whl'

把脚本里面的python改成python3

按下Esc后键入":wq!"保存退出

再次运行

复制代码
bash build.sh

成功运行,安装完毕。

有时候需要Python不同版本,注意python3和python不一样。我记得也是可以配置的。

复制代码
whereis python3
rm /usr/bin/python3
ln -s /usr/bin/python3.9 /usr/bin/python3

如果是3.9

复制代码
sudo apt-get install python3.9-distutils   3.9
相关推荐
晚霞的不甘17 分钟前
守护智能边界:CANN 的 AI 安全机制深度解析
人工智能·安全·语言模型·自然语言处理·前端框架
谢璞19 分钟前
中国AI最疯狂的一周:50亿金元肉搏,争夺未来的突围之战
人工智能
池央19 分钟前
CANN 算子生态的深度演进:稀疏计算支持与 PyPTO 范式的抽象层级
运维·人工智能·信号处理
方见华Richard20 分钟前
世毫九实验室(Shardy Lab)研究成果清单(2025版)
人工智能·经验分享·交互·原型模式·空间计算
Maynor99621 分钟前
OpenClaw 玩家必备:用 AI 自动追踪社区最新动态
java·服务器·人工智能
aini_lovee21 分钟前
MATLAB基于小波技术的图像融合实现
开发语言·人工智能·matlab
ujainu31 分钟前
CANN仓库中的AIGC多模态统一抽象工程:昇腾AI软件栈如何用一套接口驾驭图文音视
人工智能·aigc
少云清32 分钟前
【金融项目实战】7_接口测试 _代码实现接口测试(重点)
python·金融项目实战
深蓝电商API33 分钟前
爬虫IP封禁后的自动切换与检测机制
爬虫·python
m0_5500246334 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python