昇腾AI入门

文章目录

昇腾入门

昇腾社区和开源代码仓

昇腾社区首页
Ascend开源仓
CANN开源仓

昇腾硬件产品有哪些

查看昇腾硬件产品说明:点击昇腾社区首页,查看"产品"-》"Atlas系列硬件"可以看到所有产品。
昇腾硬件产品列表
昇腾计算产品3D展示

昇腾软件全栈架构图

查看昇腾软件全栈:点击昇腾社区首页,查看"产品",可以看到所有软件版本文档,如下图:

昇腾推理解决方案

小模型推理: 【PyTorch生态】主要有ACL离线推理torchair在线推理

大模型推理: 【PyTorch生态】主要有MindIEvLLMSGLangxLLM

【MindSpore生态】:查看MindSpore产品全景

怎么找推理适配的模型

已适配的小模型列表: 链接
已适配大模型列表: MindIE文本生成模型MindIE视图生成模型魔乐社区-MindIEvllm支持SGLang支持xLLM支持

昇腾训练解决方案

小模型训练: PTA
大模型训练: MindSpeed

怎么找训练适配的模型

已适配的小模型列表: gitcode社区魔乐社区
已适配大模型列表: MindSpeed-LLMMindSpeed-MMMindSpeed-RL

一文看懂英伟达的产品体系和命名规则

https://mp.weixin.qq.com/s/R0rQqWw2bjGm6B44pNKWwQ

A800是专为中国市场设计的合规版A100(规避美国出口限制)

单个AI处理器算力计算逻辑

算力介绍:

  • 首先了解评估算力的指标:xxOPS, 即每秒可执行多少次运算。
    举个例子: 如280 TFLOPS FP16算力,指的是每秒280 *(10^12)次半精度浮点运算;560 TOPS INT8算力,指的是每秒560 *(10^12)次整型运算。

    1MFLOPS: 等于每秒一百万(=10^6)次浮点运算;

    1GFLOPS: 等于每秒十亿(=10^9)次浮点运算;

    1TFLOPS: 等于每秒一万亿(=10^12)次浮点运算;

    1PFLOPS: 等于每秒一千万亿(=10^15)次浮点运算;

    1EFLOPS: 等于每秒一百京(=10^18)次浮点运算;

  • 时钟周期(主频)

    处理器执行动作的最小时间单位,也就是我们经常看到主频,例如AI CORE时钟频率为1 GHz(1,000,000,000 次/秒),那么每个时钟周期的持续时间就是1纳秒(1/1,000,000,000 秒)。

昇腾AICore一拍(即一个时钟周期或一个指令)能完成多少次计算:

复制代码
以fp16运算为例,cube一拍可以完成一个基本操作:X=A * B + C, =16 * 16 * 16 * 2=8192次运算;vector一拍可以完成一个基本操作:C=A * B,=16 * 16=256次运算

单个AI处理器浮点算力=AIC核数×处理器主频×每拍可进行的最高浮点运算次数 + AIV核数×处理器主频×每拍可进行的最高浮点运算次数

以910系列为例:

text 复制代码
fp16理论值计算方式:
cube:16 * 16 * 1 6 *  2 * 频率 * AIcore数量
vector:16 * 16 * 频率 * vector核数量
算力值:cube算力值+vector算力值

fp32理论值计算方式:
cube: 8 * 16 * 8 * 2 * 频率 * AIcore数量
vector:8 * 16 * 频率 * vector核数量
算力值:cube算力值+vector算力值

计算某910系列的FP16算力:
单个AI处理器浮点算力=AIC核数×处理器主频×每拍可进行的最高浮点运算次数 + AIV核数×处理器主频×每拍可进行的最高浮点运算次数。

假设AIC核数为10,主频为3000MHz, AIV核数为20,则:
cube算力=10 * 3000MHz * 8192 = 245.76TOPS
vector算力=20 * 3000MHz * 256 = 15.36TOPS
总的算力=cube算力+vector算力=261.12TOPS
相关推荐
那个村的李富贵3 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
腾讯云开发者5 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR5 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky5 小时前
大模型生成PPT的技术原理
人工智能
禁默6 小时前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切6 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
AI绘画哇哒哒7 小时前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行
数据分析能量站7 小时前
Clawdbot(现名Moltbot)-现状分析
人工智能
那个村的李富贵7 小时前
CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战
人工智能·算法·aigc·cann
二十雨辰7 小时前
[python]-AI大模型
开发语言·人工智能·python