随着AI大模型再次引爆风口,国产AI计算卡也被大家更多地重视起来,本文将汇总目前已知的AI计算卡参数信息,数据来自于互联网公开资料,部分数据为合理推测,供大家参考。

寒武纪MLU
|--------------|------------------|-----------|-----------|-----------|-----------------|------------|------------|-----------|---------|------|
| 型号 | 显存 | INT4 OPs | INT8 OPs | INT16 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存 带宽 | 显存 位宽 bit | 互联 带宽 | 功耗 w |
| MLU590 | 96GB HBM2e | | 628T | | 314T | | 2.76TB/s | | | |
| MLU370-S4/S8 | 24GB/48GB LPDDR5 | 384T (推测) | 192T | 96T | 72T | 18T | 307.2 GB/s | | | 75 |
| MLU370-X4 | 24GB LPDDR5 | 512T (推测) | 256T | 128T | 96T | 24T | 307.2 GB/s | | | 150 |
| MLU370-X8 | 48GB LPDDR5 | 512T (推测) | 256T | 128T | 96T | 24T | 614.4 GB/s | | 200GB/s | 250 |
| MLU270-S4 | 16GB DDR4 ECC | 256T (理论) | 128T (理论) | 64T (理论) | | | 102 GB/s | 256 | | 70 |
| MLU270-F4 | 16GB DDR4 ECC | 256T (理论) | 128T (理论) | 64T (理论) | | | 102GB/s | 256 | | 160 |
阿里PPU
|----|------------|--------------|-----------------|------------|------|
| 型号 | 显存 | INT8 FP8 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 功耗 w |
| E | 96GB HBM2e | | 147T | | 400 |
| D | 80GB | | 989T | | |
| C | 80GB | × | 312T | | |
| B | 96GB | × | 120T | | |
| A | 64GB | × | 370T | | |
海光
|----------|------|----------|-----------------|------|------------|-------|---------|---------|------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | TF32 | FP32 FLOPs | FP64 | 显存带宽 | PCIe 接口 | 功耗 w |
| K100 AI版 | 64GB | 392T | 196T | 96T | 49T | | 896GB/s | 5.0×16 | 350 |
| K100 | 64GB | 200T | 100T | | 24.5T | 24.5T | 896GB/s | 4.0×16 | 300 |
天数智芯
|-------|------------|----------|-----------------|------------|---------|-------|------|--------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存带宽 | 互联 带宽 | 功耗 w | 参考价 |
| 天垓150 | 64GB HBM2e | 384T | | | 1.6TB/s | | 350 | ¥80759 |
| 天垓100 | 32GB HBM2 | 295T | 147T | 37T | 1.2TB/s | | 250 | |
| 智铠100 | 32GB | | 200T | | 800GB/s | | | |
摩尔线程
|-----------|-------------|------|------------|-----------------|------------|----------|-----------|------|
| 型号 | 显存 | 核心数 | INT8 FLOPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存带宽 | 显存 位宽 bit | 功耗 w |
| MTT S4000 | 48 GB GDDR6 | | 200T | 100T | | 768 GB/s | | 450 |
| MTT S3000 | 32GB GDDR6 | 4096 | | | 15.5 T | 448GB/s | 256 | |
| MTT S2000 | 32GB | 4096 | | | 10.4 T | | 256 | 150 |
沐曦
|--------|------------|----------|-----------------|------------|---------|-----------|------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存 带宽 | 显存 位宽 bit | 功耗 w |
| 曦思N100 | 16GB | 160T | 80T | | | | |
| 曦云C500 | 64GB HBM2e | 560T | 280T | 36T | 1.8TB/s | | 450 |
| 曦彩G系列 | | | | | | | |
昆仑芯
|-------------------|------------|----------|----------|-----------|-----------------|------------|----------|----------|----------|
| 型号 | 显存 | INT4 OPs | INT8 OPs | INT16 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存 带宽 | 互联 带宽 | 功耗 w |
| M300 | | | | | | | | | |
| M100 | | | | | | | | | |
| P800 | | | | | | | | | |
| R480-X8 | 32GB GDDR6 | × | 256T | 128T | 128T | 32T | 512 GB/s | 200 GB/s | |
| RG800 | | | | | | | | | |
| R200 | | | | | | | | | |
| R100 | | | | | | | | | |
| K200 818-300(训练卡) | 16GB HBM | √ | 256T | × | 64T | 16T | 512 GB/s | | 150- 200 |
| K100 818-100(推理卡) | 8GB HBM | √ | 128T | × | 32T | 8T | 256 GB/s | | 75 |
璧仞科技
|-------|------------|----------|-----------------|------------|----------|----------|------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | FP32 FLOPs | 显存 带宽 | 互联 带宽 | 功耗 w |
| BR100 | 64GB HBM2e | 2048T | 1024T | | 2.3 TB/s | 128 GB/s | |
燧原科技
|-------|------|----------|-----------------|----------|------------|----------|------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | TF32 OPs | FP32 FLOPs | 显存 带宽 | 功耗 w |
| S60 | 48GB | | 392T | | | 672 GB/s | |
| 云燧i20 | | 256T | | 128T | | | |
砺算科技
|-----------|------------|----------|-----------------|----------|------------|-------|------|
| 型号 | 显存 | INT8 OPs | FP16 BF16 FLOPs | TF32 OPs | FP32 FLOPs | 显存 带宽 | 功耗 w |
| 7G105 专业级 | 24GB GDDR6 | | | | 24T | | |
| 7G06 消费级 | 12GB GDDR6 | | | | | | |

