基础配置
-
服务器型号:S800K2
-
算力卡型号:Atlas 300I Duo
-
测试规格:单310P3核心(Atlas 300I Duo 内置双310P3,为对比统一单卡测试)
一、编解码性能测试
测试条件
-
输入源:实时流 1080P@30fps H.264
-
处理流程:解码 → 编码(解码后数据直接用于编码)
性能上限
| 功能 | 最大路数 | 限制原因 |
|---|---|---|
| 解码 | 32路 | 单310P3 通道数上限(非性能瓶颈,更大分辨率仍支持32路) |
| 编码 | 30路 | 达到性能上限,路数增加会出现掉帧 |
资源占用(单卡)
| 资源类型 | 占用率 | 备注 |
|---|---|---|
| CPU | 234% | 满载 4800% |
| AI Core | 0% | - |
| AI CPU | 18% | - |
| Ctrl CPU | 70% | - |
| DEC(解码单元) | 13% | - |
| VPC(图像处理单元) | 9% | - |
| ENC(编码单元) | 98% | 接近满载 |
二、推理性能测试(主机端画框方案)
测试条件
-
模型:yolov8n(coco80 分类)
-
输入源:实时流 1080P@30fps H.264
-
处理流程:拉流 → 解码 → letterBox(等比放缩居中) → 逐帧推理 → 后处理 → NV21转RGB → 图像下载至主机 → 画框写字 → 图像上传至算力卡 → RGB转NV21 → 编码 → 推流
性能上限
-
最大支持路数:10路
-
性能瓶颈:推理计算,路数增加会出现推理掉帧
资源占用(单卡)
| 资源类型 | 占用率 | 备注 |
|---|---|---|
| CPU | 441% | 满载 4800% |
| AI Core | 29% | - |
| AI CPU | 7% | - |
| Ctrl CPU | 51% | - |
| DEC | 4% | - |
| VPC | 14% | - |
| ENC | 38% | - |
三、推理性能测试(AI CPU画框方案)
测试条件
-
模型:yolov8n(coco80 分类)
-
输入源:实时流 1080P@30fps H.264
-
处理流程:拉流 → 解码 → letterBox(等比放缩居中) → 逐帧推理 → 后处理 → NV21转RGB → AI CPU画框写字 → RGB转NV21 → 编码 → 推流
性能上限
-
最大支持路数:5路
-
性能瓶颈:AI CPU画框写字,路数增加会导致编解码、图像处理随机报错
方案特点
使用AI CPU算子完成画框写字,减少图像在算力卡与主机间的传输,降低CPU占用与PCIe带宽消耗;缺点是AI CPU性能有限,仅适用于少路数场景。
资源占用(单卡)
| 资源类型 | 占用率 | 备注 |
|---|---|---|
| CPU | 213% | 满载 4800% |
| AI Core | 12% | - |
| AI CPU | 3% | - |
| Ctrl CPU | 21% | - |
| DEC | 2% | - |
| VPC | 6% | - |
| ENC | 18% | - |