昇腾算力卡310p编解码推理性能记录

基础配置

  • 服务器型号:S800K2

  • 算力卡型号:Atlas 300I Duo

  • 测试规格:单310P3核心(Atlas 300I Duo 内置双310P3,为对比统一单卡测试)

一、编解码性能测试

测试条件

  • 输入源:实时流 1080P@30fps H.264

  • 处理流程:解码 → 编码(解码后数据直接用于编码)

性能上限

功能 最大路数 限制原因
解码 32路 单310P3 通道数上限(非性能瓶颈,更大分辨率仍支持32路)
编码 30路 达到性能上限,路数增加会出现掉帧

资源占用(单卡)

资源类型 占用率 备注
CPU 234% 满载 4800%
AI Core 0% -
AI CPU 18% -
Ctrl CPU 70% -
DEC(解码单元) 13% -
VPC(图像处理单元) 9% -
ENC(编码单元) 98% 接近满载

二、推理性能测试(主机端画框方案)

测试条件

  • 模型:yolov8n(coco80 分类)

  • 输入源:实时流 1080P@30fps H.264

  • 处理流程:拉流 → 解码 → letterBox(等比放缩居中) → 逐帧推理 → 后处理 → NV21转RGB → 图像下载至主机 → 画框写字 → 图像上传至算力卡 → RGB转NV21 → 编码 → 推流

性能上限

  • 最大支持路数:10路

  • 性能瓶颈:推理计算,路数增加会出现推理掉帧

资源占用(单卡)

资源类型 占用率 备注
CPU 441% 满载 4800%
AI Core 29% -
AI CPU 7% -
Ctrl CPU 51% -
DEC 4% -
VPC 14% -
ENC 38% -

三、推理性能测试(AI CPU画框方案)

测试条件

  • 模型:yolov8n(coco80 分类)

  • 输入源:实时流 1080P@30fps H.264

  • 处理流程:拉流 → 解码 → letterBox(等比放缩居中) → 逐帧推理 → 后处理 → NV21转RGB → AI CPU画框写字 → RGB转NV21 → 编码 → 推流

性能上限

  • 最大支持路数:5路

  • 性能瓶颈:AI CPU画框写字,路数增加会导致编解码、图像处理随机报错

方案特点

使用AI CPU算子完成画框写字,减少图像在算力卡与主机间的传输,降低CPU占用与PCIe带宽消耗;缺点是AI CPU性能有限,仅适用于少路数场景。

资源占用(单卡)

资源类型 占用率 备注
CPU 213% 满载 4800%
AI Core 12% -
AI CPU 3% -
Ctrl CPU 21% -
DEC 2% -
VPC 6% -
ENC 18% -
相关推荐
MemoriKu4 小时前
Flutter 相册 APP 视频模态稳定化实战:从视频抽帧、Embedding 元数据到 Android 真机启动修复
android·开发语言·前端·flutter·架构·音视频·embedding
EasyDSS4 小时前
视频直播点播/高清点播/音视频点播/云点播/云直播EasyDSS一站式音视频平台助力智慧校园智能化建设
音视频
johnny2334 小时前
视频创作工具:OpenCut、HyperFrames、social-auto-upload、OpenStoryline、ArcReel
音视频
张飞飞飞飞飞4 小时前
多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)
人工智能·深度学习·目标检测
换个昵称都难4 小时前
WebRTC 视频RTP 优化模块
音视频·webrtc
EasyGBS4 小时前
国标GB28181成安防刚需,国标GB28181视频平台EasyGBS如何成为视频上云最优解?
音视频
luoyayun3614 小时前
Qt/QML 音频波形图模块实现:从 PCM 数据到可缩放波形
qt·音视频·波形图绘制
hz567894 小时前
医院LIS系统如何对接视频会议系统?远程诊疗协同方案详解
音视频·实时音视频·信息与通信
鲲穹AI超级员工4 小时前
多款音视频 & 电子书格式工具实测分享,日常素材处理够用了
音视频·电子书格式
楼兰公子4 小时前
基于RK3588平台的ALSA音频学习与开发指南
音视频·rk3588