在安防行业和流媒体领域,构建一套大规模、高并发且具备 AI 视频结构化能力的综合管理平台,对任何一家技术团队来说都是一场硬仗。
传统的视频中台开发往往面临两大核心痛点:底层芯片适配难 (从 NVIDIA 的 GPU 到各类国产化的 NPU 边缘盒子,架构各异、驱动繁杂)和流媒体协议开发周期长(国标 GB28181 的复杂信令、RTSP/RTMP 的低延迟推流与解复用)。大量集成商和企业在底层基础能力的构建上浪费了过多资源。
今天,我们从系统架构师的角度,深度剖析一套打通了"芯片、算法、应用"全流程的企业级 AI 视频管理平台。该平台采用微服务 与容器化 技术,实现了算力解耦 与边缘推流 的闭环。更重要的是,在实际商业落地中,它能够帮助企业级应用减少约 95% 的开发成本。
一、 异构计算与云边端协同架构设计
在高性能 AI 视频流处理场景中,单一的硬件架构很难兼顾"中心端高并发解析"与"边缘端低延迟推理"。本平台的核心设计思想在于"算力解耦,云边协同"。
1.1 X86 与 ARM 的全指令集适配
系统底层全面兼容 X86 (中心端服务器)与 ARM (边缘端计算单元)指令集。通过 Docker 容器化 技术,将复杂的底层依赖(如 CUDA、RKNN-RT、Sophon-SDK)封装在不同的镜像层中,对上层业务应用屏蔽硬件差异。
1.2 GPU 与 NPU 的算力路由机制
-
云端/中心端(GPU 服务器):侧重于大并发、多路数的高精度模型推理,以及海量历史视频的结构化检索。支持客户定制化 GPU 品牌。
-
边缘端(NPU 边缘盒子) :负责前端的边缘推流与高实时性的算法轻量化高频推理(如园区通道、单兵设备),管理边缘盒子下的摄像机,并控制具体的运行算法与识别告警间隔。
二、 平台核心技术参数与多协议接入
作为一个高可用的视频中台,必须具备全协议"通吃"的能力。平台在协议适配层做到了深度解耦,以下是其核心技术指标:
-
多协议视频流接入 :支持 GB28181 国际标准协议、Onvif 局域网发现协议,以及 RTSP/RTMP 传统流媒体推拉流。
-
视频编码格式 :全面兼容 H.264 / H.265,支持高码率视频流的硬解码。
-
全方位告警通知闭环:
-
即时通讯通道:飞书、企业微信、钉钉。
-
标准物联接口:语音电话、第三方标准 API 接口、现场网络音柱、LED 户外显示屏。
-
-
灵活组网方式:支持公网、私有云、局域网及跨网闸的灵活组网,适应从单一园区到智慧城市级的复杂网络环境。
三、 二次开发:丰富的 API 路由与逻辑模拟
为了达到"节省 95% 开发成本"的目标,平台抽象出了标准化的底层 API。集成商无需关心底层的国标注册、流转或视频解复用逻辑,只需简单的配置和调用即可。
以下是平台边缘端设备绑定与 AI 算法流调度的逻辑配置示例(以 JSON 视角展现):
JSON
// POST /api/v1/edge/device/bind
// 开发者只需通过如下结构体,即可将一台 GB28181 或 RTSP 摄像机绑定至指定的 NPU 边缘计算单元
{
"device_id": "cam_dock_001",
"device_name": "园区北门主路摄像机",
"protocol": "GB28181",
"stream_config": {
"gb_id": "34020000001320000001",
"channel_id": "34020000001310000001"
},
"algorithm_routing": {
"engine_type": "NPU_ROCKCHIP", // 指定路由至瑞芯微 NPU 计算单元
"algorithms": [
{
"alg_code": "pedestrian_count_v2", // 加载人流量统计算法
"roi_polygon": [[120, 80], [480, 80], [480, 400], [120, 400]], // 绘制感兴趣区域
"interval_ms": 500 // 推理间隔 500ms
}
]
}
}
当边缘端触发告警时,系统会自动进行内存级别的图片抓拍,并根据预设的生命周期自动清理,防止磁盘撑爆:
Python
# 伪代码:高并发告警流订阅与自动清理逻辑
def on_ai_alarm_callback(alarm_event):
# 1. 解析告警原图与结构化数据
image_data = alarm_event.get_raw_image()
pedestrian_stats = alarm_event.get_data("pedestrian_metrics") # 进入/离开/剩余人数
# 2. 触发多路闭环推送(例如飞书机器人)
feishu_pusher.send_image(image_data, text=f"区域当前剩余人数: {pedestrian_stats['remaining']}")
# 3. 存储生命周期管理(系统默认每天24:00自动执行,自动清除超过保存时长外的图片,节省磁盘空间)
storage_manager.set_ttl(image_data, days=1)
四、 核心功能模块:AI 算法商城与人流量统计
依托于强大的流媒体底座,平台在业务层交付了完整度极高的功能模块:
4.1 数据标注与算法商城一体化
平台内置了数据标注平台 ,支持用户自主上传图片并进行在线标注。标注完成的数据可直接用于训练,训练好的模型文件能够无缝上传至算法商城,实现"标注-训练-部署-升级"的全生命周期管理。
4.2 场景化落地:高精度人流量统计
以人流量统计模块为例,平台支持通过"绘制区域"和"统计线"实现精准的进出量计算:
-
进入人数 / 离开人数:根据绘制的区域、统计线,成功统计到的双向越线数据。
-
剩余人数:实时计算同一监控摄像机下统计的进入、离开人数的差值(可为负数)。
-
时序看板:汇总当前系统全部计算单元下及所有摄像机的人流量数据,以直观、可视化的图表形式展示总人流量变化趋势。
商业合作亮点 :对于系统集成商(SI)而言,该平台支持私有化部署与纯自研代码级别的源代码交付。平台自带一键替换 LOGO 和系统改名功能,极大地方便了贴牌合作(OEM)。
五、 开源地址与演示环境
为了方便各位技术同行进行架构复核与业务压测,该项目已将核心后端服务开源,且官方提供了完整的线上演示环境。
-
官方演示环境:
-
访问地址 :
http://demo.yihecode.com:8080(注:实际地址以开源社区最新发布为准) -
登录账号 :
admin -
登录密码 :
admin123
-
技术交流引导: 你在对接 GB28181 国标流媒体或者进行各类国产 NPU 边缘盒子(如瑞芯微、算能、昇腾)的算法移植时,遇到过哪些棘手的坑?欢迎在评论区留言,或者移步 Gitee 提交 Issue,我们一起在架构层面探讨更优的解法!