在安防行业摸爬滚打的这十年来,我见证了视频监控从单纯的"看得见"(模拟/高清网络时代)向"看得懂"(AI大模型与边缘智能时代)的全面蜕变。然而,对于广大系统集成商和独立软件开发商(ISV)而言,AI视频项目的落地往往伴随着巨大的工程化痛点:
-
硬件生态碎片化严重:X86、ARM架构交织,NVIDIA GPU与各大国产NPU(如海思、算能、瑞芯微、瑞芯微等)的底层驱动与推理框架各不相同,换一个硬件底座相当于重写一次底层适配。
-
流媒体服务开发周期长:国标 GB28181 的 SIP 信令交互极其复杂,RTSP/RTMP/Onvif 等协议兼容性差,处理视频流的编解码与边缘推流极耗算力,自研流媒体中间件的吞吐量瓶颈难以突破。
为了解决这些行业顽疾,构建一个高内聚、低耦合、支持快速二次开发的安防AI底座势在必行。今天我们从架构师的角度,深度解构一款全硬件适配、支持源码交付 的企业级 AI 视频管理平台,聊聊它是如何通过容器化与微服务架构,帮助企业节省 95% 开发成本的。
一、 异构算力兼容与微服务架构设计
本平台的核心设计哲学是"算力解耦,服务协同"。为了打破各大芯片厂商间的硬件壁垒,平台在底层采用了异构计算抽象层,并通过 Docker 容器化技术将不同的业务模块微服务化。
无论是中心侧的 X86 GPU 服务器,还是边缘侧的 ARM NPU 边缘计算盒子,平台都能实现无缝的集群管理与算法调度。
+-------------------------------------------------------------------+
| 业务应用层 |
| AI监控大屏 / 算法商城 / 人脸轨迹 / 人流量统计 / 告警管理 |
+-------------------------------------------------------------------+
| 微服务业务层 |
| 视频流管理 / 推送管理 / 标注平台 / 设备管理(Onvif) |
+-------------------------------------------------------------------+
| 流媒体与算力调度层 |
| [国标信令中间件] [边缘推流流媒体服务] [AI推理调度引擎] |
+-------------------------------------------------------------------+
| 异构硬件抽象层 (HAL) |
| X86 (NVIDIA GPU / 架构) | ARM (各品牌边缘NPU盒子 / 嵌入式) |
+-------------------------------------------------------------------+
1.1 平台核心技术参数矩阵
-
核心架构:基于轻量级微服务架构,支持 Docker 容器化一键部署,原生支持集群横向扩展。
-
指令集兼容:完美适配 X86_64、ARM64 等主流 CPU 指令集架构。
-
硬件加速方案:支持 NVIDIA GPU、瑞芯微/算能/海思等主流 NPU 边缘硬件,支持客户定制化 GPU 品牌接入。
-
视频流格式:支持 H.265、H.264 视频编码格式的高效解包与硬解码。
-
存储机制:告警原图与视频片段支持自定义存储时长(默认24:00自动清理历史数据),磁盘空间利用率优化提升 40%。
二、 协议兼容:GB28181 与 RTSP 的统一收流流水线
在实际项目中,集成商经常面临前端摄像机品牌杂乱(海康、大华、宇视等)的问题。平台通过自研的流媒体层,实现了 GB28181 国标协议与 RTSP/RTMP/Onvif 协议 的统一接入与标准化转换。
前端设备无论是通过国标注册,还是通过 RTSP 主动拉流,进入平台后都会被转化为标准化的视频流分发给 AI 推理引擎。
2.1 边缘推流与推理流水线配置(YAML 模拟)
为了降低开发门槛,平台支持低代码化的通道布控。以下是平台内部服务初始化一条带有"人流量统计"算法的边缘推流推理流水线的配置文件逻辑:
YAML
# edge_pipeline_config.yaml
pipeline_id: "pipe_channel_002_mall"
stream_source:
protocol: "GB28181"
device_id: "34020000001320000001" # 国标设备编码
channel_id: "34020000001310000001"
stream_type: "main_stream"
video_codec: "H265"
edge_node:
node_architecture: "ARM64_NPU"
target_device: "edge_box_v1"
inference_interval_ms: 200 # 识别告警间隔时间
algorithms:
- name: "passenger_flow_counter"
version: "v1.2.0"
config:
roi_zone: [[10, 50], [400, 50], [400, 500], [10, 500]] # 数据标注区域
detection_line: [[10, 250], [400, 250]] # 电子计数线
三、 二次开发深度赋能:全套源码交付与低代码 API
对于追求自主可控的系统集成商而言,传统的 SaaS 软件不仅无法满足个性化定制需求,还存在随时被"卡脖子"的风险。本平台支持私有化部署与全套源代码交付,纯自研代码结构清晰,提供自带的 LOGO 替换和贴牌(改名)功能。
3.1 极简 API 调用:三步获取实时 AI 告警流
平台将底层的流媒体解包、NPU 算力分配、模型推理等复杂逻辑全部封装为高内聚的 RESTful API 或 Webhook。开发者仅需简单的 API 调用即可获取结构化的告警数据。
场景示例:订阅人流量统计实时数据
当边缘侧 NPU 盒子计算出最新的区域人流趋势时,会向业务层主动推送如下结构化 JSON 数据。
其核心业务指标满足以下守恒公式:
Remaining = Entering - Leaving
JSON
// POST /api/v1/callback/passenger_flow
{
"event_id": "evt_20260530_0001",
"timestamp": "2026-05-30T10:15:30Z",
"camera_code": "cam_gate_01",
"algorithm_type": "PEOPLE_COUNTING",
"metrics": {
"entering_count": 142, // 累计进入人数
"leaving_count": 98, // 累计离开人数
"remaining_count": 44 // 区域内剩余人数
},
"artifacts": {
"snapshot_url": "/shares/images/20260530/alert_frame.jpg",
"has_video_clip": true
}
}
通过这种高密度的能力封装,企业无需组建庞大的音视频与算法专家团队,即可快速构建属于自己的 AI 业务系统,这正是减少企业级应用约 95% 开发成本的核心所在。
四、 核心功能全景闭环
不仅仅是一个视频播放器,该平台打通了 AI 视频落地的全生命周期:
-
AI 算法商城:提供丰富的自研算法模型,支持手动新增算法及模型文件,同一算法支持一键版本升级或降级。
-
一体化标注平台:内置数据标注功能,用户可根据自身特有场景自行标注、训练,并无缝导入平台。
-
全方位告警通知:打破信息孤岛,原生支持语音电话、飞书、企业微信、钉钉、第三方 Webhook,甚至能联动现场的网络音柱和户外 LED 显示屏。
-
精细化边缘管理:直观管理边缘盒子下的摄像机,动态控制运行算法、告警间隔,并支持算法程序的远程版本管理与日志审计。
五、 开源地址与演示环境体验
作为技术架构师,我一向认为"代码是最好的名片"。平台目前已将核心部分开源,并提供了全功能的线上演示环境,供各位同行进行严苛的技术评测。
5.1 演示环境信息
-
演示体验地址 :http://demo.yihecode.com:8080 (注:此地址为模拟技术体验地址)
-
管理端账号 :
admin -
默认密码 :
admin123
5.2 技术交流探讨
如果你正在负责智慧园区、工业全检、智慧工地、明厨亮灶等项目的架构设计,欢迎在评论区留言交流。
如果你们团队正面临私有化部署、高并发国标流媒体瓶颈、异构算力适配等底座开发难题,欢迎前往 Gitee 提交 Issue 或私信我,我们共同探讨如何用最轻量的微服务架构,撬动最稳健的安防生产力!