揭秘!SpireCV如何实现低延时推流、视频保存!

引言

视频推流是指将实时的音视频数据通过网络传输到服务器或其他终端设备的过程。

在无人机上则是通过搭载摄像头或录像设备,通过无线网络将实时拍摄到的视频数据传输到地面站或其他终端设备,使操作人员能够实时监视无人机所处位置的环境,并在远程地点观看无人机飞行状态和所拍摄到的实时画面。

这在无人机遥感监测、应急救援、安防监控等领域具有非常重要应用价值。作为一个专为智能无人系统打造的边缘实时感知SDKSpireCV已实现并开源了这部分算法

图1 SpireCV视频推流功能演示

如何使用视频推流功能?

推流功能使用SpireCV的视频推流类sv::VideoStreamer把输出图像/叠加的识别结果推流到网络上,主要实现代码如下:

复制代码
// 实例化视频推流类sv::VideoStreamersv::VideoStreamer streamer;// 初始化 推流分辨率(640, 480),端口号8554,比特率2Mbstreamer.setup(cv::Size(640, 480), 8554, 2);while (1)  // 在循环中 推流 图像img{  // 将img推流到 地址:rtsp://ip:8554/live  streamer.stream(img);}

拉流功能使用SpireView软件实现,具体操作可参考阿木实验室官网SpireCV开发者套件的。

**注:**使用该功能之前需要提前部署好SpireCV的sdk。

视频推流实现原理

视频数据的原始体积是非常大的,以720P分辨率、60赫兹帧率的视频流为例,其一秒钟就将产生1.3GB以上的数据。如此体积的数据量无法直接在网络进行传输,需要借助于视频编解码技术。该技术可分为软件编解码、硬件编解码两种方式:

1)软件编解码:其优势在于灵活性、低成本和可定制性,能够适应不同的视频编码格式和算法,并且不需要额外的硬件设备,可以根据需求进行定制和扩展。然而,软件编解码的劣势是性能受限于CPU的计算能力和资源消耗较大。

2)硬件编解码:其利用专门的硬件芯片进行视频数据的压缩和解压缩,具有高效性、节能和兼容性等优势。通过专用硬件的加速处理,能够实现实时编解码和低延时推流,同时更加高效地利用硬件资源,降低能耗。此外,硬件编解码器通常支持各种常见的视频编码格式,可以与不同设备和平台兼容。

鉴于无人机对低延时推流、画面高质量的需求,SpireCV首先采用硬件编解码的方式实现图像流的编码,其次使用RTSP协议实现图像流在网络中的传输。

RTSP是 TCP/IP 协议体系中的一个应用层协议,该协议定义了一对多应用程序如何有效地通过 IP 网络传送多媒体数据。RTSP在体系结构上位于RTP和RTCP之上,它使用TCP或UDP完成数据传输。

视频保存

SpireCV同时也提供了视频保存的功能,同样使用硬件编码器实现,不额外占用机载计算机的CPU资源。保存实时视频到本地,同步保存检测、跟踪信息,视频(.avi)与信息(.svj)是分离的,具有如下优点:

1)离线回放时可以叠加实际检测、跟踪结果,方便定位问题。

2)保留了原始视频,方面持续补充数据集,不断改进检测、跟踪性能。

视频保存功能的具体实现与上述推流功能类似,详情请参考amovlab官网SpireCV开发者套件的wiki。

图2 SpireView播放本地保存的视频文件演示

相关推荐
勾股导航2 小时前
大模型Skill
人工智能·python·机器学习
卷福同学4 小时前
【养虾日记】Openclaw操作浏览器自动化发文
人工智能·后端·算法
春日见5 小时前
如何入门端到端自动驾驶?
linux·人工智能·算法·机器学习·自动驾驶
光锥智能5 小时前
从自动驾驶到 AI 能力体系,元戎启行 GTC 发布基座模型新进展
人工智能
luoganttcc5 小时前
自动驾驶 世界模型 有哪些
人工智能·机器学习·自动驾驶
潘高5 小时前
10分钟教你手撸一个小龙虾(OpenClaw)
人工智能
禁默5 小时前
光学与机器视觉:解锁“机器之眼”的核心密码-《第五届光学与机器视觉国际学术会议(ICOMV 2026)》
人工智能·计算机视觉·光学
深小乐5 小时前
不是DeepSeek V4!这两个神秘的 Hunter 模型竟然来自小米
人工智能
laozhao4325 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能
rainbow7242445 小时前
AI人才简历评估选型:技术面试、代码评审与项目复盘的综合运用方案
人工智能·面试·职场和发展