AI视觉领域流媒体知识入门介绍(一)

流媒体常见传输协议

RTSP(Real-Time Streaming Protocol)

是一种网络流媒体传输协议,可用于从网络摄像头等设备中获取实时视频流。许多网络摄像头和视频服务器都支持RTSP协议。

HLS(HTTP Live Streaming)

是一种基于HTTP的流媒体传输协议,主要用于在互联网上直播和点播视频流。

HLS使用分段技术,将视频流分成多个小段,并通过HTTP协议分发到客户端。

HLS是基于文件的,而要把流写入文件一定是以I帧为单位,因此HLS延迟可能高达2GOP,等到第一个I帧然后再将接下来的一个GOP写入文件。

WebRTC(Web Real-Time Communication)

是一种开放源代码的实时通信协议,可用于在浏览器之间进行点对点视频通话和数据传输。WebRTC支持UDP和TCP传输协议,并具有低延迟和高可靠性。

WebSocket

在浏览器直播摄像头实时流时,可通过ws传输flv格式的视频数据。

FLV:Flash Video

是一种网络视频格式,内容体积小,视频质量高。

流媒体常见处理框架

OpenCV

是一个开源的计算机视觉库,可用于处理图像和视频。它支持多种编程语言,包括C++、Python和Java等。

FFmpeg

是一个开源的多媒体框架,可用于处理音频、视频和流媒体。它支持多种编解码器和容器格式,并具有高度可定制的特性。

GStreamer

是一个基于Linux的多媒体框架,可用于处理音频和视频。它支持多种编解码器和容器格式,并具有高度可定制的插件体系结构。

mediapipe

Google开源的,对AI和ML友好的流媒体处理框架。

可以直接使用其提供的Solution,在自己的AI视觉解决方案中;

也可以使用其提供的Framework,开发自己的流媒体应用。

GitHub - google/mediapipe: Cross-platform, customizable ML solutions for live and streaming media.

Monibuca

开源Go语言流媒体服务器开发框架

Monibuca - GO语言开源插件式流媒体服务器开发框架 | Monibuca

相关推荐
冬奇Lab4 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab4 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan6 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi8 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒8 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒10 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户16931761726610 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟10 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781411 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩11 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent