AI视觉领域流媒体知识入门介绍(一)

流媒体常见传输协议

RTSP(Real-Time Streaming Protocol)

是一种网络流媒体传输协议,可用于从网络摄像头等设备中获取实时视频流。许多网络摄像头和视频服务器都支持RTSP协议。

HLS(HTTP Live Streaming)

是一种基于HTTP的流媒体传输协议,主要用于在互联网上直播和点播视频流。

HLS使用分段技术,将视频流分成多个小段,并通过HTTP协议分发到客户端。

HLS是基于文件的,而要把流写入文件一定是以I帧为单位,因此HLS延迟可能高达2GOP,等到第一个I帧然后再将接下来的一个GOP写入文件。

WebRTC(Web Real-Time Communication)

是一种开放源代码的实时通信协议,可用于在浏览器之间进行点对点视频通话和数据传输。WebRTC支持UDP和TCP传输协议,并具有低延迟和高可靠性。

WebSocket

在浏览器直播摄像头实时流时,可通过ws传输flv格式的视频数据。

FLV:Flash Video

是一种网络视频格式,内容体积小,视频质量高。

流媒体常见处理框架

OpenCV

是一个开源的计算机视觉库,可用于处理图像和视频。它支持多种编程语言,包括C++、Python和Java等。

FFmpeg

是一个开源的多媒体框架,可用于处理音频、视频和流媒体。它支持多种编解码器和容器格式,并具有高度可定制的特性。

GStreamer

是一个基于Linux的多媒体框架,可用于处理音频和视频。它支持多种编解码器和容器格式,并具有高度可定制的插件体系结构。

mediapipe

Google开源的,对AI和ML友好的流媒体处理框架。

可以直接使用其提供的Solution,在自己的AI视觉解决方案中;

也可以使用其提供的Framework,开发自己的流媒体应用。

GitHub - google/mediapipe: Cross-platform, customizable ML solutions for live and streaming media.

Monibuca

开源Go语言流媒体服务器开发框架

Monibuca - GO语言开源插件式流媒体服务器开发框架 | Monibuca

相关推荐
stark张宇6 分钟前
构建第一个AI聊天机器人:Flask+DeepSeek+Postgres实战
人工智能·postgresql·flask
yiyu07161 小时前
3分钟搞懂深度学习AI:自我进化的最简五步法
人工智能·深度学习
浪浪山_大橙子3 小时前
OpenClaw 十分钟快速,安装与接入完全指南 - 推荐使用trae 官方 skills 安装
前端·人工智能
火山引擎开发者社区3 小时前
OpenClaw 快速上手:把云手机变成你的 7×24 小时 AI 手机助手
人工智能
Qlly3 小时前
DDD 架构为什么适合 MCP Server 开发?
人工智能·后端·架构
Lee川4 小时前
从零构建智能对话系统:AI Agent 实战指南
人工智能
冬奇Lab4 小时前
一天一个开源项目(第43篇):Star-Office-UI - 像素风格的 AI 办公室看板,让 AI 助手的工作状态可视化
人工智能·开源·资讯
风象南4 小时前
纯文本模型竟然也能直接“画图”,而且还很好用
前端·人工智能·后端
IT_陈寒5 小时前
Vite vs Webpack:5个让你的开发效率翻倍的实战对比
前端·人工智能·后端
摆烂工程师6 小时前
GPT-5.4 发布!再看 OpenClaw:AI 真正危险的,不是更会聊天,而是开始自己“干活”
人工智能·openai·ai编程