RTC会议实时翻译系统

大家好,这次我们将使用RTC pilot的视频会议解决方案,做一个视频会议实时翻译系统。

RTC Pilot是一个基于C++17开发的WebRTC SFU开源,支持跨平台,支持windows,linux,macos,二次开发效率高;并且是开源中唯一全面支持WebRTC级联的开源服务。

先给大家演示一下,视频会议中英语翻译的效果。

RTC会议实时翻译系统

详细内容观看:音视频小话视频号

RTC pilot提供完整SFU集群的方案,在这个集群方案的支持下,我们很容易架构出一个实时翻译系统。

架构图如上,共有几个角色:

1.Pilot center:会议系统调度中心,接收多个SFU的注册,转发房间和用户信息,转发RTP流信息

2.RTC Pilot SFU: 这是我们的RTC Pilot开源SFU,用于接入客户端,接入客户信令并转发媒体数据,前几期有详细的配置和使用讲解;

3.客户端A,是webrtc客户端。

4.RTC Pilot MCU:这个是新的RTC pilot服务,做后台媒体数据的特殊处理:这里主要做音频转文字,并且英文转中文的操作;

WebRTC的MCU业务比较复杂,准确来说这是一个标准的后台服务,一般不直接接入用户,它是一个CPU密集型的服务,而不是网络密集型的服务。

MCU主要有几个功能:

1.传输业务:转发,转封装,支持: WebRTC, RTMP, SRT等。支持丰富的网络接入,和丰富的网络输出;

2.音视频处理:输入MCU的系统的音视频流,支持各种处理:音视频转码,视频合成,音频重采样,音频合成等。

3.与AI结合的各种处理:ASR,语音转文字,TTS,文字转语音,支持接入大模型,支持接入虚拟人等

基于MCU服务的特点,因为涉及的模块较多,属于高度业务化,高度定制化的服务,并不像SFU那样标准化的更多。

现在有名的开源是OWT server,是比较典型的例子。

RTC Pilot MCU是否开源,后面还在思考中。

关注音视频小话,带来更多音视频技术。

相关推荐
进击切图仔10 小时前
RTC(Real-time chunking)与 Temporal Ensemble
人工智能·实时音视频
音视频牛哥1 天前
大牛直播SDK(SmartMediaKit)Windows平台RTSP/RTMP直播播放SDK集成说明(C++版)
windows·音视频·实时音视频·windows rtsp播放器·windows rtmp播放器·超低延迟rtsp播放器·超低延迟rtmp播放器
REDcker2 天前
RGB与YUV像素格式详解
音视频·实时音视频·视频编解码·yuv·rgb
天上路人2 天前
A-59F所有应用模式说明
人工智能·硬件架构·音视频·语音识别·实时音视频
Highcharts.js2 天前
数学函数双曲线音频图表(y=1/x 双曲线)|图表代码示例
前端·react.js·实时音视频·highcharts·音频图表·双曲线图表
音视频牛哥3 天前
SmartMediaKit 面向企业级场景的低延迟实时音视频解决方案
华为·实时音视频·harmonyos·rtsp服务器·超低延迟rtsp播放器·超低延迟rtmp播放器·实时音视频sdk
DogDaoDao3 天前
视频直播技术全栈深入解析:从入门到精通
人工智能·音视频·实时音视频·视频编解码·视频直播
Soari3 天前
挑战 100ms 延迟极限:深度拆解 dograh,构建企业级开源 WebRTC 实时语音智能体平台
开源·大模型·webrtc·实时音视频·voiceagent·语音智能体·dograh
DogDaoDao4 天前
Android MediaCodec 全面详解:从入门到精通
android·音视频·实时音视频·视频编解码·短视频·视频直播·mediacodec
喵了几个咪5 天前
Kratos WebRTC 传输中间件:H5游戏P2P实时音视频与数据通信实战
游戏·微服务·中间件·golang·webrtc·实时音视频·kratos