RTC会议实时翻译系统

大家好,这次我们将使用RTC pilot的视频会议解决方案,做一个视频会议实时翻译系统。

RTC Pilot是一个基于C++17开发的WebRTC SFU开源,支持跨平台,支持windows,linux,macos,二次开发效率高;并且是开源中唯一全面支持WebRTC级联的开源服务。

先给大家演示一下,视频会议中英语翻译的效果。

RTC会议实时翻译系统

详细内容观看:音视频小话视频号

RTC pilot提供完整SFU集群的方案,在这个集群方案的支持下,我们很容易架构出一个实时翻译系统。

架构图如上,共有几个角色:

1.Pilot center:会议系统调度中心,接收多个SFU的注册,转发房间和用户信息,转发RTP流信息

2.RTC Pilot SFU: 这是我们的RTC Pilot开源SFU,用于接入客户端,接入客户信令并转发媒体数据,前几期有详细的配置和使用讲解;

3.客户端A,是webrtc客户端。

4.RTC Pilot MCU:这个是新的RTC pilot服务,做后台媒体数据的特殊处理:这里主要做音频转文字,并且英文转中文的操作;

WebRTC的MCU业务比较复杂,准确来说这是一个标准的后台服务,一般不直接接入用户,它是一个CPU密集型的服务,而不是网络密集型的服务。

MCU主要有几个功能:

1.传输业务:转发,转封装,支持: WebRTC, RTMP, SRT等。支持丰富的网络接入,和丰富的网络输出;

2.音视频处理:输入MCU的系统的音视频流,支持各种处理:音视频转码,视频合成,音频重采样,音频合成等。

3.与AI结合的各种处理:ASR,语音转文字,TTS,文字转语音,支持接入大模型,支持接入虚拟人等

基于MCU服务的特点,因为涉及的模块较多,属于高度业务化,高度定制化的服务,并不像SFU那样标准化的更多。

现在有名的开源是OWT server,是比较典型的例子。

RTC Pilot MCU是否开源,后面还在思考中。

关注音视频小话,带来更多音视频技术。

相关推荐
byte轻骑兵3 天前
【LE Audio】BASS精讲[3]: 从服务声明到行为逻辑 解锁广播音频接收核心
音视频·实时音视频·le audio·低功耗音频·蓝牙通话
危桥带雨5 天前
RTC理论知识
stm32·单片机·嵌入式硬件·实时音视频
rit84324995 天前
基于STM32的RTC(实时时钟)程序设计与实现
stm32·嵌入式硬件·实时音视频
nibabaoo9 天前
前端开发攻略---H5页面手机获取摄像头权限回显出画面并且同步到PC页面
javascript·websocket·实时音视频·实时同步·录制
拉拉尼亚12 天前
WebRTC 完全指南:原理、教程与应用场景
前端·typescript·实时音视频
王家视频教程图书馆15 天前
另外还有一个小问题,就是两个部手机进行测试的时候,进行外部 RTC 通话的时候。我使用 QQ 音乐播放背景音乐,但是背景音乐没有加上。有冲突
实时音视频
海水冷却18 天前
2026年实时音视频服务计费模式指南
实时音视频
番茄灭世神20 天前
PN学堂GD32教程第8篇——RTC
实时音视频
runner365.git21 天前
RTC实现VoiceAgent(二)
大模型·webrtc·实时音视频·voiceagent
xuxie9921 天前
N18 RTC
单片机·嵌入式硬件·实时音视频