webrtc voice engine 介绍(新版webrtc)

webrtc_voice_engine模块,负责整个音频的生命周期,集成了音频采集、音频处理,传输和编解码等主要的功能。

按照流程主要为:

设备采集音频--->音频处理(增益,降噪,回音等)--->编码--->传输--->解码--->设备播放音频

一, webrtcvoiceengine 包含的核心模块

1.1, webrtc::AudioDeviceModule

主要负责设备的管理,负责系统所有麦克风和扬声器的API调用和处理;

硬件抽象: 封装了各个平台的音频驱动接口,如windows上的core audio、 linux上的ALSA或者pulseaudio等;

数据处理:从麦克风读取PCM语音数据,发生PCM语音数据到麦克风

设备管理:枚举和配置音频的输入/输出设备

状态控制:控制录音,播放的启动、停止、初始化等操作

1.2, AudioCodec

主要负责音频的编解码,该类主要存储音频编解码的核心参数:如编解码的格式("opus", "G722", "PCMU", "ISAC"等),采样率,比特率和音频通道数。 webrc把编解码拆分为2个对面模块处理,主要是为了调用方面和混乱。 如源码定义了一个recv_codecs 和send_codecs。 recv_codecs用于解码,send_codecs用于编码。

1.3,webrtc::AudioEncoderFactory

编码器工厂,一看就是工厂模式,主要负责统筹管理所有编码器的工厂,可以按需生成对应编码器的对象。

1.4,webrtc::AudioDecoderFactory

同编码器工厂,该类为解码器工厂

1.5,webrtc::AudioMixer

混音模块,用于把多路语音混音成一路, 这样可以节省带宽,利于语音的传输。 我当前版本的webtrtc混音模块,主要用于Libjingle, 没有对外。

1.6,webrtc::AudioProcessing

音频处理模块, 这里主要包括3A处理,以及其他相关处理,具体可以参考我的文章webrtc 的audio process介绍(新版本webrtc)-CSDN博客

1.7,webrtc::AudioState

多实例音频管理模块,用于解决资源冲突。 如果可能存在多个webrtc::call会话实例,但音频硬件设备和全局的音频处理算法(如回声消除,混音算法)都是单例或者需要共享滴, AudioState就是为了解决这些资源的冲突共享和状态同步问题而设计。

1.8,WebRtcVoiceMediaChannel

该模块是webrtc 音频子系统的会话控制器。该模块包含有webrtc::Transport网络传输模块,用于充当上层信令逻辑(DSP协商、RTP参数设置)与底层的webrtc::Call(音频流处理、编解码和网络发生)之间的桥梁。

具体可以参考 WebRtcVoiceMediaChannel模块介绍(新版本webrtc)-CSDN博客

附webrtcvoiceengine的成员函数

cpp 复制代码
 // The audio device module.
 rtc::scoped_refptr<webrtc::AudioDeviceModule> adm_;
 rtc::scoped_refptr<webrtc::AudioEncoderFactory> encoder_factory_;
 rtc::scoped_refptr<webrtc::AudioDecoderFactory> decoder_factory_;
 rtc::scoped_refptr<webrtc::AudioMixer> audio_mixer_;
 // The audio processing module.
 rtc::scoped_refptr<webrtc::AudioProcessing> apm_;
 // The primary instance of WebRtc VoiceEngine.
 rtc::scoped_refptr<webrtc::AudioState> audio_state_;
 std::vector<AudioCodec> send_codecs_;
 std::vector<AudioCodec> recv_codecs_;
 std::vector<WebRtcVoiceMediaChannel*> channels_;

二,函数调用

直接WebRtcVoiceEngine对象即可,具体如下

cpp 复制代码
  MediaEngineDependencies media_dependencies;
  media_dependencies.task_queue_factory = dependencies.task_queue_factory.get();
  media_dependencies.adm = std::move(default_adm);
  media_dependencies.audio_encoder_factory = std::move(audio_encoder_factory);
  media_dependencies.audio_decoder_factory = std::move(audio_decoder_factory);
  if (audio_processing) {
    media_dependencies.audio_processing = std::move(audio_processing);
  } else {
    media_dependencies.audio_processing = AudioProcessingBuilder().Create();
  }
  media_dependencies.audio_mixer = std::move(audio_mixer);

auto audio_engine = std::make_unique<WebRtcVoiceEngine>(
    dependencies.task_queue_factory, std::move(dependencies.adm),
    std::move(dependencies.audio_encoder_factory),
    std::move(dependencies.audio_decoder_factory),
    std::move(dependencies.audio_mixer),
    std::move(dependencies.audio_processing));
相关推荐
searchforAI4 小时前
2026年AI笔记工具对比实测:NotebookLM、通义听悟、Ai好记怎么选?
人工智能·笔记·gpt·ai·whisper·音视频·语音识别
音视频牛哥6 小时前
基于 SmartMediaKit 的座舱远程遥控系统技术方案——面向多摄像头、多角度、低延迟传输控制与内网/5G广域网融合场景
音视频·低延迟rtsp播放器·低延迟视频传输·座舱远程遥控·5g远程控制·远程驾驶系统·低延迟rtmp播放
Fisher3Star7 小时前
mediasoup关键帧请求流程解析
webrtc
EasyGBS8 小时前
从“后厨黑箱”到“透明厨房”:国标GB28181视频平台EasyGBS平台AI视频分析如何守护舌尖上的安全
人工智能·安全·音视频
昨日之日20068 小时前
LongCat-Video-Avatar-1.5 - 一句话生成口型同步、动作稳定的数字人 说话/唱歌 视频 一键整合包下载
音视频
searchforAI9 小时前
长视频和播客怎么变成结构化读书笔记?一套 AI 时代的知识管理方法
人工智能·笔记·gpt·音视频·语音识别
不想吃饭e9 小时前
uniapp-图片,视频上传组件封装
java·uni-app·音视频
换个昵称都难10 小时前
WebRtcVideoEngine模块介绍(新版webrtc)
webrtc
做萤石二次开发的哈哈10 小时前
具备 ERTC 能力的萤石设备如何对接客户端通话?
音视频·实时音视频·萤石开放平台