VLC库多实例控制音频非独立的问题

项目场景

在 Windows 下,有一个封装了VLC库接口的类,可拉取 RTSP 流播放,该类的部分代码如下:

cpp 复制代码
// 封装的VLC类
class LibVlcPlayerBase {
   protected:
    virtual int initialize() {
        const char *const argv[] = {
            "--log-verbose=3",
            "--no-plugins-cache",
            "--rtsp-tcp",
        };
        m_pInstance = libvlc_new(sizeof(argv) / sizeof(argv[0]), argv);
        m_pMedia = libvlc_media_new_location(m_pInstance, m_rtspUrl.c_str());
        m_pMediaPlayer = libvlc_media_player_new_from_media(m_pMedia);
    }

    int OpenSound() {
        return libvlc_audio_set_volume(m_pMediaPlayer, 100);
    }

    int CloseSound() {
        return libvlc_audio_set_volume(m_pMediaPlayer, 0);
    }

   protected:
    libvlc_instance_t* m_pInstance = nullptr;
    libvlc_media_player_t* m_pMediaPlayer = nullptr;
    libvlc_media_t* m_pMedia = nullptr;
};

问题描述

如果有两个 LibVlcPlayerBase 实例:

cpp 复制代码
std::shared_ptr<LibVlcPlayerBase> pClient1;
std::shared_ptr<LibVlcPlayerBase> pClient2;

两个实例对象分别初始化完成并通过 rtsp 播放视频流。发现音频的控制并不是独立的,pClient1 调用OpenSound 设置音量为100,发现 pClient2 的音频会被同时设置为100。打开 Windows 音量合成器,发现只有一个"VLC media player(LibVLC 3.0.21)":

这样导致两个实例的音频无法独立控制。


原因分析

在 Windows 下使用 VLC 库时,多个实例共享同一音频会话的问题通常是由于默认音频输出模块未正确隔离实例导致的。


解决方案

修改代码,强制使用 DirectSound 音频模块:

cpp 复制代码
virtual int initialize() {
    const char *const argv[] = {
        "--log-verbose=3",
        "--no-plugins-cache",
        "--rtsp-tcp",
#ifdef _WIN32
        "--aout=directsound",  // 指定音频输出模块为directsound,使每个VLC实例的音频可单独控制
#endif // _WIN32
    };
    m_pInstance = libvlc_new(sizeof(argv) / sizeof(argv[0]), argv);
    m_pMedia = libvlc_media_new_location(m_pInstance, m_rtspUrl.c_str());
    m_pMediaPlayer = libvlc_media_player_new_from_media(m_pMedia);
}

这样一来,打开 Windows 音量合成器,发现原先 "VLC media player(LibVLC 3.0.21)" 已变成了应用程序名:

虽然看起来仍然不是独立的两个条目出来,但是已经能实现两个实例的音频单独控制了。

总结

在 Windows 系统下,是否指定使用 ‌DirectSound‌ 音频模块会导致不同的行为表现,主要与 ‌Windows 音频架构‌和 ‌VLC 的默认行为‌相关。不指定音频模块‌,VLC 会根据系统环境和自身编译配置‌自动选择音频输出模块‌。在较新的 Windows 系统(如 Win10/11)中,默认可能选择 ‌WASAPI‌(Windows Audio Session API),因为它支持更现代的音频架构。

当使用 WASAPI 时,所有通过同一进程创建的 VLC 实例(如 libvlc_instance_t)可能被系统视为‌同一个音频客户端‌,导致在 Windows 音量合成器中仅显示一个条目(如 "VLC media player"),多个实例的音量控制被合并,无法独立调节。

性能与兼容性差异:

特性 WASAPI DirectSound‌
延迟‌ 更低(支持独占模式) 较高(强制共享模式)
音质‌ 支持无损音频(如 24-bit/192kHz) 可能受系统混音器重采样影响
多实例隔离 需额外配置(如不同进程) 可通过虚拟设备名隔离
‌系统兼容性‌ Win Vista+ Win XP+
相关推荐
REDcker11 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo199811 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君11 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥11 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_4162764211 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk11 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS11 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_4162764211 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_45828386811 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川11 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频