WebRTC 服务器之SRS服务器性能优化配置

1.概述

SRS (Simple Realtime Server) 中提供的各种性能优化选项。这些选项允许您针对不同场景优化 SRS,从而在延迟、吞吐量和资源利用率之间取得平衡。有关常规配置的信息,请参阅配置

1.1 性能提升目标

流媒体服务器的性能通常通过以下方式衡量:

  • 吞吐量:可以处理的并发连接数
  • 延迟:录制和播放之间的延迟
  • 带宽效率:系统对可用网络资源的利用程度
  • 资源使用情况:CPU、内存和 I/O 要求

如上图所示,SRS 提供了几类性能优化,可以对其进行配置以匹配您的特定使用。

2. 网络 I/O 优化

2.1 合并读取 (MR)

合并读取通过减少系统调用来提高读取性能。SRS 不是单独读取少量数据,而是等待积累更多数据,然后再分批处理数据。

复制代码
 play {
        # 启用/禁用
        mr on;
        
        # 睡眠持续时间,以毫秒为单位
        mr_latency 350;
    }

2.2 合并写入 (MW)和TCP_NODELAY

Merged Write 通过批处理传出消息来提高发送性能。SRS 不是单独编写每条消息,而是累积消息并一起发送。

在 SRS 中默认启用TCP_NODELAY。禁用 Nagle 算法,该算法缓冲小数据包,减少延迟,但代价可能是更多的数据包,有利于实时应用程序。

复制代码
vhost your_vhost {
    play {
        # 缓冲时间由 (以毫秒为单位)
        # Default: 350
        mw_latency 350;
    }
}
vhost __defaultVhost__ {
    tcp_nodelay     off;
}

3. 内存优化

3.1 RTMP 内存块

RTMP 块大小决定了如何拆分 RTMP 消息以进行传输。较大的块大小通过减少标头开销来提高效率。

复制代码
#减少协议开销
#将吞吐量提高约 10%
#默认值 60000 适用于大多数客户端
#允许的最大值为 65536
chunk_size 60000;

3.2 块流缓存

src/core/srs_core_performance.hpp125-130 非配置文件优化,SRS 可以缓存 Chunk 流,以提高处理 RTMP 消息时的性能。

  • 对于小块大小,性能提高了大约 10%
  • 对于较大的数据块大小,性能提高了大约 5%
  • 减少内存分配/释放开销

4. 延迟设置

SRS 提供最小延迟模式,该模式优先考虑减少延迟,而不是其他性能方面。

启用后的效果:

禁用虚拟主机的合并读取 (MR)

对使用者队列中的条件变量等待使用超时 trunk/conf/full.conf 中1168-1179

优先考虑立即交付而不是批处理

复制代码
vhost your_vhost {
    # Whether enable the minimal latency mode.
    # Default: off
    min_latency on;
}

4.1 GOP 缓存

GOP(图片组)缓存存储最近的视频数据,以便为新观看者提供快速启动和更流畅的播放。

优势

  • 为新查看者提供即时播放

  • 查看者无需等待关键帧

  • 平滑播放开始体验

  • 可以禁用以减少内存使用量或实现绝对最小延迟

    vhost your_vhost {
    play {
    # Whether to enable the GOP cache.
    # Default: on
    gop_cache on;

    复制代码
          # The max GOP cache size in frames
          # Default: 256
          gop_cache_max_frames 256;
      }

    }

4.2 播放队列

播放队列设置客户端的最大缓冲时间。效果

  • 限制每个客户端可以缓冲的最大数据数

  • 防止速度较慢的客户端积累过多数据

  • 还可以防止内存耗尽

    vhost your_vhost {
    play {
    # The queue length in seconds for player.
    # Default: 30
    queue_length 30;
    }
    }

5. 系统级选项

5.1 最大连接数

控制服务器将接受的最大连接数。可能需要使用命令增加系统限制ulimit -HSn

复制代码
# the max connections.
# if exceed the max connections, server will drop the new connection.
# default: 1000
max_connections 1000;

5.2 Pithy Print

控制打印日志消息的频率。降低日志频率可以提高繁忙系统的性能。

复制代码
# config for the pithy print in ms,
# which always print constant message specified by interval,
# whatever the clients in concurrency.
# default: 10000
pithy_print_ms 10000;

6.高级性能调优

SRS 支持各种 TCP 套接字选项,这些选项可以针对特定环境进行调整:

选择 Default 描述
TCP_NODELAY 启用 禁用 Nagle 算法
SO_SNDBUF 自动计算 套接字发送缓冲区大小
SO_RCVBUF 默认情况下未设置 套接字接收缓冲区大小
SO_REUSEADDR 启用 允许重复使用本地地址

7. 示例配置

7.1 低延迟场景

复制代码
vhost low_latency {
    min_latency on;
    
    play {
        gop_cache off;
        queue_length 5;
        mr off;
        mw_latency 100;
    }
}

7.2 高吞吐量场景

复制代码
vhost high_throughput {
    play {
        gop_cache on;
        queue_length 60;
        mr on;
        mr_latency 700;
        mw_latency 500;
    }
}

7.3 平衡配置

复制代码
vhost balanced {
    play {
        gop_cache on;
        queue_length 30;
        mr on;
        mr_latency 350;
        mw_latency 350;
    }
}

结论

优化 SRS 性能关键注意事项:

  1. 延迟与吞吐量:较低的延迟通常是以吞吐量降低为代价的,反之亦然
  2. 资源使用:更积极的缓存可以提高性能,但需要更多的内存
  3. 客户端兼容性:某些优化可能不适用于所有客户端

从默认配置开始,该配置在大多数情况下都能提供良好的平衡,然后根据您的特定要求和监控数据进行调整。

相关推荐
开开心心就好9 分钟前
高效报价软件,简化商铺定价流程
服务器·数据库·安全·面试·职场和发展·电脑·symfony
生活爱好者!10 分钟前
NAS 部署白板工具,实现思维导图/画板/流程图自由
运维·docker·容器
段帅龙呀6 小时前
Redis构建缓存服务器
服务器·redis·缓存
乌鸦不像写字台6 小时前
【docker部署】在服务器上使用docker
服务器·docker·容器
~央千澈~7 小时前
优雅草蜻蜓R实时音视频会议系统云原生私有化部署方案深度解析-优雅草卓伊凡|贝贝|clam|麻子|夜辰
webrtc·实时音视频
互联网搬砖老肖8 小时前
运维打铁: MongoDB 数据库集群搭建与管理
运维·数据库·mongodb
Antonio9158 小时前
【音视频】HLS简介与服务器搭建
运维·服务器·音视频
kfepiza9 小时前
Debian的`/etc/network/interfaces`的`allow-hotplug`和`auto`对比讲解 笔记250704
linux·服务器·网络·笔记·debian
无妄-20249 小时前
软件架构升级中的“隐形地雷”:版本选型与依赖链风险
java·服务器·网络·经验分享
艾伦_耶格宇9 小时前
【docker】-1 docker简介
运维·docker·容器