1.概述
SRS (Simple Realtime Server) 中提供的各种性能优化选项。这些选项允许您针对不同场景优化 SRS,从而在延迟、吞吐量和资源利用率之间取得平衡。有关常规配置的信息,请参阅配置。
1.1 性能提升目标
流媒体服务器的性能通常通过以下方式衡量:
- 吞吐量:可以处理的并发连接数
- 延迟:录制和播放之间的延迟
- 带宽效率:系统对可用网络资源的利用程度
- 资源使用情况:CPU、内存和 I/O 要求

如上图所示,SRS 提供了几类性能优化,可以对其进行配置以匹配您的特定使用。
2. 网络 I/O 优化
2.1 合并读取 (MR)
合并读取通过减少系统调用来提高读取性能。SRS 不是单独读取少量数据,而是等待积累更多数据,然后再分批处理数据。
play {
# 启用/禁用
mr on;
# 睡眠持续时间,以毫秒为单位
mr_latency 350;
}

2.2 合并写入 (MW)和TCP_NODELAY
Merged Write 通过批处理传出消息来提高发送性能。SRS 不是单独编写每条消息,而是累积消息并一起发送。
在 SRS 中默认启用TCP_NODELAY。禁用 Nagle 算法,该算法缓冲小数据包,减少延迟,但代价可能是更多的数据包,有利于实时应用程序。
vhost your_vhost {
play {
# 缓冲时间由 (以毫秒为单位)
# Default: 350
mw_latency 350;
}
}
vhost __defaultVhost__ {
tcp_nodelay off;
}

3. 内存优化
3.1 RTMP 内存块
RTMP 块大小决定了如何拆分 RTMP 消息以进行传输。较大的块大小通过减少标头开销来提高效率。
#减少协议开销
#将吞吐量提高约 10%
#默认值 60000 适用于大多数客户端
#允许的最大值为 65536
chunk_size 60000;

3.2 块流缓存
src/core/srs_core_performance.hpp125-130 非配置文件优化,SRS 可以缓存 Chunk 流,以提高处理 RTMP 消息时的性能。
- 对于小块大小,性能提高了大约 10%
- 对于较大的数据块大小,性能提高了大约 5%
- 减少内存分配/释放开销
4. 延迟设置
SRS 提供最小延迟模式,该模式优先考虑减少延迟,而不是其他性能方面。
启用后的效果:
禁用虚拟主机的合并读取 (MR)
对使用者队列中的条件变量等待使用超时 trunk/conf/full.conf 中1168-1179
优先考虑立即交付而不是批处理
vhost your_vhost {
# Whether enable the minimal latency mode.
# Default: off
min_latency on;
}

4.1 GOP 缓存
GOP(图片组)缓存存储最近的视频数据,以便为新观看者提供快速启动和更流畅的播放。
优势:
-
为新查看者提供即时播放
-
查看者无需等待关键帧
-
平滑播放开始体验
-
可以禁用以减少内存使用量或实现绝对最小延迟
vhost your_vhost {
play {
# Whether to enable the GOP cache.
# Default: on
gop_cache on;# The max GOP cache size in frames # Default: 256 gop_cache_max_frames 256; }
}
4.2 播放队列
播放队列设置客户端的最大缓冲时间。效果:
-
限制每个客户端可以缓冲的最大数据数
-
防止速度较慢的客户端积累过多数据
-
还可以防止内存耗尽
vhost your_vhost {
play {
# The queue length in seconds for player.
# Default: 30
queue_length 30;
}
}
5. 系统级选项
5.1 最大连接数
控制服务器将接受的最大连接数。可能需要使用命令增加系统限制ulimit -HSn
# the max connections.
# if exceed the max connections, server will drop the new connection.
# default: 1000
max_connections 1000;
5.2 Pithy Print
控制打印日志消息的频率。降低日志频率可以提高繁忙系统的性能。
# config for the pithy print in ms,
# which always print constant message specified by interval,
# whatever the clients in concurrency.
# default: 10000
pithy_print_ms 10000;
6.高级性能调优
SRS 支持各种 TCP 套接字选项,这些选项可以针对特定环境进行调整:
选择 | Default | 描述 |
---|---|---|
TCP_NODELAY | 启用 | 禁用 Nagle 算法 |
SO_SNDBUF | 自动计算 | 套接字发送缓冲区大小 |
SO_RCVBUF | 默认情况下未设置 | 套接字接收缓冲区大小 |
SO_REUSEADDR | 启用 | 允许重复使用本地地址 |
7. 示例配置
7.1 低延迟场景
vhost low_latency {
min_latency on;
play {
gop_cache off;
queue_length 5;
mr off;
mw_latency 100;
}
}
7.2 高吞吐量场景
vhost high_throughput {
play {
gop_cache on;
queue_length 60;
mr on;
mr_latency 700;
mw_latency 500;
}
}
7.3 平衡配置
vhost balanced {
play {
gop_cache on;
queue_length 30;
mr on;
mr_latency 350;
mw_latency 350;
}
}
结论
优化 SRS 性能关键注意事项:
- 延迟与吞吐量:较低的延迟通常是以吞吐量降低为代价的,反之亦然
- 资源使用:更积极的缓存可以提高性能,但需要更多的内存
- 客户端兼容性:某些优化可能不适用于所有客户端
从默认配置开始,该配置在大多数情况下都能提供良好的平衡,然后根据您的特定要求和监控数据进行调整。