AWS WebRTC: 判断viewer端拉流是否稳定的算法

在使用sdk-c viewer端进行拉流的过程中,viewer端拉取的是视频帧和音频帧,不会在播放器中播放,所以要根据收到的流来判断拉流过程是否稳定流畅。

我这边采用的算法是:依据相邻帧之间的时间间隔是否落在期望值的 ±20% 范围内。

音频帧、视频帧的日志打印如下:

bash 复制代码
 07:19:26.263 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368
2025-06-12 07:19:26.283 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368
2025-06-12 07:19:26.298 VERBOSE sampleVideoFrameHandler(): Video Frame received. TrackId: 140092278368896, Size: 4458, Flags 3210729368
2025-06-12 07:19:26.303 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368
2025-06-12 07:19:26.323 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368
2025-06-12 07:19:26.338 VERBOSE sampleVideoFrameHandler(): Video Frame received. TrackId: 140092278368896, Size: 263, Flags 3210729368
2025-06-12 07:19:26.343 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368
2025-06-12 07:19:26.363 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368

假设期望帧间隔是 20ms,那接收的帧间隔必须在lower和upper之间:

  • lower = 16ms (-20%)
  • upper = 24ms (+20%)

之后遍历相邻的时间戳,计算差值即时间间隔:

  • 如果任何一个间隔超出 [16, 24]ms 范围,就返回 1(表示不稳定)
  • 如果所有间隔都在范围内,最后返回 0(表示稳定)

这里有一点需要注意,如果时间间隔大于最大值很好理解,肯定是卡顿了,那么小于最小值为什么也被认定为不稳定呢,时间差越短不是越流畅吗?这里解释一下:

比如视频帧率是 25fps,对应每帧间隔约 40ms。如果某几帧突然变成 20ms,就不是"按帧率稳定输出"的表现。帧率不稳,会导致:

  • 音视频不同步
  • 抖动(jitter)
  • 丢帧或重复帧等问题

流媒体播放是"节奏感"不是"越快越好"

一个稳定的视频流(比如 25fps)应该每 40ms 一帧。如果突然来一帧只间隔了 10ms,会导致播放器不知道该怎么同步音视频,甚至可能触发跳帧。过快或过慢,都是对稳定性的破坏。

时间间隔短,可能是网络包聚合延迟之后一次性发送多帧的情况。

举个例子

假设有个节拍器本来每 1 秒"哒"一下,现在突然 0.1 秒"哒哒哒"3 次,那么它可能出故障了!

代码实现

bash 复制代码
# 判断帧时间是否稳定(±20%)
is_stable() {
    local expected_ms=$1
    shift
    local -a times=("$@")
    local lower=$((expected_ms * 8 / 10))
    local upper=$((expected_ms * 12 / 10))

    for ((i = 1; i < ${#times[@]}; i++)); do
        local diff=$((times[i] - times[i-1]))
        if (( diff < lower || diff > upper )); then
            return 1
        fi
    done
    return 0
}

第一个参数 $1:是期望的帧间隔(单位是毫秒),比如:

  • 音频帧:20 毫秒
  • 视频帧:40 毫秒

后续参数:是一系列时间戳(以毫秒为单位),代表每帧的接收时间。这些时间戳是在分析viewer端日志的过程中,获取到的n帧视频帧时间戳和n帧音频帧时间戳。

后续参数跟这行代码相关:

bash 复制代码
local -a times=("$@")

这行代码是将函数传入的参数中除了第一个参数外的所有参数,作为一个数组存入 times 变量中。因为前面 shift 过一次了,所以 $@ 就是"剩余的所有时间戳列表"。

例如:

bash 复制代码
is_stable 20 1000 1020 980 1010

进入函数后:

$1 = 20(期望间隔)

shift 移除 $1 后

$@ 就变成了:1000 1020 980 1010

times=("$@") 等价于:times=(1000 1020 980 1010)

如果去掉 -a,也不会出错,但那样会变成普通字符串变量,只存第一个参数值:

bash 复制代码
local times=("$@")  # 结果是 times=1000

-a 是告诉 Bash:"我要定义一个数组变量"。

总结就是

部分 含义
local 声明这是一个函数内的局部变量,不影响外部环境
-a 表示这个变量是一个数组类型
times 数组变量的名字
=("$@") 把函数剩余的所有参数(即 $@)作为数组元素赋值给 times

前一篇:https://blog.csdn.net/zhang_jiamin/article/details/149053832?spm=1011.2415.3001.5331

相关推荐
AZ996ZA5 小时前
自学linux的第二十一天【DHCP 服务从入门到实战】
linux·运维·服务器·php
_OP_CHEN5 小时前
【Linux系统编程】(二十八)深入 ELF 文件原理:从目标文件到程序加载的完整揭秘
linux·操作系统·编译·c/c++·目标文件·elf文件
Web极客码6 小时前
WordPress博客关键词
服务器·wordpress·网站加速
Fleshy数模6 小时前
MySQL 表创建全攻略:Navicat 图形化与 Xshell 命令行双模式实践
linux·mysql
神梦流7 小时前
GE 引擎的非标准数据流处理:稀疏张量与自定义算子在图优化中的语义保持
linux·运维·服务器
.小墨迹7 小时前
apollo学习之借道超车的速度规划
linux·c++·学习·算法·ubuntu
Lsir10110_8 小时前
【Linux】中断 —— 操作系统的运行基石
linux·运维·嵌入式硬件
Sheffield8 小时前
command和shell模块到底区别在哪?
linux·云计算·ansible
历程里程碑8 小时前
Linux20 : IO
linux·c语言·开发语言·数据结构·c++·算法
郝学胜-神的一滴8 小时前
深入浅出:使用Linux系统函数构建高性能TCP服务器
linux·服务器·开发语言·网络·c++·tcp/ip·程序人生