互联网上的音频和视频服务

1 互联网上的音频和视频服务概述

·许多用户开始利用互联网传送音频/视频信息。

·在许多情况下,这种音频/视频常称为多媒体信息。

·多媒体信息:内容上相互关联的文本、图形、图像、声音、动画和活动图像等所形成的复合数据信息。

多媒体信息的两个最主要特点

1.信息量很大。

·标准语音:64 kbit/s ( PCM,8 kHz 速率采样,8 位编码);

·高质量立体声音乐 CD:1.4 Mbit/s(PCM,44.1 kHz 速率采样,16 位编码);

·数码照片 (1280 × 960):3.52 MB(24 位编码);

·彩色电视:250 Mbit/s。

2.在传输多媒体数据时,对时延和时延抖动均有较高的要求。 边传输边播放。

·边传输边播放。

互联网是非等时的

·模拟的多媒体信号经过采样和模数转换变为数字信号,再组装成分组。这些分组的发送时间间隔是恒定的(等时的)。

·传统互联网中,每个分组被独立传送,到达接收端时就变成为非等时的。

实现等时:在接收端设置缓存

·接收端设置适当大小的缓存。当缓存中的分组数达到一定的数量后,再以恒定速率按顺序把分组读出进行还原播放。

·缓存实际上就是一个先进先出的队列。

缓存:消除了时延的抖动,但增加了时延

需要注意的问题

·在传送时延敏感 (delay sensitive) 的实时数据时,不仅传输时延不能太大,而且时延抖动也必须受到限制。

·传送实时数据时,少量分组的丢失对播放效果的影响并不大(因为是由人主观评价的),是可以容忍的。

·丢失容忍 (loss tolerant) 是实时数据的另一个重要特点。

·发送多媒体分组时应当给每一个分组加上序号,以按序还原和播放分组。

·增加一个时间戳 (timestamp),告诉接收端分组的产生时间。

有了序号和时间戳,再采用适当的算法,接收端就知道应在什么时间开始播放缓存中的分组,既可减少分组的丢失率,也可使播放的延迟在可容忍的范围之内。

必须改造现有的互联网

·大量使用光缆和高速路由器,网络的时延和时延抖动就可以足够小,在互联网上传送实时数据就不会有问题。

·从根本改变互联网的协议栈,把互联网改造为能够对端到端的带宽实现预留 (reservation),把无连接协议的互联网转变为面向连接的网络。

·部分改动互联网的协议栈,付出的代价较小,也能够使多媒体信息在互联网上的传输质量得到改进。

互联网提供的音频/视频服务类型

大体上可分为三种类型:

1.流式 (streaming) 存储音频/视频 ------边下载边播放。 播放时并没有把"下载"的内容存储在硬盘上。 结束后,在用户的硬盘上没有留下有关播放内容的任何痕迹。

2.流式实况音频/视频 ------边录制边发送,连续播放。

3.交互式音频/视频 ------实时交互式通信。

相关推荐
REDcker6 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19986 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君7 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥7 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276427 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk7 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS7 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276427 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838687 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川7 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频