概述
H.323是国际电信联盟(ITU)的一个标准协议栈,该协议栈是一个有机的整体,根据功能可以将其分为四类协议,也就是说该协议从系统的总体框架(H.323)、视频编解码(H.263)、音频编解码(H.723.1)、系统控制(H.245)、数据流的复用(H.225)等各方面作了比较详细的规定。
H.323是一种标准的音视频传输协议,能够实现远程提审功能。由一组协议构成,其中有负责音频与视频信号的编码、解码和包装,有负责呼叫信令收发和控制的信令,还有负责能力交换的信令。H.323的第4版本具备做电信级大网的特征,以它为标准构建的IP电话网能很容易地与传统PSTN电话网兼容,从这点上看,H.323更适合于构建电话到电话的电信级大网。
H.323协议族规定了在主要包括IP网络在内的基于分组交换的网络上提供多媒体通信的部件、协议和规程。H.323一共定义了四种部件:终端,网关,网守和多点控制单元。利用它们,H.323可以支持音频、视频和数据的点到点或点到多点的通信。
H.323协议族包括:用于建立呼叫的H.225.0、用于控制的H.245、用于大型会议的H.332 以及用于补充业务的H.450.X等。H.323
协议中包含3条信令控制信道:RAS信令信道、呼叫信令信道和H.245 控制信道。3 条信道的协调工作使得H.323的呼叫得以进行。
体系结构
为了能在不保证QoS的分组交换网络上展开多媒体会议,制定了该协议,该系列标准使得在现有通信网络上进行视频会议成为可能,为LAN、WAN、Internet、因特网上的多媒体通信应用提供了技术基础和保障。现有的分组网络PBN(如IP网络)提供多媒体通信标准。
从整体上来说,H.323是一个框架性建设,它涉及到终端设备、视频、音频和数据传输、通信控制、网络接口方面的内容,还包括了组成多点会议的多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)、网关以及关守等设备。
它的基本组成单元是"域",在H.323系统中,所谓域是指一个由关守管理的网关、多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)和所有终端组成的集合。一个域最少包含一个终端,而且必须有且只有一个关守。H.323系统中各个逻辑组成部份称为H.323的实体,其种类有:终端、网关、多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)。其中终端、网关、多点控制单元(MCU)是H.323中的终端设备,是网络中的逻辑单元。终端设备是可呼叫的和被呼叫的,而有些实体是不通被呼叫的,如关守。H.323包括了H.323终端与其它终端之间的、通过不同网络的、端到端的连接。
终端组成
终端是分组网络中能提供实时、双向通信的节点设备,也是一种终端用户设备,可以和网关、多点接入控制单元通信。所有终端都必须支持语音通信,视频和数据通信可选。
在发端,从输入设备获取的视频和音频信号,经编码器压缩后,按照一定格式打包,通过网络发送出去。在收端,来自网络的数据包首先被解包,获得的视频、音频压缩数据经解码后送入输出设备,用户数据和控制数据也得到了相应的处理。它所包含的各个功能单元及其标准备或协议分别是:
视频编解码(H.263/H.261):完成对视频码流的冗余压缩编码。
音频编解码(H.723.1等):完成语音信号的编解码,并在接收端可选择地加入缓冲延迟以保证语音的连续性。所采用的标准为ITU-T的H.723.1,它提供5.3kbit/s和6.3kbit/s两种码率,采用线性预测综合分析编码方法,分别使用代数码本激励线性预测和多脉冲最大似然量化,从而各自获得编码复杂度和质量的优化。
各种数据应用:包括电子白板、静止图像传输、文件交换、数据库共存、数据会议、运程设备控制等,可用的标准为T.120、T.84、T.434等。
控制单元(H.245):提供端到端信令,以保证H.323终端的正常通信。所采用的协议为H.245(多媒体通信控制协议),它定义了请求、应答、信令和指示四种信息,通过各种终端间进行通信能力协商,打开/关闭逻辑信道,发送命令或指示等操作,完成对通信的控制。
H.225层:将视频、音频、控制等数据格式化并发送,同时从网络接收数据。另外,还负责处理一些诸如逻辑分帧、加序列号、错误检测等功能。
通信原理
在H.323多媒体通信系统中,控制信令和数据流的传送利用了面向连接的传输机制。在IP游戏栈中,IP与TCP协作,共同完成面向连接的传输。可靠的传输保证了数据数据包传输时的流量控制、连续性以及正确性,但也可能引起传输时延以及占用网络宽带。
H.323将可靠的TCP用于H.245控制信道、T.120数据信道,呼叫信令信道。而视频和音频信息采用不可靠的、面向非连接的传输方式,即利用用户数据协议UDP(User Datagram Protocol)。UDP无法提供很好的QoS,只提供最少的控制信息,因此传输时延较TCP小。 在有多个视频流和音频流的多媒体通信系统中,基于UDP和不可靠传输利用IP多点广播和由IETF实时传输协议RTP处理视频和音频信息。IP多播是以UDP方式进行不可靠多点广播传输的协议。RTP工作于IP多播的顶层,用于处理IP网上的视频和音频流,每个UDP包均加上一个包含时间戳和序号的报头。若接收端配以适当的缓冲,那么它就可以种用时间戳和序号信息"复原,再生"数据包、记录失序包、同步语音、图像和数据以及改善边接重放效果。实时控制协议RTCP用于RTP的控制。RTCP监视服务质量以及网上传送的信息,并定期将包含服务质量信息的控制信息包发分给所有通信节点。
在大型分组网络如因特网中,为一个多媒体呼叫保留点足够的宽带是很重要的,也是很困难的。另一个IETF协议--资源预流协议RSVP允许接收端为某一特殊的数据流申请一定数量的宽带,并得到一个答复,确认申请是否被许可。虽然RSVP不是H.323标准的正式组成部份,但大多数H.323产品都必须支持他,因为宽带的预流对IP网络上多媒体通信的成功至关重要,RSVP需要得到终端、网关、装有多点处理器的MCU以及中间路由器或交换机的支持。
相关的音视频协议
- H.225.0适用于不同类型的网络,其中包括以太网、令牌环网等。H.225.0通信的范围是在H.323网关之间。
- H.245协议定义了主从判别功能,当在一个呼叫中的两个终端同时初始化一个相同的事件时,就产生了冲突。例如,资源只能被一个事件使用。为了解决这个问题,终端必须判断谁是主终端,谁是从终端,主从判别过程用来判断哪个终端是主终端,哪个是从终端。终端的状态一旦决定,在整个呼叫过程期间都不会改变。