|
一、MPEG是什么? MPEG是运动图像专家组的简称,全称是ISO/IEC JTC1/SC29/WG11,即国际标准化组织和国际电工委员会第一联合技术组第29分委会第11工作组,负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作,制定的标准推动了VCD、DVD、数字电视、高清晰度数字电视等产品的发展。 JPEG是联合图像专家组的简称,全称是ISO/IEC JTC1/SC29/WG1,即国际标准化组织和国际电工委员会第一联合技术组第29分委会第1工作组,负责静止图像编码国际标准的制定,所制定的JPEG、JBIG、JPEG2000等标准在传真机、数字相机等产品中得到了广泛应用。
二、MPEG制定的标准
MPEG-1和MPEG-2是MPEG组织制定的第一代视、音频压缩标准,为VCD、DVD及数字电视和高清晰度电视等产业的飞速发展打下了牢固的基础,曾获得了著名的Emmy奖。MPEG-4是基于第二代视音频编码技术制定的压缩标准,以视听媒体对象为基本单元,实现数字视音频和图形合成应用、交互式多媒体的集成,目前已经在流式媒体服务等领域开始得到应用。MPEG-7是多媒体内容描述标准,支持对多媒体资源的组织管理、搜索、过滤、检索,已基本完成。正在制定的MPEG-21的重点是建立统一的多媒体框架,为从多媒体内容发布到消费所涉及的所有标准提供基础体系,支持连接全球网络的各种设备透明地访问各种多媒体资源。 目前,MPEG系列国际标准已经成为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。
三、MPEG4的特点
MPEG(Moving Picture Experts Group)专家组继成功定义了MPEG—1和MPEG—2之后,于1993年7月开始制订全新的MPEG-4标准,并分别于1999年初和2000年初正式公布了版本1和版本2。到2001年10月,MPEG一4已定义了19个视像类(Visual Profile),其中新定义的简单演播室类(Simple Studio Profile)和核心演播室类(Core studio Profile)使MPEG-4对MPEG-2类别保留了一些形式上的兼容,其码率可高达2Gbps。随着MPEG-4标准的不断扩展,它不但能支持码率低于64kbps的多媒体通信,也能支持广播级的视频应用。MPEG-4标准将广泛运用于数字电视、动态图像、万维网(www)、实时多媒体监控、基于内容存储和检索的多媒体系统、互联网上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等,它将推动电信、计算机、广播电视三大网络的最终融合,从而成为今后一段时间压缩标准的主流。
1、 MPEG-4 标准的主要特点和功能
MPEG—4视频编码标准支持MPEG—1、MPEC-2中的大多数功能,提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。图1为MPEG一4支持的码率与相应功能集之间关系的示意图。
在这一功能集的底层是VLBV(Very Low Bit Rate Video)核心。它为码率在5一64kbps范围内的视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352 X 288像素)和较低的帧频(低于15Hz)。VLBV核心支持的专用功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。
MPEG—4的HBV(High Bit Rate Video)同样支持上述功能,其码率范围在64kbps—10Mbbps之间,它与VLBL核心采用相同或相似的算法,但它支持更高的空间与时间分辨率,允许传输和存储适用于演播室的高质量视频信号,其输入可以是ITU-R Rec.601的标准信号,典型应用为数字电视广播与交互式检索。MPEG-4最终支持的码率将高于MPEG—2。 MPEG-4 提出了基于内容(Content-based)的存取概念,使用户可与场景进行交互。它对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,称为AV对象(AVO:Audio Video Object)。AV对象可以组成AV场景(AVOs:Audio Video Object in a scene)。因此,MPEG—4标准的基本内容就是高效率地编码、组织、存储、传输AV对象。MPFG-4标准支持8项新的或改进的功能,可分为以下3类:
1) 基于内容的交互性
基于内容的多媒体数据存取工具;基于内容的码流操纵和编辑;自然与合成数据的混合编码;增强的时间域随机存取。
2) 高压缩率
提高编码效率;对多个并发数据流的编码。
3) 灵活多样的存取
错误易发环境中的抗错性(Robustness);基于内容的尺度可变性(Content-based scalability)。
2.MCS与会议终端间实时通信的实现
在Windows操作系统平台上,我们的应用程序采用Windwos Socket(套接字)来实现会议终端和MCS之间的通信。套接字是网络通信的基本构件,是可以被命名和寻址的通信端口,使用中的每一个套接字都有一个与之相连的进程。Windows Sockets的实现必须支持TCP和UDP两种类型的套接字(即流套接字和数据报套接字)。流套接字提供了一个面向连接、可靠的数据无差错、无重复地发送,且按发送顺序接收的服务。数据报套接字提供一个无连接服务,不提供无差错保证,但数据报套接字可以提高信道利用率。依据H.323标准,传输音/视频数据采用支持UDP协议的数据报套接字,传输控制信令和RAS信令使用支持TCP协议的流套接字。在TCP/IP网络中,无论利用何种套接字,在两个不同终端上进行通信的进程间相互作用的主要模式是客户/服务器(Client/Server Model),即客户向服务器发出请求后,服务器提供相应的服务,因此在终端应用程序和MCS应用程序中都有客户端和服务器端代码。
H.323标准框架中的H.225.0定义了初始的呼叫控制和终端对网闸(Gatekeeper)的登记、申请等消息。RAS 信令功能使用H.225.0消息在终端和Gatekeeper之间完成登录、许可权认证、带宽改变、状态和脱离过程。RAS信令信道在终端和Gatekeeper之间打开,并且在任何其它信道的建立之前进行。在我们设计的实验系统中只有一个网闸,在多点会议开始前,每一个与会者终端都必须在Gatekeeper处登记,发送请求注册登记的命令(RRQ),同时将要登记的信息(如别名、地址等)随之传送过去,网闸接受登记则回发RCF作为注册确认,此时会议终端才能参加会议。当H.225.0消息建立了初始呼叫之后,在每一个会议终端和MCS间都建立一个H.245控制信道。
每个会议终端与MCS之间分别存在音频信道和视频信道,并在MCS 中有与之对应的发送线程和接收线程。多点会议开始后,一旦会议组织者在MCS上的与会者列表中选择主席和选定听众,主席终端会收到控制信息,并把音视频数据通过自己的发送线程发送给MCS上与之对应的接收线程,该接收线程传递音视频数据缓冲区的地址给其它终端在MCS上对应的发送线程,然后把数据发送给其它会议终端。选定听众的音视频数据通过同样方式传送给主席终端,至此,一个切换过程结束。会议过程中,若有某个终端申请发言,它必须向主席提出请求,主席同意后,它才能获得发言资格,这个过程也在MCS的控制下进行。
实验证明,在视频会议系统中,只简单地使用数据报套接字传输音视频数据是不可行的,还必须在UDP层上采用RTP(实时传输协议)和RTCP(实时传输控制协议)来改善服务质量。实时传输协议提供具有实时特征的、端到端的数据传输服务。我们在音视频数据前插入包含有载荷标识、序号、时间戳和同步源标识符的RTP包头,然后利用数据报套接字在IP网络上传输RTP包,以此改善连续重放效果和音视频同步。实时传输控制协议RTCP用于RTP的控制,它最基本的功能是利用发送者报告和接收者报告来推断网络的服务质量,若拥塞状况严重,则改用低速率编码标准或降低数据传输比特率,以减少网络负荷,提供较好的QoS保证。
三、实验结果
在IP多点视频会议实验系统中,我们把多点会议系统中的三个会议终端分别置于陕西省数据通信局(西安)、咸阳数据通信分局和宝鸡数据通信分局进行测试,该系统跨越了155M SDH网络、多个路由器和以太网交换机,系统中的会议终端可以通过IP地址或域名登陆到多点控制服务器上,由于多点控制服务器(MCS)采用集中式控制方式,各个会议终端的音/视频流都通过MCS切换和控制,因此多点控制服务器端所需的带宽相对于会议终端要大得多。在公用数据网络中,音/视频数据的实时性和传输质量与带宽有密切关系,而不论可利用带宽是多少,在共享的IP 网络中,带宽很少为常量,任何时候都会有不同类型的数据包和通道分享不同的网络段,用户可主要通过调节视频传输比特率来适应网络带宽。
在西安,该系统的一台会议终端和多点控制服务器与众多的上网用户共享2M带宽,出口带宽相对较窄,因此当我们把终端图像传输速率调到384kbit/s时,虽然图像质量较好,但是图像更新速率慢,而选择124kbit/s时,图像质量一般,但图像更新快,传输效果好;若把多点控制服务器放在宝鸡或咸阳,网段负载较轻时,终端传输速率调整到384kbit/s或256kbit/s,各点视频终端的图像质量和传输质量都能得到较好的保证;若此系统中的各会议终端和多点控制服务器放在同一网段上,视频传输速率还可达到到768 kbit/s,图像质量更加清晰流畅。此外,在上述几种情况下,系统都能够实现唇音同步。
四、结论
测试结果证明, 我们设计的IP多媒体视频会议系统已经能够在局域网LAN和以路由器为连接基础的广域网WAN上得到应用,音视频效果、稳定性以及性能价格比已完全能满足商用化的需求。该系统不仅可用于视频会议,还可应用于远程教学、远程医疗、商务管理等多种领域。
|