一种基于数字图书馆网络的流媒体阻塞控制算法_数字图书馆论文

一种基于数字图书馆网络的流媒体阻塞控制算法,本文主要内容关键词为:流媒体论文,算法论文,数字图书馆论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G250文献标识码:A文章编号:1007-7634(2009)07-1058-04

随着目前传统图书馆逐渐向多功能数字图书馆演变,在其建设中所涉及的相关技术,首先是解决信息资源的数据压缩和存储。在数字图书馆中,文本数据所占的比重并不是很大,真正大的是多媒体数据。因此,必须对多媒体数据进行压缩,使数据库的规模保持在可管理的范围内。而流媒体技术的产生和发展正为数字图书馆建设过程中解决多媒体信息处理问题提供了一套完整而有效地解决方案。

1 流媒体技术介绍

1.1 流媒体技术原理

流媒体(Streaming Media)是随着互联网的普及而迅速流行起来的一种新技术。它是指采用流式传输的方式在Internet播放的媒体格式。流式传输方式是将音频、视频等多媒体信息经过特殊的压缩方式分成一个个压缩包,由视频服务器向客户端计算机连续、实时地传送。通过这种技术可以把声音、图像资料经过计算机进行编码[1]整理后放到网络服务器上,用户可以一边下载一边收听、收看,而不需要把完整的音像资料下载到自己机器后才能使用。

1.2 流媒体技术的特点

(1)播放效率高。流媒体把声音、视频等信息由服务器将经过特殊方式压缩的多媒体文件打成一个个压缩包,向用户端连续、实时传送。流媒体文件从服务器向客户端进行实时播放时,用户不必等到全部文件下载完毕。

(2)所需带宽小。多媒体文件采用流媒体格式传输时,体积大大缩小,所以传输的带宽要求也较低,采用普通的Modem拨号上网也可以进行视频点播。

(3)可实现双向交流。流媒体服务器和客户端流媒体播放器之间的交流是双向的。服务器在发送数据时还在接收用户发送来的反馈信息,在播放期间双方一直保持联系。

2 流媒体技术在数字图书馆建设过程中的应用

在数字图书馆建设中,要将多媒体音像资料数字化并在现实中得到有效的应用,必须建立一套完整的架构。其工作流程是:建立流媒体信息服务平台、流媒体信息智能检索系统、流媒体信息发布与后台管理。

2.1 流媒体信息服务平台构建

数字图书馆中的流媒体信息服务平台的网络拓扑结构可以多种多样,而且在设计应用系统时应考虑用户群体的因素,它决定了整个系统服务体系的类型、开发规模和系统需求。根据用户规模,预测可能的并发数据流量,确定合适的服务器[2],并据此选择相应的系统方案,它应当包含以下两部分。

(1)流媒体服务器。流媒体系统核心是服务器。在流媒体网络系统中,节目源、流媒体服务器和用户终端设备是系统主要的应用环节。流媒体服务器是由流服务器硬件平台和运行其上的流服务软件平台配合提供流式服务。流媒体服务器对视频/音频码流进行存储、管理和分发作用。

(2)流媒体数据库。流媒体数据库用于存放流媒体的各种检索信息,使客户能快速地获取需要的流媒体信息。根据所选择的操作系统的不同,可以选用不同的数据库系统。如果是Windows操作系统可以选用ACCESS数据库,如果是LINUX操作系统则可以使用SQL数据库。对于大型图书馆应当使用能力更强的数据库系统。

2.2 流媒体信息智能检索系统

随着数字图书馆的建设,流媒体信息资源将越来越多,如果这个系统只是一些信息的简单堆积,那么他也就没有什么实际应用价值。当读者通过关键词或关于所需信息的描述,可以在Internet上很方便地定位相关信息源。毫无疑问,流媒体信息中也包含有合适检索的信息,用户能据此找到他所感兴趣的内容。通过开发高效的流媒体信息检索[3]系统,对于流媒体信息检索系统应当包含视频分析、视频索引、视频匹配三个部分。如图1所示。

图1 信息智能检索系统内容示意图

从视频中抽取关键帧,并分析其中的内容特征来作为索引。在此基础上通过关键帧类聚和结构化,提供对视频内容的摘要和内容浏览。最后,结合相关反馈和语义模板,检索是否匹配,实现关键帧语义查询。

2.3 流媒体信息后台管理与支持

数字图书馆所要面对的流媒体信息是海量的,要将如此庞大的信息源有效地组织起来,并能为读者服务,必须拥有良好的信息服务系统。该信息服务系统应当包括信息处理、信息发布和信息维护。

(1)信息处理。信息处理是将传统图书馆原有的多媒体信息转化为流媒体信息。原有的多媒体信息主要保存在录像、磁带、CD、VCD、DVD等载体上,需要通过视频、音频工作站将其转化为流媒体信息。这些工作站应当配有视频、音频采集卡。采集设备包括电视摄像机、立体声录音机、VCD、DVD、录像机等。

(2)信息发布[4]。信息发布是将处理好的流媒体信息发布到数字图书馆信息平台上。根据馆藏量的大小和读者的多少,相应采用合适的信息发布平台和数据库系统。在馆藏量和读者群不大的情况下,可以使用成本相对较低的ASP+ACCESS系统。对于大型数字图书馆,应当使用稳定性更好、检索能力更强的UNIX系统。

3 流媒体数据传输存在的主要问题

3.1 QoS保障

QoS(Quality of Service)是网络的一种传输质量安全保障机制。在网络带宽足够大及业务信息流量不多的情况下并不需要QoS,但是对保障关键应用和多媒体应用就十分必要。当网络过载或阻塞时,QoS能确保重要业务数据包不受延迟或丢弃,在原有的网络带宽基础上为数字图书馆系统提供相对稳定的传输带宽,同时保证网络的高效运行。

当前流媒体数据传送不仅包括流媒体本身严格的实时性和可靠性要求,还包括传输的可扩展性和TCP友好性。实时流媒体传输业务还要求传输速率的平滑性,以提供良好的延迟服务。流媒体数据是以包为单位进行异步传输的,因此多媒体数据在传输中要被分解成许多包,由于网络传输的不稳定性,各个包选择的路由不同,所以到达客户端的时间次序可能发生改变,甚至产生丢包的现象。同时在数字图书馆的网络环境下,网络不提供服务质量(QoS)[5]保障,媒体流数据在传输过程总经历带宽、延时等情况动态变化。

3.2 服务控制机制

在数字图书馆网络上进行流媒体传输需要采用一些应用层的服务控制机制来解决传输中的问题,最常用的一种方法是采用内容分发网络(CDN)。CDN技术是近年来在我国兴起并迅速发展起来的一种解决网络性能不佳问题的有效手段。其基本思路就是尽可能避开网络上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。

对于数字图书馆网络来说,采用CDN传输流媒体的优点主要包括三个方面。第一是通过应用层的内容分发降低了主干网络的流媒体流量,并实现了基于应用层的组播仿真(即利用主机构建独立于网络层的逻辑组播树,并采用主机上的应用层软件进行组播转发)。第二是通过分布在网络边缘的流媒体服务器,避免了阻塞[6]链路,提高了流媒体传输的性能和响应时间。最后,通过CDN能够有效地提高整个流媒体系统的扩展性,降低对每个流媒体服务器的性能要求。但由于CDN技术发展时间不长,适用到流媒体数据传输中还存在负载和响应时间等技术问题,还需要进一步研究和细化。

3.3 数据传输阻塞

随着图书馆数字化文献资源的大规模开展,文献资源的内容已不在局限文本、图像等传统的媒体类型,音频、视频等多媒体文献也被列入数字化文献资源建设的重要内容之一。流媒体技术要求所采用的音视频编码压缩和流式播放技术在保证音频、视频的播放质量前提下,所体现出来的节省存储空间,低带宽资源消耗的优点使它成为对多媒体文献资源进行转换、传播及应用的首选。而目前数字图书馆的流媒体数据传输服务,普遍存在速度较慢、经常发生阻塞的现象。

数字图书馆有限的处理能力、传统的包交换网络机制和尽力而为的服务模型是造成数据传输丢包的主要原因。因此,需要采取阻塞控制机制,实时调整发送速率,避免网络阻塞导致数据包丢失而影响流媒体传输的质量。

4 基于端点的单播阻塞控制算法

为解决流数据在数字图书馆网络传输中面临的网络资源和网络流量分布的不均衡性,下面提出一种新的基于端点的单播阻塞控制算法(Source-Based Unicast Congestion Control,SBUCC),该算法构架在TCP协议之上,采用的是基于端点的速率控制[7]机制。目的就是尽量保证数字图书馆的服务质量如何与图书馆网络上的TCP流友好地相处。

4.1 算法思想

该算法中最低发送速率在系统运行过程中可以根据用户需求由接收端和发送端通过协商而动态调整,这样就可以满足不同用户的QoS的要求。但是最低发送速率也不能持续时间过长,只能处于一个暂态。因为若发送速率长时间处于最低发送速率状态,可能会加重网络负荷,加重阻塞。当系统拥挤持续时间过长时,则停止发送。发送端在收到TCP协议的大量数据包后,将根据测得的QoS参数计算出当前允许的最大发送速率,然后将这个速率与最低发送速率、实际发送速率进行比较,根据不同的情况采取不同的速率调节方法。

4.2 参数计算

(1)平均丢包率h计算。考虑到将采用的TCP流量模型.算法中不采用丢失事件率.而采用平均丢包率h代入TCP流量模型中计算。因为不考虑差错重传,在接收端,计算邻近两个时间戳接收事件之间丢失的数据包的个数,除以这两个时间戳包的序号差值,就可以得到h。

(2)TCP流量模型。由于本文算法不考虑超时重传的影响,因此采用一个稳定状态下近似的TCP流量[8]模型公式:。其中s是数据包大小,h是上面提到的平均丢包率

4.3 速率控制方法

速率控制的目的是基于预测的网络带宽决定发送的速率。有两种基本的速率控制手段,基于发送端的速率控制和基于接受端的速率控制。

基于发送端的速率控制主要基于反馈信息进行速率调节,有两种速率控制方法,基于检测的方法(Detection-Based)和基于模型的方法(Model-Based)。基于检测的方法通过不断调整速率使得包的丢失率低于一个固定的概率值。基于模型的方法直接利用TCP的吞吐率模型计算速率。

在基于接受方的速率控制中,发送方不参与速率控制,而由接受方通过增加和减少通道的数量来进行速率的调整。通常,这种方法用于采用可扩展编码的组播的情况,组播的视频流分为多层,每个层对应组播的一个通道。接受方通过增加/减少通道数获得不同的质量。当基于发送方的速率控制决定了发送的速率之后,一个必须的操作是调节原始的压缩流的速率以满足目标速率的要求,这通过速率调整来实现。

4.4 速率调整

4.5 数字图书馆采用基于端点的单播阻塞控制算法的优点

(1)启动速度更快。由于阻塞窗口的初始化值ICW被设置为4段流数据包,和以前系统相比较,在同等的阶段能够传输更多的数据包,充分利用了网络资源,尽快地达到网络传输极限。

(2)该算法根据往返延迟的增大判断发生阻塞的前兆,从而在阻塞发生前就可以及时采取措施减小发送方的发送速度,达到避免阻塞的目的。这里借用超时重传定时器的方法来预测往返延迟。

(3)超时恢复更快。数字图书馆系统能够在超时重传后,调整速率完毕后直接进入阻塞避免阶段,系统能够更快地恢复到网络资源的极限。

(4)由于初始化阻塞窗口ICW为4个流数据段大小,可以使网络系统更快地进入传输的最佳状态,因此可以提高网络资源的利用率;然而在网络系统运行过程中,采用的是保守的阻塞控制方法,即在阻塞未发生之前,就根据往返延迟的增大来认为可能会有阻塞的发生,提前采取措施减小发送的速度,避免网络进入阻塞恶化阶段,从这方面讲数字图书馆网络的吞吐量会相应的降低一些。

数字图书馆网络的拥挤只是暂时的现象,所以将拥挤时的状态定为暂态[10],但同时对持续的拥挤也做出自身的调整。通过设置流媒体暂态计时器,保证SBUCC协议只是在有限的时间范围内占用所需的最小带宽,若超出该时间范围,SBUCC将自动停止发送,以防止其加重网络负荷,导致数据流拥塞。

5 结语

尽管流媒体技术在WWW上的应用还受到软硬件各方面条件的限制,如网络带宽影响着文件的下载速度及流媒体的品质,种类繁多的文件格式带来了播放环境的复杂性等,但是,流媒体技术作为一项新的网络技术,一旦与原有的网络技术结合起来,将给我们的网络应用带来新的发展和变化。我们完全可以相信,流媒体技术的应用会使校园网变得更加精彩,使数字图书馆的工作更加完善。

标签:;  ;  ;  ;  ;  ;  

一种基于数字图书馆网络的流媒体阻塞控制算法_数字图书馆论文
下载Doc文档

猜你喜欢