多媒体数据库的发展和研究,本文主要内容关键词为:多媒体论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 多媒体数据库的发展
1.1 多媒体数据的特点 多媒体数据具有复杂性、时序性、冗余性和分布性等特点。复杂性是指多媒体数据可以是格式化数据(如数值、文本等),也可以是非格式化数据(如图形、图像、声音等),它们具有不同的形式和格式,种类繁多且数据容量大;时序性是指多媒体信息的展示大多与时间因素密切相关,必须考虑媒体间以及媒体内部在时间上的同步关系,且需解决由于存储、通信和计算所引起的系统延误;冗余性是指某些动态类型的多媒体对象在一段时间内仅发生微小的变化或仅在某局部发生变化(如影视胶片的各连续帧),大部分数据是冗余的;分布性是指在网络环境下,各种多媒体数据分散在不同的站点,必须通过高速、宽带的多媒体网络进行实时多媒体传输服务。
多媒体数据的以上特点对数据模型提出了新的要求:a.聚集抽象,即在处理多媒体信息时,需分解与重组多媒体对象;b.概括对象,即需定义多媒体数据一定的层次关系;c.支持自定义数据类型,并将其视为不可分割的存储管理单位,实现组合信息存储与查询;d.强有力的对象访问手段,即除常规的对象访问外,还需通过层次结构、聚集格、特征等进行访问以及浏览等;e.具有高度的数据独立性,提供描述性的查询语言和良好的图形用户界面,提供严格而简明的数据视图。
1.2 传统数据库的局限性 传统的数据库管理系统是以关系模型为代表,以层次、网状、关系模型构成的数据管理型式。这种数据库技术有一个根本的出发点,就是力图用一个统一的模式和统一的框架来描述、组织和处理客观世界的所有对象,凡是满足这种模式和框架的对象就可接纳处理,凡不满足这种模式和框架的对象就加以改造,改造不了的只好排除在外,而改造的过程中又不可避免地丢掉了许多语义信息。关系模型的方法基本上是把世界上的对象都看成二维表。对于常规数据类型这样处理是可以的,然而对于多媒体数据类型就无法处理,也无法改造它。这种统一标准的框架将客观世界中的大多数对象排斥在外。
随着数据管理方法的发展,人们认识到处理复杂对象的科学方法是根据客观世界的本来面目分门别类地描述对象,这就是80年代初发展起来的面向对象技术。面向对象技术是以自然、直观和科学的思维模式去看待、描述、定义和处理现实世界,把世界看成是由对象组成的大系统,通过引进封装、继承、对象和消息超类、子类等概念,科学地描述各种对象及其内在结构和联系,从而使许多复杂甚至无法解决的问题变得相对简单。面向对象技术和数据库技术的结合导致了面向对象数据库的诞生。面向对象数据库可以方便灵活地处理图形、图像、声音、文字和动画等多媒体信息,尤其是具有层次结构的复杂的对象。然而,面向对象数据库并不等同于多媒体数据库,虽然面向对象数据库是实现多媒体数据处理较理想的途径,但这种方法工作量大、投资多、周期长,仍存在许多不尽人意的地方。
总体而言,传统数据库存在以下问题:a.以记录为基本结构,不能表示实体,也不能以自然的方式描述实体间的联系;b.仅提供格式化数据类型,且不允许用户定义新的数据类型,不具有处理非格式化多媒体数据的能力;c.语义表达能力差,记录的属性间的联系及其在记录中的作用不明确;d.存储效率低,造成大量冗余。
1.3 多媒体数据库概念 多媒体数据库的概念自1983年由D.T si-chhritzis S.christodoulakis等人提出至今,已经历了10多年的发展,而且已有一些原型诞生。多媒体数据库与其他数据库相比,它强调的是信息载体的多样性、交互性以及集成性。对各种各样的信息进行管理、运用和共享的数据库就是多媒体数据库。尽管人们在积极研究多媒体数据库的各项技术及实现方案,但对多媒体数据库仍是处于摸索和发展阶段,还不完善和成熟。
2 多媒体数据库的基本技术
2.1 数据模型 建立数据库模型是实现多媒体数据库的关键。目前实现多媒体数据库管理的途径主要有四种,都需要使用与之对应的数据模型:a.基于关系的模型,属于扩充关系数据库模型,在传统关系数据库的基础上加以扩充,使之支持多媒体数据类型。b.基于面向对象的模型,以此实现对多媒体的描述及操纵。在面向对象语言中嵌入数据库功能而形成多媒体数据库的关键是如何在面向对象语言中增加对持久性对象的存储管理。此种方法亦受面向对象方法的限制。c.基于超文本模型或超媒体方法。d.开发全新的数据模型,从底层实现多媒体数据库系统,该方法首先建立一个包含面向对象数据库核心概念的数据模型,设计相应的语言和相应的面向对象数据库管理系统的核心。这种方式系统结构清晰、效率高,但难度太大。
2.2 数据的压缩与还原 多媒体的数据要占据很大的空间,如一段2min左右的音乐要占据数+KB至数百KB的存储空间,而一幅图像则根据分辨率和尺寸要占据数MB至数+MB的存储空间。所以,必须在存储时进行数据压缩,重放时进行数据还原。
2.3 存储管理和存取方法 动态声音和图像形成的大对象即使进行了压缩,存储量也十分惊人。大对象一般是进行分页面进行管理的。
2.4 用户界面 由于在多媒体计算机中增加了声音和图像接口,所以多媒体数据库应提供更加友好的用户界面。多媒体宿主语言调用、SQL语言以及虚拟现实技术都将使用户方便地接受和反馈信息。
2.5 分布式技术 传统的分布式系统在管理多媒体数据时已不能满足要求。我们不仅要解决数据模型和数据压缩等问题,还必须解决多媒体数据集成和异构全局多媒体数据语言查询等问题。同时,多媒体数据对宽带也有要求。
3 多媒体数据库的几种实现方法
3.1 完善面向对象数据库,使之适合多媒体数据处理,以便逐步为用户接受 面向对象数据库模型中的对象、属性、方法、消息及对象类的层次结构和继承等特点使其能够较好地解决多媒体信息管理面临的问题,因此受到人们的重视。
面向对象方法的基本出发点是把现实世界的复杂实体信息形态的各个方面抽象为对象。一个对象包含有若干个属性,用来描述对象的形态、组成和特性。属性也是对象,它又可能包含其它对象作为其属性,这种递归引用对象的过程可以组成各种复杂的对象。由对象组成对象的过程称为聚集。除了属性外,对象还包含若干方法,用来描述对象的行为特征,它可以对对象进行操作,从而改变对象的状态。对象描述及其上的操作被封装为一个整体,外界只能借助消息与对象通信。因此,可将对象看成是一个抽象数据结构,利用其封闭、继承、聚合和归纳等特性,使其实现细节对外部过程的不可见性。用户只需按格式要求输入某属性的参数,系统自动生成对应的复杂对象。为了避免对大量类似对象的属性和方法的重复说明,可把类似的对象归并为类,类中每个对象称为实例。同一类中的对象具有共同的属性和方法。将类的定义和实例分开,为每个类设置一个实例化机制,有利于组织有效的访问机制。
面向对象数据库模型在支持多媒体应用方面具有自己独特的优点:a.能更好地处理多媒体数据复杂对象的结构定义;b.能使对象在系统中是独立的,具有良好的封闭性,并且很容易实现并行处理,也便于系统模式的扩充和修改;c.对象类、类层次和继承性的特点减少了冗余和由此引起的一系列问题;d.系统中实体是独立于值存在的,因而避免了大量的异常情况;e.便于数据系统定义新的数据类型和操作;f.面向对象系统通常是沿着系统提供的内部固有联系进行查询,避免了大量的查询优化工作。
因此,面向对象数据库模型具有强大生命力和良好的发展前景。目前,已有一些面向对象数据库系统投入使用,如IBM Almanden研究中心的XSQL系统和Ontologic公司的VBase系统等。这些系统为设计多媒体数据库提供了宝贵的经验,但面向对象技术本身还处于研究发展阶段,缺乏成熟的、形式化的理论作为基础,缺乏友好的用户界面、工具环境和查询优化手段,实现难度较大。
3.2 从关系数据库模型发展多媒体数据库 传统的关系数据库模型建立在严格的数学基础——关系代数上,它为数据库用户提供了一种高级的、集合式的非过程数据库语言,在常规数据的信息管理中发挥了巨大的作用。发展至今,关系数据库模型已具有了成熟的理论基础、完备的数据库管理技术和广泛的应用领域,但是当它面对应用领域所涉及到的图形、图像、文字、声音、动画时便显得无法适应。因此,传统的关系数据库模型为适应多媒体数据的处理要求,必须从概念和体系结构上作较大的扩展和修改。
对多媒体数据库数据模型可作如下的扩展:a.扩展基本关系类型,支持复杂对象;b.对关系模型提供的操作加以扩充;c.扩展面向对象的风范。多媒体数据库对关系模型作一定的扩充后,就能在可扩充的数据库管理系统中支持具有面向对象功能的许多新的应用,而开发和改造成本也较少。
其中一种简单的做法就是在关系数据库管理系统内引入新的数据类型以描述多媒体数据,并应用一些新技术,如WINDOWS的对象链接与嵌入技术,从而使一些传统的关系数据库管理系统,如Foxpro、Paradox、Oracle7.0等具有一定的多媒体管理功能。
这种通过扩充关系数据库管理系统以支持多媒体信息存取的方法具有实现代价小、关系数据库系统内核可被多媒体数据库系统利用、程序设计语言丰富等优点。但是这种实现方法也存在严重缺陷,主要表现在:对多媒体信息的建模能力差,无法反映多媒体信息中各媒体间的空间关系、时间关系与语义关系。此外,在多媒体信息的同步集成和表现上,在基于内容的查询和检索方面更是难以实现。
3.3 分布式超媒体数据库 超媒体是超文本的多媒体化,是一种用非线性方式组织信息的方法,也是一种数据管理技术。它是由信息结点和表示信息结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。在其结点内的信息包括了文本、声音、图形、图像以及动画和视频等等,几乎覆盖了信息世界的各个方面。
分布式超媒体数据库系统是一种以超媒体信息管理技术为基础的分布式系统。由于多媒体数据具有形象直观、语义丰富和时空关联等特点,并且若是在分布式环境下,则还必须将多媒体信息通过网络予以分布,这将使得多媒体的空间同步或表现建模变得更为复杂,分布式超媒体数据库表现的功能特点能较好地解决这些问题。分布式超媒体数据库用超媒体结点和链分别描述实体和实体之间的联系,它是按主题、节点名和媒体对象做查询对象,基于内容的查询可向用户提供良好的人机交互方式,同时它采用超媒体浏览导航机制,除了具有一般的查询功能以外,还具有浏览过滤功能,能自动确定用户感兴趣的主题,采用宏文献结构来支持大型数据库分布到网上。
目前超媒体技术的数据模型只能实现多媒体数据的内容与结构建模,即只涉及概念模拟问题,还没有实现表现建模。而基于关系的多媒体数据模型甚至连概念模拟也无法达到。因此,设计能够支持概念模拟和表达模拟的分布式超媒体数据模型是多媒体建模的主要研究课题。
实现分布式超媒体数据库还有不少技术问题有待解决,如将超文本发展为超媒体时产生的各种问题、多媒体信息的查询与检索问题、版本控制问题以及多媒体信息的标准化问题等。
尽管人们在多媒体数据库技术的研究领域积极探索,但仍处于初级阶段,处在对多媒体数据库还没有完善定义的状态。一般认为,扩展关系数据库作为现阶段实现多媒体数据库的过渡技术是可行的,但其固有的缺陷表明它终将被面向对象方法和超媒体技术所取代。面向对象方法和超媒体技术在表示多媒体数据模型,实现多媒体时空同步,版本生成与控制及基于内容查询和索引,用户接口技术方面有着独特的优点。相信在不久的将来,一定会出现真正的面向对象的多媒体数据库管理系统。
标签:超媒体论文; 数据库系统论文; 面向对象数据库论文; 面向对象方法论文; 概念数据模型论文; 多媒体论文; 数据库论文;