基于对象描述的数字图书馆模型,本文主要内容关键词为:数字图书馆论文,模型论文,对象论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
作为研究基于对象描述的数字图书馆模型的基础,我们首先把数字图书馆从功能上分为馆藏和服务这两大对象。
1 基于对象的数字图书馆模型分析
从对象分析来看,数字图书馆的内容建设,就是对建立资源、服务和读者对象的描述的过程。也就是说,是对象属性的写过程。在这个过程中,我们通过在建立馆藏对象的描述和服务对象描述的同时,建立两者之间的关系来实现数字图书馆的服务定义。
首先,我们针对分类浏览来建立Web服务。
对于分类浏览服务,它依赖于馆藏对象的属性描述。我们在定义服务对象中的Web页面属性时,在内容对象属性上,建立各个类目的关联。也就是在内容属性的动作描述中,定义该内容所对应的馆藏对象的属性集合。建立下面的关系:
定义:集合C:馆藏对象属性描述。
集合B:Web页面的版面属性描述。
集合L:Web页面上的层属性描述。
集合T:Web页面的层上的内容属性描述。
{Action}∈T={X[,1],X[,2]…,X[,n]}∈C
根据上面的关系,我们可以定义在版面上的层和层上的内容。而层上的内容可以是一段文字说明,也可以是一种关系的描述。这种关系一般来说存在两种情况:一是确定和其他版面的关联;二是建立和馆藏资源属性的相关描述,例如,定义该内容为某种类型的馆藏资源。
其次,根据馆藏对象的属性描述可以建立查询服务。
查询服务可以根据读者填写的查询关键词构造,也可以针对馆藏对象的单个或一组属性分别或联合定义查询条件。
同时,我们在构造服务的时候,在每一个关键的服务点上建立相应的读者访问记录。这样当读者访问数字图书馆时,就会留下其访问的踪迹,数字图书馆系统可以根据这种记录,建立读者访问对象的描述,为针对读者需求提供智能服务提供依据。
2 数字图书馆基本对象描述的建立
2.1 数字图书馆馆藏的对象描述
对于数字图书馆馆藏对象,我们目前大致可以分成两大类型:(1)数字化馆藏类:包含文本、图象、音像以及多媒体数据。同时随着计算机及其网络技术的发展,数字化馆藏对象将包含计算机软件和依赖计算机软件所提供的网上服务等内容。(2)非数字化馆藏:即传统纸介质或其他非数字化的收藏品。
数字图书馆基本对象描述示意图
这些对象作为数字图书馆馆藏时,作为收藏对象都具备一些相同的基本属性:查询和检索属性。我们可以以这种基本属性构造出最基本的对象描述,而这种描述完全可以采用Dublin Core核心元数据集来进行说明。在Dublin Core中定义了以下15个核心元素:
(1)Title:赋于资源的名称。一般而言,这一名称指的是资源对象的正式公开的名称。
(2)Creator:创建资源内容的主要责任者。创建者的实例包括一个个人,一个组织或一个服务。一般而言,用创建者的名字来标识这一条目。
(3)Subject:有关资源内容的主题描述。一般而言,一个主题和关键词通常采用描述资源内容的关键词,短语或分类号。主题和关键词应该尽量取自于一个受控词表或是一个规范的分类体系。
(4)Description:对资源内容的说明。说明元素可以包括但不限于以下部分:文摘,目录,对以图形来表示内容的一个参照或者一个有关内容的自由文本描述。
(5)Publisher:使资源成为可以取得和利用状态的责任者。出版者的实例包括一个个人,一个组织,或一种服务。一般而言,用出版者的名字来标识这一条目。
(6)Contributor:对资源内容创建作出贡献的其他责任者。其他责任者的实例包括一个个人,一个组织或一个服务。一般而言,用其他责任者的名字来标识这一条目。
(7)Date:与资源本身生命周期中的一个事件相关的日期。一般而言,日期应与资源的创建或出版日期相关。建议采用的日期格式应符合ISO 8601 [W3CDTF]规范,并使用YYYY-MM-DD的格式。
(8)Type:有关资源内容的特征和类型。资源类型包括描述资源内容的分类范畴,功能,特性或集合层次的术语。建议采用来自于受控词表中的值(比如都柏林核资源类型工作草案[DCT1])。描述资源的物理或数字化表现形式,请使用格式(FORMAT)元素。
(9)Format:资源的物理或数字化的表现形式。一般而言,形式可以包括资源的媒体形式或尺寸。形式元素可以用来决定对资源进行操作或显示所需的软件和硬件。例如有关大小及时长的标注。建议采用来自于受控词表中的值(例如,因特网媒体类型表[MIME]定义了计算机媒体的格式)。
(10)Identifier:在一给定的文本环境中对资源的参照引用。建议对资源的标识采用一个符合正式标识体系的字串及数字组合。例如正式的标识体系包括统一资源标识符(URI),资一资源定位符(URL),数字对象标识符(D0I)和国际标准书号(ISBN)。
(11)Source:对一个资源的参照,而当前资源是源自这一参照资源。当前资源可能部分或全部源自来源所标识的资源。建议对这一资源的标识采用一个符合正式标识系统的字串及数字组合。
(12)Language:描述资源知识内容的语种。本元素的值可以采用RFC 1766中所定义的语种代码规范,此标准定义了一个2个英文字母的语言代码(取自于IS0 639标准),作为一个可选项,也可以在其后加上一个2个英文字母的国家代码(取自于ISO 3166标准)。例如,en为英语,fr为法语,或者使用en-uk表述为英国英语。
(13)Relation:对相关资源的参照。对关联的标识也应该尽量采用一个符合正式标识体系的字串及数字组合。
(14)Coverage:资源内容所涉及的外延与覆盖范围。典型的覆盖范围包括空间位置描述(一个地名或地理坐标)、时间段描述(一个时间标识,日期或一个日期范围)、或者权限描述(比如命名的授权实体)。覆盖范围尽可能地取自于一个受控词表(例如地名词库[TGN]),并应尽可能地使用由数字表示的坐标或日期区间来描述地名与时间段。
(15)Rights:有关资源本身所有的或被赋予的权限信息。一般而言,权限管理元素应包括一个对资源的权限管理声明,或者是对提供这一信息的服务的参照。权限管理一般包括知识产权(IPR),版权或其他各种各样的产权。如果没有权限管理元素的标注,不可以对与资源相关的上述或其他权利的情况作出任何假定。
我们把上述属性,称为对象集合C。
同时,除了上述针对查询及检索的属性之外,每一对象还具备其针对其收藏性的属性和其他相关的描述。其中对于数字化馆藏来说,它包含:
(1)Download:有关资源是否允许下载,以及提供下载服务的服务器地址
(2)Confirm:有关对该资源进行操作所需要的验证信息。一般而言,对于验证信息信息可以是一个由第三方认证机构所提供的安全认证接口,也可以是本地的安全认证机制所提供的验证方法。
(3)Execute:当该资源为一可执行的服务时,运行该服务所需要的相关参数的说明。
(4)Correct Program:访问该资源时所需要的相应的软件或插件的信息。一般来说可以是一个提供该软件(插件)的下载服务的链接。
我们把上述属性,称为对象集合P。
其中对于非数字化馆藏来说,它包含:
(1)Location:有关资源的存放位置。例如一本书放在哪个书库的哪个书架上的第几排上。
(2)Quantity:有关资源的收藏量。
(3)Loan:当该资源的借出量。
(4)Condition:借阅该资源所需要的条件。
我们把上述属性,称为对象集合N。
2.2 数字图书馆服务的对象描述
当我们把数字图书馆的服务作为对象来加以描述时,首先我们知道数字图书馆的服务是一个基于Web方式的服务。那么对数字图书馆服务的对象描述首先是把Web页面作为对象来进行描述。其次,由于数字图书馆是为读者服务的,那么数字图书馆服务的对象描述就必须考虑把读者作为一个对象来进行描述,并根据该对象的描述信息为读者提供更优良的服务。
当我们把Web页面作为对象来进行描述时,可以把一个Web页面分成三层:版面、层和内容。它们之间的关系是:内容是一种存在于层上的对象,层为一种存在于版面上的对象。反之也可以说:版面上包含着一系列对象——层,而层上则包含着另外一系列对象——内容。而这三层对象各自有着自己的属性。
(1)版面属性的描述:版面属性定义一个Web页面的基本要素,它包含以下几个元素:
Board Name 版面名称
Board Title 版面的标题
Background Color版面的背景色彩
Background Picture 版面的背景图片
我们把上述属性,称为对象集合B。
(2)层的属性的描述:层含有与Web页面类似的基本要素,它包含以下几个元素:
Layer Name
层的名字
Board Name
层所在的版的名字
Title层的标题
Top 层的顶边界
High 层的高度
Left 层的左边界
Width层的宽度
Background Color 层的背景颜色
Background Picture
层的底图
Visible 层的外貌(visible,hidden,scroll,auto)
Tag 层的标签
我们把上述属性,称为对象集合L。
(3)内容的属性的描述:内容是Web页面上的最小对象,它的属性描述相对于层和页面的属性描述而言是比较丰富的。我们在这里对它的一部分基本属性进行描述,对内容的
Layer Name 内容所在的层的名字
Item Name
内容的名字
Title
内容的标题的名字
Title Top
内容的标题在层上的顶边界
Title High 内容的标题的高度
Title Left 内容的标题在层上的左边界
Title Width 内容的标题的宽度
Title Word Color内容的标题的色彩
Title Word Font 内容的标题的字体
Title Word Style内容的标题的风格
Title Word Size 内容的标题的字号
Title Picture
内容的标题为图片时,标识图片的位置
Action Property 点击所引发的动作的属性
Action 动作描述
IACTION-TOP动作影响区域顶边界
IACTION-HIGH 动作影响区域的高度
IACTION-LEFT动作影响区域左边界
IACTION-WIDE
动作影响区域的宽度
Content 内容的文字
Content Word Color 内容文字的颜色
Content Word Font
内容文字的字体
Content Word Style 内容文字的风格
Content Word Size
内容文字的字号
我们把上述属性,称为对象集合T。
在实际编程中,还会需要一些其他的属性描述,在这里就不一一叙述了。
同样,当我们把读者作为对象来进行描述时可以把读者对象的属性分为两部分:
其一,读者的基本属性或者说是读者注册信息,主要反映一个读者的身份标识、读者的兴趣以及爱好等的信息。这类属性包含:
Number 读者编号
Education
教育程度
Type读者类型(个人或组织)
Profession 职业
Userid 用户名
Vocation行业
Password用户密码
Legal ID type
有效合法证件类型
Name姓名
Legal ID Num有效合法证件编号
Member Gender
性别
Credit Card Type信用卡类型
Birthday生日
Credit Card Number 信用卡号码
Address 居住地址
Education
教育程度
我们把上述属性,称为对象集合U。
其二,读者访问属性,描述读者访问时的访问特性,它包含读者访问地址和对读者所访问的最小对象的记录这两个要素。它包含以下的基本元素:
User ID读者标识
Call Type 读者访问类型
Call Record读者访问记录
Call From 读者登录地址
我们把上述属性,称为对象集合Uc。
3 基于对象的数字图书馆模型的建立
基于对象描述的数字图书馆模型
从上面的模型分析和对象属性描述分析,我们可以得到如上图所示的基于对象的数字图书馆模型:
在这个模型中,数字图书馆为读者提供两种类型的服务:
(1)响应读者的访问请求,为读者提供其指定的浏览和检索服务。这种服务通过将读者请求所落在对象集合T∩C中的值映射到资源对象的收藏属性集合P或N中,求出读者的访问需求,来为用户提供服务。
(2)为读者提供主动推送及定制服务。这种服务通过分析对象集合Uc∩C,求出读者的访问需求,来为用户提供服务。同时利用这个结果,指导数字图书馆的资源采集及资源调度服务并为作者和出版商提供读者需求信息服务。