电子政务信息资源元数据标准的设计与实现_电子政务论文

电子政务信息资源元数据标准的设计与实现,本文主要内容关键词为:信息资源论文,电子政务论文,标准论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着网络和信息技术的迅猛发展和政府对政务信息的日益关注和重视,我国在电子政务信息资源建设方面有了长足发展。但是,由于缺乏统一的政务信息管理标准和平台,导致所谓的“信息孤岛”[1][2] 现象日益严重。将元数据应用在政务领域,从各政府部门的信息系统中采集信息资源形成用户资源视图,并通过元数据之间的互操作达到资源互通共享,从而可以解决现存政务资源孤岛问题。本文着重研究政务信息资源及其元数据标准,提出并建立了政务信息资源元数据描述规范——在这个基础设施建设的基础上,进一步可以对元数据的互操作性进行研究,从而使电子政务事务中的互联互通、信息共享、业务协同成为可能。

1 电子政务信息资源元数据标准化的功能与原则

1.1 电子政务信息资源元数据标准的功能

电子政务信息资源元数据是描述电子政务数据集内容的数据,是进行电子政务中信息资源的管理、查询和应用的关键。在进行电子政务元数据标准的设计时,首先要解决的问题是明确利用元数据实现哪些功能。根据对国外常用元数据标准及国内已有较成熟的中文元数据标准进行的研究和分析[3],并结合电子政务各方面的需求分析,归纳出元数据应考虑实现的功能有下列几个方面:

(1)资源描述。从信息共享和数据交互的需要出发, 元数据最基本的功能是用于对信息资源的内容、属性进行详细、全面的描述,以反映信息资源对象的全貌,帮助用户更好地了解数据。

(2)资源管理。提供信息资源的存储和使用管理方面的信息以及权限管理、电子签名、电子印章等方面的信息。

(3)版权管理。提供其拥有者、版权和安全级别等信息内容。

(4)查询检索。支持用户发现资源的能力,即利用元数据提供数据分类、 数据内容、数据质量等方面的信息,为用户提供多层次、多途径的检索体系。

1.2 建立元数据标准的原则

一个具有很好通用性的元数据标准,可以适用很多种类型的资料,那么会有两种可能[4]:一是非常庞大而且复杂,但是具有很好的描述深度,因为所有的情况都已经定义了,比如MARC等;二是非常简单,好学易用,仅仅具有几个非常普遍的属性,但对特定类型资料的描述能力不够。这些也是要在现实需求和发展前瞻之间做出选择的。元数据标准必须满足不同领域、不同地域的要求,被普遍接受、共同遵循。因此,它必须具备简洁、灵活、易于操作和被遵循等特点。按这个标准开发出来的新的元数据必须适用不同领域、不同特色、不同团体的要求。另外,这种新的元数据准则面临着新的挑战——修改原来的准则。新的元数据框架准则必须在已经存在的并正被覆盖的准则共性方面寻求一种妥善的解决方法,必须提供一种正式而通用的管理方法,支持元数据操作和保存。因此,在建立元数据标准时必须注意以下原则:

(1)坚持科学性原则。 科学性原则就是要求编码规则应严格遵守网络上信息传输/交换协议,对信息数据进行编码处理要严格执行运行数据交换的已有标准和协议,使其达到在技术上具有先进性和科学性。对于记录中的元素及其属性说明的描述语言及语法结构应保持严格一致性,要求从实体、属性、联系的角度分析各个标准中元素/字段的设置和意义。在编制元数据标准框架时还应重点突出不同领域的特点。

(2)实用性原则。在设计时对元数据的选择应考虑其在一定范围内的通用性,使其在实际应用中尽可能覆盖多种相似或相近的对象实体,达到既能有效控制元数据数量,又能使编目人员及用户简单易学,提高工作质量及检索效率。同时对广大用户的使用需求,包括检索习惯、对元数据的理解、接受程度等因素都应当认真考虑。因为制定元数据标准的目的是向用户更充分地揭示信息资源(特别是网上资源),用户的需要应是最终衡量标准。因此,在结构与格式的设计、元素的增删、语法及语义规则的制定等方面要尽可能从用户实际需要出发,增加系统与用户之间交互式对话能力(如开放式的人口词表)等。

1.3 政务信息资源的采集原则

首先,我们要明确定义信息资源采集的概念:根据本部门数据特点和重点,以有效管理和共享为目的,按照一定的方法和原则,全面、完整、系统地搜集各种具有价值或意义的数字资源,以形成本部门的信息资源视图,这个过程我们可以称为信息资源的采集。

如图1所示, 信息资源采集的目的是为了能够产生涵盖整个政务业务部门的资源视图,然后利用元数据技术将这些信息资源进行格式化表示,统一保存在政务信息资源元数据库中,为最终建立用户目录服务。

图1 资源采集示意图

信息资源蕴藏在一切信息化设施和应用系统中,政务信息资源主要集中在文本资源、资源集合和政府服务资源三个部分(见图2),分布在各个部门业务数据库、文件系统、帐、表、单、证、Web网页和一切存放数据的数字化空间中, 也可扩展至面向“信息服务”的业务流程中,还包括各种服务和一些资源集合。如何从部门每天产生的数量繁多的业务数据、报表、公文中形成在Web 上可以被其他部门或个人可以访问的有意义的资源,就成了一件不容易的事情。为此,应该加强数字资源的采集、整理、加工,以形成完整的、全方位的政务信息资源保障体系。

图2 政务信息资源UML模型图

各个政府部门在政务信息资源视图的采集过程中,大致应该遵从以下几个原则:

(1)目的性原则。信息资源采集的目标, 就是确定本部门所有值得或应当共享的数字资源,对这些数字资源的特点、范围、类型、结构层次做出总体设计和规划。要紧密结合本部门的职能和特点,做到有的放矢。

(2)系统性原则。 信息资源采集的系统性和完整性是指采集的数字资源要有系统性和完整性。纵向上看,要能够保证本部门职能和业务所需信息的完整;横向上看,要研究和照顾到本部门和其他部门业务交互的需要,能够反映出部门之间相互关联、互为条件的事实,从而保证采集到的信息资源的系统性。

(3)连续性原则。信息资源采集是一个长期、不断持续的过程, 伴随着本部门业务处理的整个过程,直至该项业务被撤销终止。

(4)准确性原则。在现代社会,信息就是价值, 不准确的信息会造成巨大的错误和损失。所以,信息资源的采集应当及时准确地被处理,从而使使用者得到并加以利用。这就要求采集人员有较高的工作效率和强烈的时间观念。

1.4 信息资源的标准化表示原则

当政务信息资源被采集之后,就应对其进行进一步的加工描述,使其适应Web表示,传输和交换。在当前政务领域分布式的异构数据源环境中,基于元数据的政务信息资源格式化表示是达到信息资源有效管理、共享互通的关键,是实现政务信息资源真正的可互操作性,使公众在不知道政府结构和职责分配的情况下获取所需信息和服务的关键。

信息资源一般可以从信息化应用设施的数据系统中提取,但往往需要经过“梳理”的过程,因为数据/信息的生成、维护和信息资源的发现、利用是属于两种不同的描述,尽管都可以应用“元数据”描述。

政务信息资源采集的粒度可大可小,可粗可细,应根据资源的利用要求来科学合理地划分选择,一般有两个原则:(1)适应于政务信息资源注册管理的要求;(2)适应于政务信息资源查询服务的要求。

我们在设计政务信息资源元数据标准的时候,也应该以上述两个原则为依据。

2 电子政务信息资源元数据标准的设计与实现

2.1 e-GIRS的总体结构

在制定标准的过程中,我们借鉴了国外已有的政务元数据标准体系[5],也参考了国内学者在信息资源集合描述上的研究资料[6],吸取了有益的成果。经过实际选择性的调研研究,我们制定了上海市政务信息资源统一描述标准(e-Government Information Resource Standard,e-GIRS)。e-GIRS的总体结构图(如图3)。

图3 e-GIRS的总体结构图

由图中可以看出,e-GIRS主要包括四大部分, 核心元素集合包含可以满足有效检索和管理政务信息资源的数据。限定元素是对核心元素的进一步解释和限定,使得核心元素的语义更加丰富和专指。编码体系与受控词表用来提供对元数据元素的内容数据的控制,通过术语控制、一致的词汇表,能够显著地改善资源的搜寻结果。扩展规则提供了在某个具体政务领域使用标准时,为了适应本部门需要,如何对标准进行扩展的原则和方法。政务资源元数据UML图(见图4)。

图4 政务资源元数据UML图

经过对各种元数据模型的反复研究,在元数据的通用性方面,我们认为DC无疑是最能满足通用性的元数据。而且其应用范围广泛。因此,我们在设计政务信息资源元数据核心元素时复用了DC的部分元素,并且根据政务领域的需求扩展了相应的元素。这样可以保证现在各部门标准的一致性与整体性的基础上,最大限度地体现不同系统和不同资源的特征。使标准具有强大的包容性和灵活性,并且便于建立和其他领域元数据标准的映射关系,有利于标准的推广使用。

2.2 e-GIRS的核心元素集

e-GRMS继承了DC 的数据模型(“刺猬模型”):一个单一的资源实体上丛生多个属性——“元素”,因为每一个元素都可以被看作是描述资源的一个属性,每个元素都有具体的字符串值。

e-GRMS元数据标准包括:核心元素、限定元素、 编码体系与受控词表和扩展规则等四大部分。其中e-GRMS核心元素有25个,描述如表1。

表1 e-GRMS核心元素集

术语名称 定义

题名(rsTitle) 赋予资源的名称

发布日期(pubDate) 管理者对资源进行发布的日期

货源更新日期(updateDate)

资源最后更新的日期

货源摘要(abstract) 资源内容的简单说明

资源负责方(IdPoC) 对资源的完整性、正确性等负有责任的单位的名称和地

址信息

资源格式信息(fmInfo)

资源传送格式的基本信息

关键字说明(descKeys)

关键字种类和参考资料

空间范围(spatDom) 资源涉及的空间范围

时间范围(timePeriod)

资源的时间覆盖范围

资源使用限制(useConsts)为资源的安全、保护隐私权或知识产权,对使用资源施

加的限制或约事

资源安全限制分级(secClass) 对资源处理的限制级别的名称或代码

资源安全保密期限(secPeriod)资源保密的期限规定

资源适用对象(audience) 资源适用的对象说明

资源语种(rsLang)

对资源处理的限制级别的名称或代码

资源字符集(dataChar)

资源使用的字符编码标准全和

资源分类(tpCat)资源的分类信息

数据志说明(statement) 资源生产者有关资源数据志、来源、处理等信息的一般

说明

在线资源链接地址(onlineSre)可以获取资源的网络地址

资源类型(type) 资源的表现分类

资源标识符(resID) 政务信息资源的唯一不变的标识编码

元数据标识符(mdID) 元数据的唯一标识

元数据语种(mdLang) 元数据使用的语言

元数据联系方(mdContact)() 对元数据负责的人或单位的名称和地址信息

元数据安全限制分级(mdClass)对元数据的处理限制的名称

元数据创建日期(mdDateSt)

创建元数据的日期

当描述一个具体的政务信息资源实体时,创建者(creator)、标题(title)、日期(date)、主题(subject)、资源标识符(identifier)是强制拥有的,其他的元素则可选。有了这五个强制元素信息,我们就可以有效地描述一个资源实体并可以查找到该信息资源的位置。比如对于一个具体的水务信息资源的简单描述可以如表2所示。

表2 资源描述元数据实例表

rsTitle 临时停止供水或者降低水压的审批

pubDate 2004—4—29

abstract关于临时停止供水或者降低水压的审批流程

IdPoc

上海市水务局

DescKeys网上办事 供水

SecClass主动公开

TpCat

水务

onLineSre

http://www.shanghaiwater.gov.cn/l-wsbs/swsp-306.jsp

2.3 电子政务信息资源元数据标准的具体实现

根据前面两章对电子政务信息资源和元数据的探讨与研究,在建立元数据标准准则和根据需求明确了元数据功能的基础上,我们开发出了电子政务信息资源描述标准的体系结构(见上页图5)。

图5 政务信息资源描述标准体系结构图

我们在政务信息资源元数据的探讨和研究基础上,结合上海市电子政务元数据研究试点单位——上海市水务局,制定了该局电子政务报表的信息资源元数据描述图表(见表3)。

表3 上海市水务业务受理中心通报报表

部门名称 上海市水务业务受理中心 必选

报表名称

业务受理通报报表

必选

报表别名

通报报表

可选

水务业务受理中心对受理的申请形成的通报报表。

报表内容描述

主要内容包括申请单位的信息、申请情况说明和受

必选

理与许可说明。

关键字 水务,行政许可,业务受理,通报,报表。 必选

通报单位,单位名称,地址,邮编,法定代表人(负责

组成报表的数据项

人),职务,组织机构代码,联系人,电话, 文书送达地

址,邮编,申请许可项目名称,申请许可行业分类,申

请情况说明,受理情况说明,许可审批结论。

报表产生方式

系统产生

必选

产生报表的系统 电子政务二期协同办公系统

可选

报表发布日期 必选

报表更新时间说明

不定期更新 必选

公开属性

公开

必选

保密性可选

报表使用范围 可选

报表适用对象 可选

报表语种

中文

必选

报表分类

AB9/G/01/05(上海市水务局/行政办事/行政许可必选

审批/行政许可统计报表)

报表的格式可选

在线/离线获了途径 必选

元数据创建部门 上海市水务局信息中心

必选

元数据创建者 必选

元数据创建日期 2006—11—30

收稿日期:2007—02—27

标签:;  ;  

电子政务信息资源元数据标准的设计与实现_电子政务论文
下载Doc文档

猜你喜欢