基于元数据的政府信息资源目录系统应用研究_元数据论文

基于元数据的政务信息资源目录体系应用研究,本文主要内容关键词为:信息资源论文,政务论文,体系论文,目录论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G203;G257;G350[文献标志码]A[文章编号]1005-8214(2009)10-0042-04

当前,我国电子政务正在进入一个以深化应用为显著特征的新阶段,要求电子政务建设必须从政府的一整体职能出发,围绕经济调节、市场监管、社会管理、公共服务等方面建设跨部门的协同政务应用,这就对政务信息资源的整合和共享提出了迫切的需求。我国电子政务工作在系统建设、系统部署等硬环境方面已经取得阶段性成果,但在标准规范、构建政务信息资源目录等软环境建设上还存在着问题,主要表现为信息资源共享困难和互联互通障碍。因此,加强电子政务软环境建设,应把构建政务信息资源目录体系作为解决资源共享困难的关键途径之一。

1 政务信息资源目录体系概念

电子政务信息资源目录体系可从不同的角度给予定义,从技术的角度定义为:“以元数据为核心,以政务分类表和主题词表为控制词表,对政府信息资源进行网状组织,满足从分类、主题、应用等多个角度对政府信息资源进行管理、识别、定位、发现、评估与选择的工具”。[1]

在2008年3月1日正式执行的国家标准(GB/T21063.1-2007)“政务信息资源目录体系第1部分:总体框架”中,对政务信息资源目录体系是这样定义的:“政务信息资源目录体系(government information resource catalog system)是由目录服务系统、支撑环境、标准与管理、安全保障等组成的整体。目录服务系统是通过编目、注册、发布和维护政务信息资源的内容,实现政务信息资源的发现和定位系统”。[2]

2 政务信息资源目录服务体系的基本功能与作用

2.1 基本功能

目录服务系统的基本功能包括目录内容编目、注册、发布、查询、维护。编目提供公共资源核心元数据和交换服务资源核心元数据的编辑功能;注册是指政务信息资源目录提供者向政务信息资源目录管理者提供公共资源核心元数据和交换服务信息资源核心元数据登记;发布是指管理者通过目录服务器,把政务资源核心元数据库的内容发布到一站式系统中;查询是指为应用系统提供标准的调用接口,支持公共资源核心元数据和交换服务资源核心元数据的查询。[2]

2.2 主要作用

政务信息资源目录体系是整个政务信息资源共享和开发利用的基础设施。政务信息资源目录体系的主要作用是实现对信息资源的发现和定位,同时对于加强信息资源的管理以及整合利用也有很大的作用。

通过政务信息资源目录体系可以解决政务信息资源管理的基本问题(3WH),即What——有什么政务信息资源?Where——需要的信息在哪里?Who——谁提供?谁使用?How——如何发布?如何查找?如何使用?

3 政务信息资源目录服务体系架构及技术框架

政务信息资源目录体系主要由政务信息资源目录服务系统组成,同时还具备软硬件、网络的支撑环境,以及标准与管理规范建设和安全保障。[2]

政务信息资源目录体系技术框架(如图1所示)主要由两类目录组成,即公共资源目录和交换服务目录。公共资源目录主要针对的是数据,提供政务信息资源目录信息,以便发现和定位信息资源;交换服务目录主要针对的对象是数据交换服务资源,提供交换服务地址等目录信息,以便发现和定位交换服务。

图1 政务信息资源目录体系技术框架

目录体系建设和使用过程中存在三类角色:信息提供者、信息使用者和目录信息管理者。信息提供者负责信息的编目、注册,保证编目信息的正确性和实时性。信息使用者通过网站和应用系统查询公共资源目录和交换服务目录,发现所需信息。目录信息管理者负责资源目录的建立和管理,并保证目录信息的安全和维护。根据政务信息资源公开和政务部门之间松耦合的特点,在目录服务系统的设计和实现主要基于Web和Web Service技术。

4 实现的相关技术

4.1 Web Service技术

Web Service是封装单个实体并发布到网络上供其他程序使用的功能集合,是用于创建开放式系统的构件,有效地满足面向互联网的复杂应用。Web Services的主要目标是在现有各种异构平台的基础上构筑一个通用的与平台无关、语言无关的技术层。它具有互操作性、普遍性、易于使用和行业支持的特点。其体系结构中的Web服务具有下列三个组件和功能:即Web服务提供者、Web服务请求者和Web服务注册中心。

Web服务提供者设计实现Web服务,将Web服务发布到服务代理的一个目录上,Web服务请求者需要调用该Web服务时,首先在服务代理目录中查找满足条件的Web服务,并获得Web服务的描述信息(WSDL),然后根据描述信息去调用服务提供者发布的服务,实现与服务的绑定,最后服务请求者与服务发布者之间直接进行通信,完成服务的提供而无需其他代理。[3]

Web Service采用标准的因特网通信协议,如HTTP、SOAP、UDDI、WSDL、WSFL等,以实现服务的描述、注册、发布、发现、检索、交换、管理等功能,因此能更好地适应于政务信息资源共享的应用。

4.2 元数据

元数据最本质、最抽象的定义为:关于数据的数据。它是专门用来描述数据的特征和属性的,提供某种资源的有关信息的结构数据(structured data),如创建者、标题、日期、内容摘要、数据质量等,从信息内容、载体形态、信息集合、组织体系、管理与服务机制等方面去描述信息资源的特征和属性。借助元数据,用户可以采集、组织、识别、定位、发现、评估和选择信息资源,实现简单、高效地检索、交换、管理海量数字化信息资源。运用XML标识语言,通过元数据与分类表、主题词表的结合,组织信息资源分类目录、主题目录和其他目录,实现对数字资源的导航、检索、定位和交换服务。[4]

政务信息元数据用于描述政务信息资源的内容、表示方式、管理方式、获取方式等,是实现政务信息资源共享及有效管理的核心内容之一。

4.3 信息资源分类原则

政务信息资源分类是电子政务的基础性工作,是政务信息资源采集、加工、存储、保护和使用的必要工具,是信息资源核心元数据的必选项之一。其分类的基本原则如下:

(1)科学性和稳定性。选择符合政务信息相对稳定的本质、符合分类功能定位的属性作为划分标准。建立稳定的分类体系,确定分类对象要以选择政务信息相关稳定的本质属性或特征作为分类的基础和依据。政务信息资源分类既要体现政务信息资源的特点,又要考虑用户的现实需求。

(2)系统性和完整性。大类的设置以能够覆盖电子政务各个领域和知识范畴为原则,划分后所得各子类外延之和等于其母类的外延,避免不完全划分和多出子类。在每一个分类中,大类以及类目层级排列应符合事物本身的逻辑关系,按照一定的顺序进行排列,形成一个较合理的分类体系,每一分类对象在分类体系里占有一个唯一的位置,既反映出它们之间的区别,又反映出彼此之间的联系。在分类中,一个政务主题概念对应着一个类目,并且该类目只能隶属于一个上位类。类目的划分一般应采用同一标准,并且划分是连续的、逐层深入的,避免跳跃式的展开,以保持其系统性。

(3)唯一性和可扩展性。在每一次划分时,只使用一个划分标准,不能同时使用两个或两个以上的划分标准,否则会出现划分后所得各子类相互交叉、重叠的混乱现象。同一级类目的设置应留有足够的发展余地,以便在增加新的类目时不打乱已建立的分类体系,并且还应考虑低层级子类目的延展和细化的可能性。

(4)实用性。在遵循科学性和稳定性、系统性和完整性、唯一性和可扩展性原则的基础上,应根据具体情况使类目的设置实用和可操作。

4.4 信息资源唯一标识符

政务信息资源标识符是元数据中用来对信息资源进行唯一标识的元素。标识符就是在信息分类的基础上将信息对象(编码对象)赋予具有一定规律的、易于人机识别处理的符号,从而确定信息资源的位置。

国外对信息资源标识采用集中和分布管理相结合的分段式管理。信息资源标志通常分为前段码和后段码,前段码由统一的机构去负责分发来维护和管理,后段码由各级代理机构管理和分发。国际上的信息资源标志方案中,最著名的有美国的数字对象标识体系(Digital Object Identifier,DOI)和英国的信息资产登记注册库标识码(Information Assets Register Number,IARN)。参照国际上通行的做法,结合我国信息资源标识的发展趋势,政务信息资源编码采用两段式基本结构,前段和后段之间用“/”分开。前段码由信息资源前段码管理中心统一管理和分配。后段码由拥有前段码的目录中心或部门自行分配和管理,但必须保证其唯一性。拥有前段码的目录管理者或政务部门可以在编目无数据时生成后段码,以实现对政务信息资源的唯一标识。

5 信息资源目录服务体系的构建与实现

5.1 政务信息资源目录与条目格式

政务信息资源目录一般是由政务信息资源分类目录和信息资源目录组成的(如图2所示)。分类目录由按不同应用主题建立的信息分类体系组成。政务信息资源目录有基础信息目录、部门信息资源目录、应用共享信息资源目录等,通常由描述信息资源的名称、主题、摘要或数据元素、分类、来源、提供部门等元数据组成。

政务信息资源目录遵循相应的信息资源描述标准规范编制,如描述网络资源的都柏林核心元数据DC、美国政府信息资源元数据GISL、《政务信息资源目录体系》国家标准等标准规范,主要包括政务信息资源分类标准、唯一标识符编码、核心元数据等。[5]

政务信息资源目录条目是供资源使用者发现、检索和开发利用资源的信息,目录条目中不包括对资源注册和管理方面的信息。通过参考目前流行的DC标准,政务信息资源目录条目应有如下数据项:目录标识、名称、替代名称、出版日期、更新日期、负责单位、关键词、摘要、使用限制、访问中介、分类类目名称、类目编码、分类标准、类型、字符集、安全限制分级、安全保密期限、语种、在线资源链接地址等。

5.2 目录服务系统功能设计

目录服务系统的详细功能包括:发布、查询、资源定位链接、维护、日志分析、服务监控、用户反馈、权限管理等。

(1)发布。发布是管理者根据各分类的编目规则为入库资源进行分类,发布最新入库的元数据并通过目录服务系统根据目录服务的要求,从政务信息资源元数据库中导出注册成功的政务信息资源目录信息,生成资源目录条目,并导入到政务信息资源目录库中,供用户访问。

(2)查询。查询是目录服务系统通过HTTP或者消息访问接口提供用户查询目录信息的功能。目录查询支持用户按照分类、单项条件和组合条件三种方式进行。除此之外,还可以按主题词联想查询、快速定位、下载公开目录、查询资源在各个分类中的目录位置、下载结果列表。

(3)资源定位链接。资源定位链接是对资源目录条目中包含的获取资源的信息进行链接或访问。如果信息资源是在网上(外网或内网)发布的信息,目录服务系统提供访问资源的URL链接;如果资源所属的部门还没有提供在线访问或交换服务的方式,用户可以通过目录条目中的资源负责单位信息和资源的使用限制信息,离线方式获取资源。

(4)维护。维护包括目录结构树和目录条目信息的维护。当资源的分类体系发生变化时,目录服务系统要调整目录结构。当资源条目信息需要修改、删除、添加和更新时,目录服务系统支持管理员通过后台实现这些操作。除了对目录结构和内容的维护以外,目录系统还应该提供辅助的系统功能,主要包括:①日志分析。根据元数据查询日志,统计访问中心网站的次数,统计不同政务信息资源元数据的查询次数。②服务监控。监控目录服务器、网站的运行。③用户反馈。管理用户的反馈意见,并和提供者进行协调。④扩展目录服务系统的分类编目方案,根据不同的应用需求提供多个目录索引,并根据用户的特点提供个性化目录服务。

(5)权限管理。给不同的用户分配不同的访问权限,以保证用户可以正确地访问资源目录信息,并且保护目录系统目录信息的安全。根据用户的划分和目录服务系统安全管理的需求,把用户分为三类:第一类是公共用户,可以访问公共的信息资源目录信息;第二类是政务部门用户,可以访问公共的信息资源目录信息和有限的交换资源目录信息;第三类是目录服务系统管理者,负责对目录服务系统的管理、目录信息的更新和维护等工作。在这三个角色中分别设定几类权限等级,此权限等级对应资源的六大安全等级(全社会、本单位、限制、秘密、机密、绝密)。用户在使用目录服务系统时,系统会根据用户的权限确定用户可以执行的操作和过滤,阻止用户的非法操作,并且会根据用户的权限和目录条目中资源保密属性过滤用户执行目录查询的结果。

5.3 目录服务系统实现

系统是建立在以互联网技术为核心、以Web技术为基础的B/S集成环境之上的应用系统。以网络环境为支撑,通过开发工具建立一个开放式查询和浏览平台,融合Microsoft IIS、Java和ASP.NET等技术。

系统由三个逻辑层组成:数据层、业务对象层、客户层。数据层位于系统底层,主要处理业务对象层对数据提出的请求和存储各类政务资料目录数据。业务对象层为系统的核心,处理如何访问数据以及如何将请求的数据分发到客户端。客户层向用户提供应用的接口,运行在Web浏览器环境下,通过系统提供的功能与后台数据库交互实现各项信息查询和数据的维护。Web服务接口提供用户通过消息实现目录服务,HTTP接口提供用户直接通过浏览器查询和管理目录服务。HTTP接口一般是目录体系中必须实现的,而消息访问接口可以根据各自的实际情况选择实现。

系统开发平台以Windows 2000/XP+IIS5+Microsoft Visual Studio.net框架作为平台,在目录服务方式中,HTTP目录访问方式采用Java+tomcat开发,目录服务器端部署Java Ejean和Servlet处理用户的请求和完成与目录库的交互,前台提供JSP页面作为。http接口,并提供用户访问目录服务系统的界面。

6 结束语

本文根据目前我国电子政务发展的特点和实际需求,提出了基于元数据的电子政务目录服务系统的框架结构,并作了一定的尝试。政务信息资源共享是政府协同办公的基础,最终目的是实现“一门(站)式”服务。政务信息资源交换体系、政务信息资源目录体系国家标准的颁布实施,为电子政务建设进一步明确了方向,但在技术实现上还任重而道远,在实施方式和功能上还需进一步研究和完善。

[收稿日期]2009-06-01

标签:;  ;  ;  ;  

基于元数据的政府信息资源目录系统应用研究_元数据论文
下载Doc文档

猜你喜欢