论政府信息资源的元数据标准,本文主要内容关键词为:信息资源论文,标准论文,政府论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 政府信息资源及其元数据描述的意义
政府信息资源是一切产生于政府内部或虽产生于政府外部但却对政府业务活动有影响的信息资源的统称[1]。它涉及政治、经济、科技、军事、文化等众多领域,包括政府决策信息,为社会各界服务的信息,反馈信息和政府间交流信息。
政府信息资源具有价值高、数量大、储存分散、搜寻难等特点。在网络环境中,政府机关必须善于利用网络组织、管理、查找、利用政府信息资源,以减少重复劳动,改善工作效率,提供便民服务。广大民众则迫切希望利用网络跨越政府机关多层、分散组织的障碍,搜寻、判断、获取符合需求的政府信息,提高政府信息的可获得性以及检索政府信息的查准率和查全率。近年来,随着政务公开和电子政务的逐步开展,政府业务的信息化、网络化程度的提高,越来越多的政府信息资源以数字化形式产生、储存,并通过政府内部网和互联网传播、利用。为了提高政府信息资源尤其是政府网络信息资源的管理和利用水平,需要针对政府信息资源的特点制定新型的标准化政府信息资源描述机制。
元数据是关于数据的数据,可处理各种形式的数字化和非数字化数据资源,特别是能较好地解决网络信息资源的描述、发现、控制和管理问题。所以,建立政府信息资源元数据标准是有效描述政府信息资源,实现政府信息资源高效发现和交流的基础。
2 政府信息元数据标准的发展
目前,在实践中应用于政府信息资源描述、发现、管理的元数据标准主要有两种:GILS和DC- Government。
2.1 GILS的发展
GILS(Government Information Locator Service,政府信息定位服务)是20世纪90年代由美国联邦政府应用元数据的理念设计的一种支持公众搜寻、获取和使用政府公开信息资源的分布式信息资源及利用体系。对于GILS,有的学者认为是一种信息检索系统,该系统依据国际标准建立,可跨机构查询政府信息,是国家信息基础设施(NII)的一部分;有的则认为是一种元数据格式,依据信息特性设计元数据元素,可展现某种知识架构,分析资料来源,保障资料安全,避免使用者直接存取实际资料可能造成损失或蓄意破坏的风险;从字面上看,GILS又像是一种服务形式。GILS代表“系统”、“元数据”及“服务”等概念[2]。
从信息组织的角度看,GILS体系是一组分布式信息资源目录的集合。其基本构建要素是这些目录中对具体资源进行描述的元数据,即GILS定位记录(Locator Record)。它是一组相关数据元素的集合,用来描述信息资源的内容、位置、服务方式、存取方法等。
美国政府信息定位服务由3种标准构成:技术标准、信息组织标准和控制词表标准。其中大部分规定在GILS应用纲要中,包括元数据核心集、信息检索标准(Z39.50)等。根据GILS应用纲要第二版,目前GILS核心栏目共有28个,依元素的性质可区分成:必备/可选(mandatory/optional)、重复/不可重复(repeatable/not repeatable)及受控/不受控(controlled/ uncontrolled)3种类型。按其描述对象,可将GILS核心元素分为信息的拥有者和建设者、信息的内容、信息的表示方式以及管理信息4类[3]。具体内容如下:
(1)资源的拥有者及建设者:Originator(始创者),Contributor(贡献者),Access Constraints(取用限制),Use Constraints(使用限制),Point of Contact(联系点)。
(2)资源的内容:Title(题名),Language of Re-source(资源语言),Abstract(摘要),Controlled Subject Index(受控主题词索引),Subject Terms Uncontrolled (非受控主题词),Spatial Domain(地理位置),Source of Data(数据来源),Methodology(方法论),Supplemental Information(补充信息),Purpose(目的),Agency Program(机构计划),Cross Reference(相互参照),Language of Record(记录语言)。
(3)资源的发布信息:Date of Publication(出版日期),Place of Publication(出版地),Time Period(时间), Availability(可获性)。
(4)资源的管理信息:Schedule Number(目录号),Control Identifier(控制号),Original Control Identifier(原始控制号),Record Source(记录来源),Date of Last Modification(最后修正日期),Record Review Date(记录审核日期)。
除了核心元素,GILS应用纲要也赋予具体政府机构自行定义元素的弹性,使机构能在标准化的原则下也能兼顾其特殊的需要。但是在信息交换时,只能就核心元素进行处理。为了使不同格式的元数据间能够自由交换信息资源,美国国会图书馆将GILS与Dublin Core及USMARC的元素相互对照,试图整合现有的所有信息系统,同时试图结合XML发展相关软件。
目前,由于美国政府的大力推动,GILS已成为美国政府信息资源的描述标准,并且在日本、俄罗斯等国家得到广泛应用。
2.2 DC-Government
1999年10月25日,DCMI(都柏林核心元数据首创计划)成立了政府工作组(DCMI Government Working Group,DC-GOV WG)。该组调研了政府部门应用DC的现状和共同点,为DC应用于政府部门应增加的元素和修饰词提出了建议。2001年6月,大部分欧洲国家以及澳大利亚、加拿大和新西兰政府部门的代表在布鲁塞尔召开MIReG(Managing Information Resources for e-Government)研讨会,成立了MIReG工作组。2001年9月17日,DC-Government工作组和MIReG工作组联合发布了专门针对政府信息资源管理的应用纲要DC-Government Application Profile[4]。该应用纲要提出:直接将DC元数据集的 15个元素(题名、创作者、主题、描述、出版者、其他责任者、日期、类型、格式、标识符、来源、语言、相关资源、范围、版权)及其修饰词复用到DC-GOV命名域上,并在DC-GOV命名域内补充一个新元素——Audience(受众),并增加了5个DC元素的限制属性。具体的扩展如表1[5,6]:
表1 DC-Government对DC所做的扩展
┌──────┬────────┬──────────────┬────────────────────────┐
│DC元素 │修饰词 │定义│注释│
├──────┼────────┼──────────────┼────────────────────────┤
│Date│Acquired│资源被接收的日期││
├──────┼────────┼──────────────┼────────────────────────┤
│││被描述的资源是另一资源的翻 │IsVersionOf显示了资源纵向的从一个阶段到另一个
│
││IsBasedOn
││阶段的演化过程,IsBasedOn显示的是资源横向间的
│
│││译或解释,基于另一资源 ││
│Relation│││联系,包括内容相同或相似的另一语言版本,或此资 │
│├────────┼──────────────┤│
│││被描述的资源被另一资源翻译 │源的产生使用了另一资源。例如:一个法案“IsBase- │
││IsBasedFor ││dOn”一个立法建议书,一个出版物“IsBasedOn”一篇│
│││或解释,是另一资源的基础││
││││研究论文。 │
├──────┼────────┼──────────────┼────────────────────────┤
││Access │规定资源被使用的条款│资源的安全或公开登记。例如:保密、内容使用、公 │
││marking ││开。│
│├────────┼──────────────┼────────────────────────┤
││Previous│Access marking被改动前的││
││Access │Access marking ││
│├────────┼──────────────┼────────────────────────┤
││Access marking │││
│Right
││Access marking被改动的日期 ││
││change date │││
│├────────┼──────────────┼────────────────────────┤
││Access Right│使用资源的限制 ││
│├────────┼──────────────┼────────────────────────┤
││Copyright
│资源的版权状态 ││
│├────────┼──────────────┼────────────────────────┤
││Security│资源的密级,显示它的官方保密│此修饰词的目的是适当地管理敏感和保密文件。例│
││Classification │状态和其他的获得限制│如:绝密、保密、机密等。│
├──────┼────────┼──────────────┼────────────────────────┤
│││按照既定的分类系统确定的比 │与Subject/Keyword不同,它是宽泛的分类,而不是特 │
││Category│││
│││较宽泛的主题分类│定的关键词,可以用在主题指南里。│
│Subject ││││
│├────────┼──────────────┼────────────────────────┤
│││有针对性地描述特定资源主题 ││
││Kevword ││规范词表或主题词表里最低层的词 │
│││的词││
├──────┼────────┼──────────────┼────────────────────────┤
││││这个元素使检索可以限定到某个层次,也控制着对│
││Aggregation │集合的层次,一种资源可能是另│文件的管理行为。应和Relation/HasPart一起使用, │
││level
│一些资源的集合 │它描述了资源在一个等级体系中的位置。Relation可以│
││││描述这个等级体系中是否有其他的资源。│
│Type││││
│├────────┼──────────────┼────────────────────────┤
││││例如英国的政府信息资源有4种类型:Policy,Case, │
││Dossier type│卷宗或集合的类型││
││││Parliamentary Question,Ministers Case。│
│├────────┼──────────────┼────────────────────────┤
││Item type
│单个资源的类型 ││
└──────┴────────┴──────────────┴────────────────────────┘
目前,DC-Government工作组所进行的工作主要有:①继续进行政府使用DC元数据情况的调查,以发现政府元数据发展的关键难题,并对今后DC政府元数据提出建议;②继续完善政府元数据应用纲要;③起草关于应用DC描述政府服务的需求文件;④制定政府服务描述的指导方针:⑤继续收集整理网站的原始材料[7]。
迄今为止,澳大利亚的AGLS,英国的e-GMF,加拿大的TBITS39.1以及新西兰、丹麦、芬兰、爱尔兰等国家都在DC的基础上建立了政府信息资源元数据格式。
2.3 GILS与DC-Government的比较
近年来,GILS和DC-Government得到广泛应用,甚至在同一团体中同时应用。这些团体中有一部分认为GILS和DC-Government是互补的,但另一部分却认为GILS和DC-Government彼此造成混乱。为消除混乱,GILS和DC-Government发表了联合声明,陈述了两者的异同[8,9]。
首先,从性质与使用范围来看,DC-Government与GILS都属于描述性元数据,不仅可以描述网络虚拟信息资源,还可以描述实体资源。与此同时,两者都强调网络信息资源的发现功能。
其次,从语义结构来看,一方面DC-Government和GILS都强调元素语义与MARC环境中使用的通用书目概念具备互操作性。另一方面,DC-Government和GILS都是使用ISO 11179(数据元素的规范化与标准)定义元素语义,彼此在语义上具有良好的映射。
第三,从句法结构来看,DC-Government并未定义具体的句法,因此在句法结构方面具有很大的灵活性。用DC-Government描述信息资源后形成的元数据,可以作为独立的元数据记录、存储和传递,也可以作为信息资源数据的一部分嵌入信息资源中。采用的表示方法一般有基于HTML、基于XML和基于XML/RDF三类。而GILS记录在实际传输中可采取4种记录格式:USMARC格式、GRS(Generic Record Syntax)格式、SUTRS(Simple Unstructured Text Record Syntax)以及HTTP协议支持的格式。
最后,从扩展性来看,DC-Government本身就是 DC一个扩展集,其元素或修饰词均可根据需要使用复用、新建等方法做进一步的增加。GILS则通过两种途径进行扩展,即具体的使用指南和直接在GILS规范中增加元素或子元素。
由上可知,GILS较之DC-Government在专业元素设置、应用实施成熟度方面占优势,但从长远发展角度来看,由于DC作为资源描述格式在全球应用是大势所趋,采用DC核心集的扩展应用有利于资源共建共享,而且DC的可扩展性、互操作性和资源发现功能必将使DC-Government占据未来政府信息资源描述领域的主流地位。
3 政府信息资源元数据的本土化
政府信息资源元数据标准的本土化工作是近几届DC元数据会议讨论的热点。GILS、DC等都是相关国际组织制定的适应广泛需求的标准体系,而在具体应用实现的时候,则会受到各国政府的基础建设、资源状况、社会需求甚至是政治、文化、经济等各个方面的影响。如何结合本土需求更好地应用相关元数据标准,是各国政府共同关注的问题。目前,许多国家的政府元数据本土化制定工作已经取得了相当的成果,制定了符合本国需求的元数据规范。
3.1 美国政府大力推广GILS
目前,GILS在美国得到广泛应用。美国联邦政府的各个部级机构基本上都已建立了GILS服务器,例如商务部、国防部、环境保护署等。而且美国多数州级政府也开始建立GILS服务系统,如佛罗里达、纽约、加利福尼亚、华盛顿等州政府机构[10]。
美国政府出版局(GPO)的GILS站点上除可检索该部门的GILS记录外,还存储了另外35个联邦机构的GILS记录供检索,提供了政府机构的GILS站点目录,并可远程检索7个联邦部级机构的GILS数据库。美国NTIS(National Technical Information Service)建立了一个称为FedWorld[11]的网站,可在37个联邦GILS数据库中任选一个进行检索,其中有些存储在相应机构的网站中。检索时可用布尔逻辑式,可用邻接检索,并可要求系统按相关度、字顺或反字顺排列检索结果。美国纽约州GILS站点提供了检索该州政府、议会和法院系统各种信息的统一界面,可浏览和检索关于机构、法律、案件和地理的信息,可联人有关机构的网站,并可联人联邦政府GILS核心站点。
值得一提的是,目前美国有部分州政府的信息项目也采用了DC核心的元数据,例如明尼苏达州的环境信息网关计划(Minnesota’s Gateway to Environmental Information)、得克萨斯州的记录和信息定位计划(Texas Records and Information Locator)。
3.2 澳大利亚的AGLS
澳大利亚政府定位服务AGLS(Australian Government Locator Service)是一个基于DC元数据集的用于资源发现的元数据标准。1998年初在跨部门跨学科研究团队的共同努力下,澳大利亚国家档案馆(NAA)制定了AGLS元数据集。NAA是AGLS元数据集的维护机构。2002年12月,AGLS作为澳大利亚标准AS 5044出版。目前澳大利亚联邦政府机构已经强制使用AGLS作为描述政府信息资源的元数据集。
AGLS元数据标准有19个基本描述元素,包括 15个DC元素和4个附加元素(Availability(可获性),Function(功能),Audience(受众),Mandate(命令)),并对15个基本DC元素的限定词作了修订。 AGLS标准规定的5个必备元素是Creator、Title、 Date、Subject或Function、Identifier或Availability[12]。
AGLS与DC的区别在于:AGLS既可以描述在线资源(如网页或其他网络资源),也可以描述离线资源(如书本、博物馆对象、绘画、文件等);AGLS不仅可以用来描述信息资源,还可以描述政府服务和机构;AGLS与DC在限制属性和必备元素方面有所不同。
3.3 英国的e-GMF、e-GMS和e-GIF
英国政府在2001年5月2日发布的电子政府元数据框架e-GMF(e-Government Metadata Framework)陈述了英国政府关于建立和实现官方信息系统元数据的政策,概述了元数据在政府中的作用和应用方针,列出了发展、管理元数据结构和标准的原则。同时,框架还包括关于描述元素和限制属性的电子政府元数据标准(e-GMS)及其使用指南。e-GMF确认了以DC作为e-GMS的基本标准,增加了与政府信息相关的元素,开发出元数据应用纲要和政府叙词表(pan-government thesaurus)(后来搁置了)。e-GMF提出建立和发展e-GMS的原则是:①独立性,②易用性,③与其他英国政府标准协调统一,④与国际标准协调统一,⑤稳定性,⑥可扩展性,⑦经济性,⑧实现最大程度的互操作性[13]。
e-GMS是e-GMF(后为e-GIF)的一部分,主要是用于资源发现和记录管理。2002年9月4日,发布的e-GMS vl包括21个元素,除了DC的15个元素外,还增加Accessibility(可获性)、Audience(受众)、Disposal(处理)、Location(位置)、Preservation(保存)、 Status(状态)6个元素。2003年5月16日发布的e-GMS v2在v1的基础上再增加4个元素:Addressee(受信人)、Aggregation(集合)、Digital signature(数字签名)、Mandate(命令),并确定Creator、Date、Subject Category、Title为必备元素。e-GMS对每个元素给出了明确的定义、目的、限定词、备注、职责、示例、用法、HTML语法、编码方案,以及与其他元数据(DC、LOM、GILS、AGLS、GI Gateway)建立的映射[14]。
电子政府互操作框架e-GIF(e-Government Interoperability Framework)是一个能使信息在政府部门中无间传递并,为公民和企业获取公共服务提供更有效途径的机制。框架在2000年9月提出,目前已经在所有公共部门中强制使用。框架强调的是政府信息的互操作性和交流的互动性,它包括:①达到互操作性的政策和规范,②浏览界面的主要规范,③XML数据交换和互联网WWW技术标准[15]。现在,英国政府全力发展e-GIF,e-GMF已经整合到e-GIF中,e-GMS也成为e-GIF中的一部分。
3.4 加拿大的TBTTS 39.1标准
20世纪90年代,由于美国大力推动,GILS一直处于政府信息元数据标准的领导地位。1995年加拿大财政委员会(Treasury Board)在其电子文档标准工作组下成立了GILS小组(GSG),提出修订GILS应用纲要的建议。1998年12月30日加拿大发布了 GILS指导手册并且进行GILS的试验性项目。但基于GILS的TBITS标准得不到多数部门采用;支持GILS运行的系统不可靠;而且近年来政府信息主要通过互联网进行交流;在世界范围内,DC成为事实上的互联网元数据标准;GILS除美国外缺少其他国家的支持,因此,加拿大放弃了GILS计划,转而建立基于DC的网上政府(GOL)元数据框架[16]。
首先,Treasury Board制定了5个必备的通用观感(Common Look and Feel,CLF)元数据元素:Creator,Date,Language,Subject和Title。这5个元素构成了GOL框架的基础,它们与DC的相应元素一致,并运用DC语法来表达。各部门必须用它来描述网上的政府信息资源。
在此基础上,加拿大在2001年11月8日公布了TBITS 39.1标准,它采用DC元素集作为政府机构描述网上政府信息资源的元数据标准。它规定当CFL的5个元素不能充分描述网上政府信息资源时,各政府部门和机构可以用其他DC元数据(包括Audience元素)来进行描述[17]。
此框架还概述了通用的DC标准与特定领域的扩展之间的关系,这保存了两者之间高层次的一致性和互操作性,特别是与原数据模式GILS实现了最大限度的互操作。
3.5 新西兰的NZGLS
新西兰政府定位服务项目NZGLS(The New Zealand Government Locator Service)是新西兰官方的关于政府信息(网上和非网上的信息)分类、发布和发现的项目,它的目的在于使政府机构和公众之间的交流更有效。该项目包括[8]:
(1)NZGLS元数据标准:政府机构用来描述信息和服务的描述结构。它由新西兰档案馆管理。新西兰政府用于创建资源发现元数据的官方标准主要基于两个标准:一是DC元数据元素集;二是澳大利亚政府定位服务标准。最新的版本是2001年8月31日发布的是2.0版本,它包括了DC和AGLS的19个元数据元素。
(2)NZGLS叙词表:描述信息和服务所用的词汇,由新西兰国家图书馆管理。NZGLS元数据标准的功能和主题元素需要使用新西兰功能词表(FONZ)和主题词表(SONZ)。这两个词表中的词汇结合起来共同描述政府信息、服务以及其他资源。
(3)NZGLS元数据管理:使机构获得、管理和应用描述的工具。NZGLS元数据管理工具Metalogue是有关政府服务和资源信息的电子目录,由政府机构建立并进行内容维护。人们进入政府门户网站后,可以通过浏览Metalogue目录找到想要的政府服务和资源。
目前,NZGLS已经在新西兰的政府机构、国有企业、王室、政府相关机构和地方管理机构中得到广泛应用。
3.6 几国政府信息资源元数据标准本土化的比较
美国等几个国家政府信息资源元数据标准本土化的比较如表2所示。
表2 几国政府信息资源本土化的比较
┌───────┬──────────────────┬───────────────────────────────┐
│ │互操作性│实用性│
│ ├─────┬─────┬──────┼───────┬─────────┬───────┬─────┤
│ │元数据核心│扩充 │映射│描述对象 │ 规范化词表 │应用领域 │其他 │
├───────┼─────┼─────┼──────┼───────┼─────────┼───────┼─────┤
│ │ │ ││ │ │NII国家信息基 │ │
│ │ │ ││ │ │础建设,政府信│ │
│ │ │ │DC-GOV │政府信息资源、│ │息与服务检索 │ │
│美国 │GILS │ ││服务 │ │定位,电子政 │ │
│GILS │ │ │USMARC │ │ │ │ │
│ │ │ ││ │ │府,资源描述和│ │
│ │ │ ││ │ │发现 │ │
├───────┼─────┼─────┼──────┼───────┼─────────┼───────┼─────┤
│ │ │ ││信息资源,在 │采用不同的词 │ │ │
│ 澳大利亚│DC-GOV│4个扩展元 │GILS、 │线、离线资源,│表规范不同的 │资源描述与发 │ │
│AGLS │ │素│ANZLIC │政府服务和机 │元素,如Key- │现,电子政府 │ │
│ │ │ ││ │word AAA、│ │ │
│ │ │ ││构│ │ │ │
│ │ │ ││ │AGIFT、AAT等 │ │ │
├───────┼─────┼─────┼──────┼───────┼─────────┼───────┼─────┤
│ │ │ │DC、 LOM、 │政府信息资源,│Pan-governmeat│ │ │
│英国 │DC-GOV│6个扩展元 │GILS、 │记录管理,公共│thesaurus政府叙
│ │ │
│e-GMS │ │素│AGLS、GI│服务 │词表(后来搁量│e-GMF,e-GIF │ │
│ │ │ │Gateway │ │了) │ │ │
├───────┼─────┼─────┼──────┼───────┼─────────┼───────┼─────┤
│ │ │ ││ │Governmentof │ │ │
│加拿大│DC-GOV│指定5个
││ │Canada Core Sub- │GOL网上政府、 │放弃了原 │
│ TBITS 39.1 │ │CLF元素
│GILS│政府信息资源 │ject Thesaurus加 │资源描述与发 │GILS计划 │
│ │ │ ││ │拿大政府核心 │现│ │
│ │ │ ││ │主题词表 │ │ │
├───────┼─────┼─────┼──────┼───────┼─────────┼───────┼─────┤
│新西兰│DC-GOV│与AGLS相 │DC、GILS│政府信息 │FONZ新西兰功 │ │管理工具 │
│ │ │ ││ │能词表,SONZ │电子政府 │ │
│NZGLS │ │同││政府服务 │ │ │Metalogue │
│ │ │ ││ │主题词表 │ │ │
├───────┴─────┴─────┴──────┴───────┴─────────┴───────┴─────┤
││
└──────────────────────────────────────────────────────────┘
由上述可知,各国为实现政府元数据本土化、制定符合本国需求的元数据标准所作的努力实际上是要解决两个基本问题:本土需求的确定及如何保持与其他元数据的互操作性。进行这项工作所面临的主要挑战就是如何保持与原元数据模式及其他相关应用纲要的互操作性,如何协调互操作性与实用主义的问题。这给予我国建设政府信息资源元数据标准重要启示:政府信息资源元数据要在保持与国际通用元数据核心的互操作的前提下,最大限度地适应我国政府中文信息的特点,面向未来电子政务的应用。
4 我国政府信息资源元数据标准的现状和思考
目前,电子政务、政府上网已成为我国国家信息化建设的重点工程。一方面,由于政务公开的实施,政府信息资源得到开发,政府信息量大增,而且新增的政府信息资源数字化程度提高,原有的文本信息也进一步转化成数字信息而存在;另一方面政府信息化、政府上网工程进一步推进。据CNNIC在2004年1月份的统计,中国gov的注册域名有11764个,比2003年7月的统计增长了26%[19]。政府上网不仅是向公众提供信息,而且越来越多的政府服务通过网上政务完成,例如网上办理审批手续、网上报税、网上货物报关手续等。
虽然政府信息资源开发迅速,但我国的政府信息资源利用、管理还比较混乱,政府部门间数据难以共享,公众普遍反映难以检索政府网上信息资源、获得政府的网上服务。其主要原因是我国目前还没有一个统一的面向政府信息资源的元数据标准,各地方政府各自为政。建立一个全国范围内统一的政府元数据框架已成为我国发展电子政务的当务之急。在2002年9月的第二届中国国际电子政务技术与应用大会上,中国数字图书馆国际论坛刘晓白和国家信息中心吴晓敏在《政府信息资源目录体系建设初探》中提出要建设政府信息资源元数据标准[20];在即将召开的第三届中国国际电子政务枝术与应用大会上也将把建立政府信息资源元数据标准列为议程。
在此,我们借鉴国外政府元数据的标准,提出一个集元数据、服务和管理于一体的我国政府信息资源元数据框架构想(图1)。
图1 政府信息资源元数据框架
4.1 选择DC-Government作为中国政府信息资源元数据的核心集
首先,为了符合国际标准,提高元数据的互操作性、兼容性以及政府间信息的共享,我国没有必要花大力气去建立一套全新的中文元数据核心。我们可以在深入研究、吸收国外常用的元数据核心的基础上,选择一套合适的国际通用的元数据核心元素集作为我国政府信息资源元数据核心的基础。其次,通过以上对DC-Government和GILS的比较,以及从上述几国政府元数据标准本土化实践的情况看,目前广泛使用的DC-Government已成为事实上的国际标准,而且它具备良好的资源发现机制,我国的政府信息资源元数据标准可以在此基础上建立。
4.2 对元数据核心本土化,制定我国政府信息资源元数据标准
纵观以上各国的政府信息资源元数据标准的发展,都对国际标准的元数据核心进行了本土化。在我国,一方面,中文信息的编码、语义、句法、检索、处理等都有自身特点,另一方面我国的政治、经济、文化也有鲜明的特色,因此政府信息资源元数据框架的制定必须对现有的国际标准(DC或GILS)进行本土化,制定出来的标准、应用纲要应尽可能符合我国的实际情况和需要。
对于我国政府信息资源来说,Title、Creator、Subject和Date具有重要的检索意义,因此可以作为我国政府信息资源元数据标准的必备元素或核心元素。相比加拿大CLF的5个元素,我国政府信息资源中,中文信息资源占绝大部分,因此Language可以作为可选元素。
此外,我国政府信息资源中除了行政信息,还有很大一部分是党团信息,因此有必要在Type和Audience元素中设置相应的行政信息和党团信息可选修饰词。我国政府信息的行政级别明确,信息制定、抄送、审批分属不同的机关级别,因此可以在Creator、Contributor、Publisher、Audience几个元素中加入行政级别的修饰词,并建议增加一个“审批”的可选元素,该元素中包括“审批者”、“审批意见”及“行政级别”等修饰词。针对中文计算机汉字编码中存在着不同的标准(GB 2313、GBK、BIG 5、HZ等),建议在 Language元素中加入“编码类型”、“简体/繁体”的修饰词。针对我国网络上虚假信息的泛滥,为了确保政府信息的权威性,可以增加一个“数字签名”的元素,在数字认证成熟的条件下,发布信息的机构必须为其发布的信息加上数字签名。
4.3 应用政府信息元数据标准实现面向电子政务的信息资源管理
政府信息资源管理是电子政务的一部分。建立统一的政府信息元数据标准,将有助于政府内部信息资源及服务的发现、开发、组织、维护、公开、利用等一系列流程得到更加规范的管理,并且政府保密信息安全保护、销毁也得到可靠的保障。各地方政府、行业管理部门应根据政府信息资源元数据标准描述信息资源,建立分布式的信息资源系统。统一的元数据标准有助于这些分布式的政府信息资源实现共享。
4.4 应用政府信息元数据提供政府信息和服务的获取接口
电子政务不仅是政府机构内部的电子化,最重要的是面向公众,为公众检索获取政府信息、享受政府服务提供方便的途径。因此,应在政府信息产生时进行标准化的元数据描述,并利用全国统一的政府信息元数据标准建立一个可以检索国内大部分政府信息资源和服务的政府信息定位系统(如美国 FedWorld网站),为公众提供统一检索途径,获取政府的信息和服务。
4.5 建立良好的互操作机制
一方面,由于政府信息资源的覆盖面广,因此要建立与其他领域元数据的互操作机制。例如地理空间元数据(ISO 19115)、学习对象元数据(LOM)、多媒体视听元数据MPEG-7等。另一方面,在国际间政府活动日益频繁的今天,有必要建立我国政府信息资源元数据与其他国家政府信息资源元数据的互操作机制。例如,由于我国政府信息资源绝大部分是中文的,可以在DC-GOV元数据集中的Subject元素中增加一个“主题译名”的修饰词。
5 结语
政府信息资源元数据标准是电子政务的基础标准。构建分布式共享的政府信息资源数字环境,实现政府信息资源的共建共享,建立具有良好互操作性、基于资源发现和检索的元数据标准则是我国推进电子政务的基础和关键。我们应该充分借鉴国际上政府信息资源元数据标准化的成果和经验,加快制定和实施我国的政府信息资源元数据标准。
标签:元数据论文;