美国政府信息定位服务系统研究_查找算法论文

美国政府信息定位服务系统研究,本文主要内容关键词为:美国政府论文,系统论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G35,G27 文献标识码:A 文章编号:1007-7634(2009)11-1635-06

1 引言

政府信息定位服务系统,又称政府信息指引服务、政府信息定址服务,英文名为Government Information Locator Service,简称GILS系统。有些人认为它是一种元数据标准、有些人认为它是一种目录体系,而有些人则认为它是一种计算机服务系统[1]。这些认识各有可取之处,但都不够全面。若无特别说明,文中的GILS系统是指利用一系列使用元数据技术,结合现代信息技术建立起来的一个以检索或浏览方式帮助获取美国政府信息资源,以充分发挥政府信息的社会价值的政府信息资源管理系统。

2 GILS系统的发展过程

该系统的研究与实践始于美国联邦政府,兴于州政府。最初由美国行政管理与预算局(Office of Management and Budget,以下简称OMB)组织建立,旨在简化用户查找联邦政府信息的过程、提高查找效率,充分发挥政府信息的社会价值。

2.1 GILS系统建设的提出

20世纪70年代初,美国联邦政府提出建立一个与计算机技术、网络技术相结合的信息公开系统,以应对日益严峻的政府信息管理负担,消除重复信息。该系统经历了FILS(1977年至1990年)与GILS(1990年至今)两个阶段。

1977年,文献削减委员会在其报告中正式提出建立联邦信息定位服务系统(FILS)[2]。美国国会于1980年通过《文书削减法令》,对该系统进行了阐述,并制定美国信息管理办公室(Information Management Office)专门负责该系统的落实。

该系统在1984年正式运行,很好消除了重复信息,减轻了管理负担,但不能提供政府内部文件、报告、档案、公开出版物等政府信息,没能很好地提高用户查找的效率。因此,该系统受到了普遍批评[3]。

1990年,OMB请锡拉库扎大学(Syracuse University,又称雪城大学)研究“现有关于定位服务系统的政策体系,明确该系统的目标及其使用情况;讨论如何使该系统更好满足政府及社会公众的需求。”研究发现,公众对如何查找及获取政府信息更感兴趣,而当时的FILS并不能很好满足此需求,于是提出了FILS的替代系统——“政府信息目录/定位系统”(Government-wide Information Inventory/locator System,简称GIILS)[4]。

1993年10月19日,OMB与美国信息政策委员会在《联邦公报》(Federal Register,又称为联邦记事)上共同发表声明,要建立以部门为基础的政府信息定位服务,并对该系统进行了阐释。从此,GILS系统成为美国政府信息公开系统建设的新目标。

2.2 GILS系统的初步建立

1994年12月7日,OMB与美国国家标准与技术研究院(National Institute of Standards and Technology,以下简称NIST)分别发布文件,就GILS系统的实施办法以及技术标准进行了说明,为该系统在联邦政府的建设离奠定了基础。

OMB颁布了文件“OMB BULLETIN 95-01”[5]——《建立政府信息定位服务》(Establishment of Government Information Locator Service)。这是美国政府部门第一份关于建立GILS落实的指导性文件,对GILS系统产生的背景、相关概念、目标、各部门主要负责部门等问题以及系统建设的截止日期做了安排。按照其要求,所有部门的领导必须确保在1995年12月31日之前“各部门最主要核心GILS记录必须可以通过网络获取,而且这些文档必须满足FIPS-192及其他应用框架的要求”。

NIST发布联邦信息管理标准“FIPS-192”[6]——《政府信息定位服务应用框架》(Application Profile for the Government Information Locator Service(GILS)),这是对GILS系统的技术说明和指导。它规定,GILS系统是以机构为基础的分布式服务系统,各部门的GILS服务器使用通信协议Z39.50(开放系统互联的信息检索应用服务定义和协议),以实现“从任意一个部门的GILS服务器上检索所有联邦部门公开信息”的目标。为提高信息的管理与检索效率。它规定所有联邦政府采用GILS元数据标准著录公开信息,所有元数据包括28项核心元素,有必选和可选之分,在具体著录时,各部门可以根据需要设定专用的元数据。

这两份文件发布标志着GILS系统建设正式实施。截止1997年3月7日,已经有48个联邦部门开始通过GILS向公众服务,其中有29个部门将自己的GILS业务交给了GPO(26个)及Fedworld(3个)代做,其他18个部门则是独立完成GILS业务[7]。至此,联邦政府GILS系统初步建立。

2.3 GILS系统的评价

GILS委员会专门负责收集各方对GILS的评论,追踪并报告GILS发展情况。在1996年9月至1997年6月,该委员会评价了GILS系统建设情况。从当时的评价结果看,该系统存在以下问题:

(1)许多部门的GILS定位器仍未建立。GILS系统是一个“物理上分散、逻辑上集中”的服务系统[8],即所有信息公开部门建立了各自的GILS定位器,最后利用计算机网络及相关协议连接起来,为用户提供一个统一的联邦政府信息获取入口,各部门GILS服务器建设的结果直接影响着联邦GILS系统的质量,当各部门整抓紧建设各自的GILS服务器时,美国政府正值改革,许多部门缩编、合并和裁减预算,政府预算在国会迟迟不能通过,直接导致当时系统建设所需资金、人员不足。因此,直到1998年8月,依然有33个联邦政府部门没有提供GILS服务[9]。

(2)多数部门的GILS系统质量不高。据统计,只有少数部门所提供“元数据资源”、“目录”、“查找帮助”等栏目以帮助用户提高获取政府信息的效率。多数的联邦机构“对什么是GILS”、“理想中的GILS”还很不了解。因此,GILS委员会对其评价是“用处很少、使用不便”。

(3)系统内容时效性差。据1998年统计,46个联邦政府部门所提供的GILS记录更新情况显示,36个部门的GILS记录当年没有更新,有12个部门在1997年时便没有再更新。一方面,因为GILS委员会解散,造成了监督的缺失,另一方面,当时许多部门的GILS定位器只著录到各部门网站,著录深度显然不够,必然导致GILS定位器中信息内容更新放慢。

可见,初步建立的联邦GILS系统无论从覆盖面还是系统信息质量上讲,都存在问题,但这毕竟是对政府信息公开系统的初次尝试,而且它为日后美国州政府GILS系统的成功提供了借鉴。

2.4 GILS系统的不断发展

1997年12月,“OMB BULLETIN 95-01”失效,但是OMB并没有声明该法令是否继续有效,也未对接下来GILS系统的建设做出明确安排。1998年2月,OMB在其政府备忘录中要求,联邦部门的GILS系统工作仍要继续,但并未说明如何去做,也未确定出系统建设工作的主管部门。因此,理论上讲从1998年以后,GILS业务仍是联邦政府必须的一项工作,但由于缺乏必要的指导和监督,进入了停滞阶段。从此GILS系统发展转向了美国州政府层面。

3 GILS系统的现状

1996年至今,信息技术突飞猛进,社会的信息需求特性以及查找习惯等已经发生巨大而深刻的变化,而联邦GILS系统并未对服务模式做出适应性调整,其“定位服务”的效果已经远不能满足现代用户的需求,使用频率越来越低。另一方面,州政府在GILS系统建设上却不断创新、探索,找到了提高该类系统服务质量及效率的新途径。

3.1 联邦GILS系统

目前,联邦GILS主页建在美国GPO网站下,在其数据库上可以检索35个联邦政府的3237个GILS记录,759915条字段。同时,也可以通过提供的超链接找到独立实施GILS业务的7个联邦机构的服务器(界面如图1)[10]。

3.1.1 系统功能介绍

该系统提供检索(“Search”)与浏览(“Browse”)两种服务形式。检索界面包括“检索单位选取栏”、“检索词提交栏”及“每页结果显示数量栏”三项。顾名思义,“检索单位选取栏”允许用户将检索范围选定在GPO数据库中所有GILS记录或具体的联邦政府GILS服务器。浏览界面分为两部分,第一部分为将用户指向存放在GPO数据库中的GILS记录,用户通过逐级浏览,可以找到所需要的政府信息。第二部分超级链接将用户指向其他7个独立提供GILS服务的联邦机构的服务器。

图1 美国联邦政府GILS系统主页

3.1.2 系统服务的原理

联邦GILS系统是一个“物理上分散、逻辑上集中的”服务平台(其服务原理如图2)。

图2 美国联邦政府GILS系统服务原理

各联邦部门使用统一的元数据标准对公开信息进行著录,以帮助用户判定著录对象主题并获取著录对象。著录结果称为GILS记录(GILS records)。所有GILS记录与共同的检索协议(Z39.50)一起构成了每个部门的GILS定位器(locator)。(用来存放GILS记录的数据库技术以及文档的存储结构并没有统一标准[11])。所有GILS定位器都遵守Z39.50检索协议,并且GILS记录结构相似,因此,可以实现跨部门的整合检索。

3.1.3 系统存在的不足

(1)服务理念落后。使用联邦GILS系统时,用户通过GILS记录中的著录信息判断相关度,再通过其中的“查找帮助”获取目标信息。这与目前主流搜索引擎适用的服务模式差异很大,而美国州政府建设GILS系统时都结合了搜索引擎原理,并且取得了很好的效果。

(2)信息内容时效性差。作者统计,2000年至2006年,所有联邦部门提交的GILS记录只有49个,其中有效连接数为42个,占所有文档总量的1.29%。2006至今,GILS记录未做任何更新。而且,许多文档从1995年提交至今未作改动,许多超级链接早已失效。

(3)著录深度不够。事实上,与1995年时相比,目前的联邦政府网站承载的信息量剧增,并且每个网站上信息涵盖了多个主题。因此,只有从多个维度深层次揭示,才能真正做到“方便用户获取政府信息”。然而,GILS记录由人工完成,许多是对联邦政府网站的著录,所提供的帮助非常有限。

可见,GILS系统的研究与实践始于美国联邦政府,但由于缺乏持续性,该系统的服务模式及其所提供信息的质量不能很好满足用的需求,很难做到“方便用户查找并获取政府信息”的目标。

3.2 州政府GILS系统的建设情况

目前,具有代表性的州政府GILS系统有华盛顿州的“Find-It!”、纽约州的“NYS GILS”(New York State Government Information Locator Service的简称)、福罗里达州的“FGILS”(The Florida Government Information Locator Service)等。其中“Find-It”系统最具代表性。它采用搜索引擎技术,结合了一定的元数据技术,提供检索与浏览两种查找方式,查找结果与主流搜索引擎类似,使用的效果最好。

“Find-It!”由华盛顿州图书馆受州务卿办公室委托开发,于1998年正式运行。所涉及的信息涵盖了华盛顿州各级政府以及部分联邦网站(其网页如图3)[12]。

图3 华盛顿州GILS系统主页

3.2.1 系统服务的原理

该系统由Google为其研发,与网络搜索引擎具有相似的工作原理。

首先网络爬虫访问具体政府网站,读取网页信息并使用都柏林核心(Dublin Core)对政府网站、文件进行标引,标引结果被保存在“Find-It!”数据库中。(爬虫不会抓取所有信息,但是会为没有抓取的信息创建一个简单的“locator record”。)

其次,用户可通过“检索”及“浏览”两种方式查找信息。“Find-It!”提供多重检索,检索框包括“SEARCH FOR:”与“IN:”两部分,前者是用户提交检索词的栏目,后者则是用来界定检索范围,检索范围可为“州政府网站”、“市政府网站”、“县政府网站”、“地方政府网站”、“部落政府网站”或“所有网站”。该系统同时提供高级检索功能,用户可以限定匹配方式、目标信息的语种、存在格式、所在网站以及排序依据,以提高查找的准确性。

再次,“Find-It!”将政府信息按照主题逐级归类,以供用户查找。共分为四级主题,其中一级主题26个,二级主题194个,三级主题176个,四级标题16个。每点击一个主题,用户都会看到该级主题下的所有相关信息,而且相关主题词都会用黑体标出,以方便用户所确定需要的该信息。例如,点击“教育”主题,在其命中的资源中,“学校”、“大学”、“教师”、“研究机构”、“学院”等“教育”的下位词都会以黑体的形式标出。

3.2.2 系统特点

“Find-It!”与联邦GILS系统都为用户提供“检索”与“浏览”两种信息查找方式,但两者区别也十分明显,“Find-It!”特点为:

(1)“物理”、“逻辑”双集中。“Find-It!”服务模式为,华盛顿州图书馆建立的服务器负责提取所有政府网站信息特征并存储,依照固定模式向用户提供服务。整个过程中,只需所有部门只需指出那些最需著录,配合系统建设工作。因此,“Find-It!”实现了“物理”与“逻辑”的双集中。

(2)时效性强。“Find-It!”使用Google为其提供的搜索引擎自动提取政府公开信息的特征,而且可以定期跟踪,动态更新。因此,信息的实效性较强,系统运行成本低。

(3)信息查找方式。在“Find-It!”中,用户提交检索词后,直接通过信息标题以及某段内容判断某信息是否为自己所要查找的,无需联邦GILS系统一样,通过GILS记录判定信息是为所需要的。

(4)检索结果进行了相关度排序。“Find-It!”使用一定算法将查找结果按照相关度进行了排序,这样用户获得所需要信息的可能行增强。

3.2.3 其他州政府GILS系统介绍

“NYS GILS”同样提供“检索”与“浏览”两种信息查找途径,使用检索功能获取的结果与主流搜索引擎结果类似。但是检索的范围仅仅局限于纽约州图书馆网站、“NYS GILS”数据库信息、纽约州教育署及纽约大学,其他纽约州政府部门的信息仍无法实现一体化检索。另外,通过逐级“浏览”只能找到属于某个主题的网站,具体信息还需用户进入网站中具体查找。另外,个别州GILS系统只为用户提供“检索”或“浏览”一种信息查找方式。如福罗里达州的“FGLS”(The Florida Government Information Locator Service)只提供“浏览”的查找功能,得克萨斯州的“ARCHIVE-IT”只提供检索功能。但是,这两个系统都存在着信息揭示不深的问题,不能为用户查找信息提供便利。

4 GILS系统成功关键因素

GILS系统是用户查找政府信息的工具,系统服务质量与系统使用情况是正反馈关系。这里系统服务质量的衡量标准便是其提高用户获取政府信息效率的程度。因此,成功的GILS系统必须:

(1)便于使用。由于所面对的用户有着不同的知识背景和查找习惯,GILS系统必须提供多种查找方式,而且这些方式应该符合用户信息查找方式,最好无需学习便可直接使用。

(2)信息质量高。GILS系统中的信息必须具有如下三个特点,首先,信息覆盖面广。如果通过华盛顿州的“Find-It!”只能找到该州部分的政府信息,无论其界面再友好,都很难为用户提供高质量服务。其次,信息揭示深度合适。只有将索引做到了网页级别,才能有效提高用户查找政府信息的效率。再次,信息具有时效性好。没人愿意使用所提供的链接都已无效的系统。

(3)紧密集合用户需求变化。每次信息技术的变革都会深深的影响到人们获取信息的能力以及方式,这也必然要求系统的服务的方式甚至系统模式进行相应的调整。联邦政府GILS系统发展由兴到衰的过程便是一个例证。这是由用户的行为所决定的,所有系统都是如此。

5 GILS系统对我国建立政府信息公开系统的启示

美国GILS系统在其发展过程走了不少弯路,也取得了很大成就,对我国公开系统建设的启示如下:

(1)组建的系统建设管理机构。政府信息涵盖了人民生活的方方面面,来源不同、主题、形式各异,而且这些信息中有些仍在政府部门流动,有些则由图书馆、档案馆保存。因此,只有各部门协调实施,才能有效地将的政府信息有效整合。另一方面,我国的行政区域比较多,彼此的社会经济发展极不平衡。因此,各自政府信息公开系统的建设必须结合各自的实际情况。因此,需要建立一个专门的机构负责协调这些系统的建设,确保从实际出发的同时遵循了一定的技术标准,以确保系统间的融合。避免信息孤岛的形成。

(2)促进电子政务发展。系统中信息的质量是CGILS系统成功的关键[13]。不能有效提高查找效率、质量的系统必然会被抛弃。只有电子政务发展了,足够多的政务信息以电子形式存在了,才可能有丰富的资源供CGILS系统去整合。

(3)将搜索引擎与元数据结合。CGILS系统在向用户提供信息服务时,必须对政府信息揭示得当、时效性好、维护成本合理。建立CGILS系统时,可以使用搜索引擎自动标引并提供服务,也可以先使用元数据人工标引,再通过计算机提供检索服务。但这两种方式各有所长。

搜索引擎服务时,信息揭示深入、时效性好且便于维护。但是,检索结果存在着一定的重复,准确性较差。另外,它也不能标引没有数字化的政府信息,而许多必须公开的信息并未数字化。人工使用元数据标引,可以很好地提高检索质量,但系统运行成本较高,时效性较差。若将元数据嵌入到网页代码中,通过搜索引擎自动提取特征、提供服务,就可以获得比较理想的效果。华盛顿州“Find-It”系统便是很好的一个例子。

(4)统一政府信息公开相关的标准规范。在建设政府信息公开系统时,我们必须规范相应的元数据标准、著录标准、分类标准以及其他标准规范[14]。另外,还需要规定出各标准的主管机构,专门负责解决标准实施时遇到的特殊情况。只有所有政府信息公开服务器遵循统一的标准,才有可能将CGILS系统建成一个逻辑上统一的服务系统,更好地为用户服务。

标签:;  ;  

美国政府信息定位服务系统研究_查找算法论文
下载Doc文档

猜你喜欢