质量控制学科信息门户研究_信息门户论文

质量控制学科信息门户研究_信息门户论文

质量受控学科信息门户研究,本文主要内容关键词为:学科论文,质量论文,门户论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔分类号〕G254

1 前言

图书馆一直把对印刷型文献的整理、利用和开发作为己任。随着电子文献和网络信息的出现,人们渴求由非商业性质的机构(如图书馆)提供科研、教学等公益性质的网络信息资源服务。质量受控学科信息门户(Quality-controlled Subject Information Gateway,以下简称QSIG)的兴起,既满足了用户对高质量、系统化的学科信息的需求,又奠定了图书情报机构在网络信息服务中不可替代的地位。对QSIG进行研究,有利于我们认识QSIG的重要作用,接受QSIG高质量、系统化的信息服务理念,为深入研究与发展QSIG奠定一定基础。

2 QSIG概念分析[1]

宏观来说,学科信息门户是集中于分布式的因特网服务和因特网资源,提供信息资源的链接,使用户很容易地访问因特网;其服务是基于资源的描述,但不必显示所有的描述内容;通过学科结构浏览资源是其一个重要特征。资源发现表示的是一个宽泛的概念,包含诸如网络索引,搜索服务、当地数据或图书馆的OPAC(联机公共检索系统)等发现工具。具体来说是将特定学科领域的信息资源、工具和服务集成为整体,为用户提供方便的信息检索和服务入口。

QSIG是支持系统资源发现的因特网服务。与学科信息门户相比,QSIG有质量量度标准作为每一条记录的控制规范,通过使用较多的人工际引来贯彻质量量度标准,为每一条记录提供丰富的,适合标准的描述;并通过制定数据记录管理(也称藏品管理,如经常更新数据记录,检测链接,剔除混杂的记录等)规范,经常地检查和更新记录以保证其数据记录准确、有效;甚至使用受控词表为高级检索和浏览设置深层次的分类结构和资源索引来提供高质量的学入口。

总之,有着较少描述的链接列表和浅显的学科结构的学科服务称为学科信息门户;有着丰富的资源描述、遵循一定标准和深层次的分类结构、有着高标准的质量受控的学科服务称为质量受控学科信息门户。

3 质量受控体系

建立合理、完善的质量受控体系,是实现对QSIG信息资源的质量控制、管理和为用户提供高质量、系统化信息服务的前提,也是保证QSIG标准化、分布式建设和长期发展的一个要件。QSIG质量受控体系主要由以下几个方面组成:

3.1 信息资源选择规范

一致的收集范围和选择标准是QSIG质量控制的源头,要求在标引前对对象信息资源的学科领域、地域范围、文种范围和类型范围等进行判断,从而确定对象信息资源是否应该被描述。对象信息资源可选择学科领域的规范,通过对QSIG的学科领域核心覆盖、基本覆盖和选择性覆盖的学科或主题范围进行描述,为对象信息资源收集范围进行基本的界定。地域范围界定了对象信息资源的来源国家和地区,一般与文种范围有关。文种范围则指根据QSIG的服务对象、学科信息资源的分布情况,结合信息资源专家和学科专家的实际情况,选择合适的对象信息资源的文种(国内一般以中文和英文为主)。类型范围指的是可选择对象信息资源的信息类型(如数据库、科研单位、产品、参考工具、学术动态等),一般以列举的形式给出。此外,还需规范将信息粒度、Google网页评估级别、可获得性等几个方面。

3.2 信息资源搜索策略

对建设初期、发展期、维持期制定可行、高效的信息资源搜索策略,有利于系统地发现高质量的对象信息资源。建设初期可将搜索引擎的选择和使用、国内外现有导航库和学科门户辅助搜索作为搜索策略的重点。发展期则应将以下两方面作为搜索政策的重点:①借助QSIG系统用户行为分析和用户调研,确定重点搜索方向。②通过“资源→专家”和“专家→资源”、“网站→链接”和“链接→网站”的链式搜索。维持期的搜索策略则是:①结合前两期的搜索,适当扩充文种和资源类型范围,并通过QSIG系统中的“用户提交系统”接受用户推荐。②利用“个性化”模块定期从用户个人资源体系中选择、编辑信息资源。

3.3 信息资源评价标准

信息资源评价标准在很大程度上决定了QSIG所收录信息资源的质量水平,对于QSIG的长期运行和服务是至关重要的。信息资源评价标准主要有权威性、准确性、稳定性和可获得性等几个方面。各个方面标准的制定可直接应用现有对信息资源评价的研究成果(如Google网页级别指标),并以定义和列举的方式来明确QSIG评价标准。

3.4 信息资源类型词汇表

信息资源类型词汇表根据信息资源的内容特征定义了信息资源的不同类型(以及子类型),一方面作为信息资源标引中的类型聚类,另一方面为用户提供类型入口浏览方式。QSIG的类型(以及子类)及其个数大多不一样,也没有统一的要求,但都是根据学科信息资源的特点、用户习惯和相关技术标准(如DCMI Type Vocabulary[2])制定类型词汇表,并列出每一种类型的中英文标识和说明。类型词汇应该是动态发展的,可以根据信息资源收集策略和用户需求的变化而变化,并制定新的版本。

3.5 信息资源组织体系

信息资源组织体系包括元数据方案、采集加工模式、浏览检索模式、共享模式、信息服务等。元数据方案是信息资源组织的核心,它确定核心元数据、扩充元数据和复用元数据的规则,并制定出QSIG的元数据框架。信息资源采集加工模式有分布模式、集中模式和综合模式。浏览检索模式多是按学科主题和资源类型提供复合式的分类浏览与检索,有的还有关联检索、相关信息资源等模式。

3.6 信息资源标引规范

信息资源标引是QSIG质量控制的核心,其过程贯彻于以上各个方面,详细地定义、说明、列举了各个标引字段的标引原则和具体要求。故此,要对影响QSIG整体服务质量的分类与类型的选择、关键词的抽取、简介与评阶、各字段的格式要求等做好规范。有些能够量化的则要量化,无法量化的要做好宏观控制。信息资源标引规范要体现对信息资源进行丰富描述的思想,尽管有些字段不是必选项,但还是应该尽可能地进行完整标引。

3.7 信息资源管理规范

信息资源管理规范主要包括对信息资源的编审控制、利用分析、链接检测、描述检测、更新频率等的规范。编审规范主要包括对收集整理、交送编审、接受编审、编审通过、信息发布、编审退回等各个过程的控制。信息资源的利用分析一般通过软件来完成,主要分析资源利用率、用户检索词等,并形成分析报告,用于指引信息资源搜集方向、元数据辅助标引和为个性化服务提供原始数据支撑。链接检测包括检测工具的使用、检测频率的制定、对检测结果的处理规则等。信息资源描述的检测主要包括检测频率、检测内容、检测模式等的制定。信息资源更新频率包括新资源的发布、失效资源和失去价值资源的更新以及更新情况的发布规则。

4 QSIG建设的几个重要方面

分析、调研国内外学科信息门户,根据“材料复合新技术信息门户”和“交通运输工程信息门户”建设的经验,QSIG建设主要应有以下几个方面:

4.1 学科主题和服务范围

目前,国外建设的著名QSIG达50多个,英国、美国、北欧国家、荷兰、德国和澳大利亚QSIG的建设比较活跃。从学科领域范围看,应用学科和教育领域的门户服务范围较广,如农学、工程学、医学、教育学领域的门户(而国内仅有基础科学和工程学)。在准备建设新的QSIG前,要进行充分的调研,结合自己的用户群和自身条件(标引人员专长、长期建设的政策支持和投入保障),选择合适的学科领域,避免低水平重复。在选择学科领域作为信息资源建设方向时,要注重合作——方面与重点用户合作,另一方面与有同样建设目的的单位合作。

服务范围直接影响信息资源的收集策略和标引规则。目前,国外的QISG服务主要覆盖全球地理范围,其次是着眼于本国资源的服务(这其中主要是美国、澳大利亚和一些北欧国家的QSIG);而国内的QSIG服务主要针对本单位、本系统内部的用户,然后才考虑面向国内用户。选择不同的服务范围,应制作不同的版本(如国内版、亚洲版、全球版),即提供针对性服务。

4.2 藏品发展政策

规范的QISG在建设初期就制定了其藏品发展政策,并均对其藏品提出了明确的质量标准,许多QISG甚至公开发布资源选择标准的文件供用户查验。藏品发展政策主要有以下几个方面,它们会随着QISG建设和服务的变化不断完善和提高。

4.2.1 定期的链接检测 要求制定链接的检测周期或时间,从而确保较高的链接成功率,增强用户获得信息资源的信心。一般是借助“网络地址检测软件”,定期对链接进行检测,然后人工分析并确定错误链接的处理方法(更改、删除或移到后台)。由于网络信息资源通常变动较大,又通常有检测软件,故一般每星期检测一次。

4.2.2 信息资源描述的控制 主要有两个方面,一方面是发布前对信息资源进行严格编审,要求信息资源的选择完全贯彻资源选择标准,描述必须符合质量控制规范的要求。这方面的例子很多,国外的如DESIRE项目[3],国内的如“材料复合新技术信息门户”[4]。对允许普通用户提交候选信息资源的QSIG,还需要做进一步的描述和更多的编辑控制。另一方面,确定对资源描述的检测周期,用于发现因信息资源对象更新、增删服务内容和文档而导致以前描述的过时、不完善或不正确的地方。由于这项工作任务繁重,通常是谁描述的信息资源就由谁检测,周期也较长,一般是每半年或每年完成一次。

4.2.3 新信息资源的更新频率(或数量) 即是指新资源的每月增长率(数)。除了初期阶段或扩充阶段外,正常建设期一般都比较稳定,制定相应的月增长率(数)有利于QSIG健康、持续地发展。

4.3 技术方案

QSIG所有的服务都通过Web界面提供对其信息资源的访问,并且提供多种检索途径(一般检索、高级检索、关联检索)。采用B/S模式完成对信息资源的采集、编审、发布和维护,并将元数据存储在数据库中。目前,QSIG的建设多是购买商业软件包或利用免费的软件包作为网站建设、资源采集与管理、共建共享和信息服务的平台。国外可供选择的软件包有ROADS[5](用在MetaChem和AVEL中)、OCLC's MAN-TIS[6]、SiteSearch(用在CORC中)[7]、NSF-JISC计划提供的IMesh工具包[8](ROADS的开发者是其合伙人)和SPT(Subject Portal Toolkit)[9]。SPT是美国威斯康星-麦迪逊大学的ISP项目的成果之一,可以免费获得源代码。中国科学院的CSDL学科信息门户群选用了SPT,然后在SPT现有软件的基础上,结合自身的建设要求,对SPT进行汉化和特需处理。国内仅有武汉理工大学图书馆开发的QSIGsystem软件包,目前成功应用在“材料复合新技术信息门户”和“交通运输工程信息门户”中。该软件充分吸收了信息服务的新理论和先进技术,融入了数字图书馆建设理念,有效地实现了本地数字资源和网络信息资源的整合、开发与服务;通过技术手段对信息资源建设的质量实现了有效的控制和管理,并将个人用户的信息资源纳入管理和共享范畴。

4.4 元数据框架

采用标准的元数据框架作为信息资源描述和管理的核心,是QSIG实现质量控制和高效信息服务的一个重要方面。国外大多数QSIG使用了由IAFA修改DC后的模板元数据;澳大利亚的QSIG(如EdNA)则采取将DC与其他模式的元数据相结合的方式,如管理核心元(Admin Core)、Alta Vista类型元数据[10]。详细的信息资源描述和元数据结构使用一定的标准能使QSIG之间方便地实现交叉检索。QSIGsystem结合信息资源的管理和服务,在DC的基础上进行了少量的扩充。总的看来,国际上通用的DC已经成为QSIG元数据方案事实上的标准,适当进行元数据的扩充和复用有益于不同特色的QSIG建设。

4.5 学科(或学科主题)体系

科学合理的学科体系是QSIC的一个重要特征,它为QSIG提供信息资源组织框架和高水平的学科分类浏览结构。学科分类体系的实现一般是制定或选择成熟的分类法,有的还采用受控叙词;最好的方法是联合使用叙词和分类法,能体现出高质量的服务。如EELS使用Ei的分类和叙词[11];SOSIG使用UDC分类法和HASSET叙词[12]。

4.6 互操作

QSIG要成为强大的信息资源发现网络,必须将众多的QSIG无缝链接,能够进行透明访问,实现在相似或不同的学科范围、一种或多种语言之间交叉检索和交叉浏览。出于这一要求,互用性成为QSIG及其软件包性能的重要指标。互操作要求协议、检索语言、元数据模式,学科分类和目录规则等采用一致性的标准或通用规范。目前几乎没有一个QSIG能完全满足以上要求,但许多QSIG正朝着这个方向努力——whois++与通用索引协议(CIP)将用于RDN中的交叉查询,Z39.50也将用到RDN中并已在UKOLN中做了测试,Isaac网络项目将LDAP协议和CIP协议一起使用[13]。OAI协议也成为解决互操作问题的一个要点。

4.7 管理

QSIG的建设是一项长期的系统工程,许多QSIG的建设历经多年。对QSIG的管理主要包括支持QSIG运行的硬件与软件维护、信息资源建设人员的管理与培训、与合作单位的协调、信息资源建设进度安排、外部支持经费的争取以及切实可行的QSIG长期发展规划。硬件与软件是提供稳定的、全天候的网络信息服务的基石;做好对新参加建设人员的培训以及学科专家、信息资源专家的协调与绩效评价,是高质量信息资源标引的保障;与合作单位的协调和对信息资源建设进度的合理安排能实现QSIG的快速发展;有了正常经费的支持和长期发展规划,则不会使QSIG随着领导、建设人员的更替而暂停、终止或随意改变发展方向。

4.8 附加服务

附加服务主要有学术论坛、个性化服务、推送服务、定制服务,它们不是QSIG的必要条件。尽管QSIG更集中于提高学科访问和门户功能,但附加服务在商业领域和大型门户中是非常典型的,其对提高QSIG的服务质量和影响力是非常有益的。随着QSIG的成熟与发展,附加服务将成为新的亮点。

4.9 商业模式

目前,QSIG基本上是由大学或研究机构来建立、维持并直接或间接地由他们资助,其建设任务是其职员工作的一部分。在某些国家是以国家级别的形式来建设,有固定的资金来源。在国内,中国科学院投入700万的资金建设其QSIG体系。尽管如此,多数QSIG还是没有稳定的经费支持,持久性仍是一个大问题。一个建议是:QSIG的建设应考虑商业模式运营,为QSIG的持续性发展探索新的途径。

5 QSIG的类型划分

对QSIG的类型进行划分,有利于从不同的方面认识QSIG,促进QSIG的信息服务、开发和推广,为新的QSIG的建设和研究提供参考。分析国内外QSIG的特征,可以从其涵盖的学科领域、地区/国家范围、资源语种和资源类型数量方面来划分。这种划分方式产生的类型很多。最简单类型是涵盖一个单一的学科、一个地区、一个语种、一种信息资源类型;最复杂的类型是涵盖几乎所有的学科和所有信息资源类型,并且是多语种、全球性的。以上两种类型都不多见,常见的几种QSIG类型有:①一个学科领域、全球范围、单一语种。②所有学科领域、全球范围、几种语种。③几个学科领域、全球范围、单一语种。④一个学科领域、一个国家、单一语种类。还可以从互操作的范围来划分QSIG的类型:①在一个学科领域内协作。②在涵盖不同学科领域之间的邻近国家协作。③进行整合和一致化协作。④QSIG与地区或国家数字图书馆之间进行协作。

6 QSIG的几个实例

6.1 MathCuide[14]

是德国下萨克森州图书馆和格廷根大学图书馆的专业信息(SSG-FI)计划成果之一,1996年开始建设,其元数据方案是在DC的基础上,根据管理和服务的需要进行少量扩充(如增加了评价级别、统计分析等元素);主题分类采用的是国际上数学领域普遍使用的MSC(《Mathematics Subject Classification》);资源语种范围涉及21种;国家和地区范围有24个;信息资源格式有24种;使用Xenu程序来检测外部链接;提供开放式的信息资源添加表单,分为简表和全表提交;提供主题和资源类型浏览以及检索。SSG-FI计划用统一的QSIG系统完成6个学科信息门户:数学(即Math-Guide)、地球地理科学、英美历史、英美语言文学、元数据发展、林学。

6.2 因特网资源昆虫学索引[15]

由爱荷华州立科技大学昆虫学系于1996年创建,目的是将成千上万的昆虫学信息资源组织起来,以节省昆虫学学者在网上查找信息的时间。为了保证有效的服务,采取了简单的界面风格,无图片,能适应所有浏览器;提供类别(27种)浏览和关键词检索,若仅是浏览而不想自己选择,可以通过“随机链接”浏览系统随机列出的记录;提供开放式的信息资源添加表单;更新频率快。

6.3 EEVL[16]

EEVL(爱丁堡工程学虚拟图书馆)是英国工程学领域极有影响力的学科门户体系。由赫瑞特·瓦特大学牵头,1995年8月开始着手建设,1996年2月完成核心资源数据库建设,8月开始导航系统的测试服务。随后逐渐实现交叉检索、质量控制规范和附加功能(工程学电子期刊搜速引擎和最新制造数据库)。其后,又建成数学门户(与伯明翰大学合作)、计算门户(与阿尔斯特大学合作)。其信息资源更新频率颇快。

6.4 中国科学院QSIC体系[17]

中国科学院QSIG体系是国家科学数字图书馆建设项目的一部分,于2002年3月开始建设生命科学、化学、数学物理、资源环境和图书情报5个QSIG和一个中心门户。各QSIG逐渐开始使用统一的SPT软件包,并根据各自学科领域的特点,分别采用了不同的学科分类标准(如数学物理学科信息门户中的物理采用《国际物理学分类表》,而数学又采用MSC),信息资源类型和元数据方案在DC和DCMI Type Vocabulary的基础上进行了扩展。

标签:;  ;  ;  ;  

质量控制学科信息门户研究_信息门户论文
下载Doc文档

猜你喜欢