NSTL联机联合编目工作的发展与实践,本文主要内容关键词为:编目论文,工作论文,NSTL论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
DOI:10.3772/j.issn.1673-2286.2010.10.007
1 引言
“联机联合编目”是指在计算机和网络环境下,由多个图书馆遵循共同的文件传输协议,共同编目,合作建立具有统一标准的信息资源联合目录数据库,并在此基础上实现联机共享编目成果。
19世纪90年代,世界上出现了第一个以节省人力资源、降低编目成本为目标的集中编目产品——美国图书馆局目录卡片。据当时统计,全世界有21个国家的75个编目机构从事集中编目工作。伴随着资源共享的浪潮,在计算机技术的推动下,真正意义上的联合编目出现于20世纪60年代,其中最具代表性的是美国俄亥俄州54所大专院校联合创建的计算机编目系统,它如今已发展成为全世界最大的联合编目系统——OCLC WorldCat。我国的联合编目建设开始于上世纪90年代,具有代表性的包括:(1)1997北京图书馆在馆藏编目中心基础上建立了国家图书馆联合编目中心;(2)由中国科学院、北京大学、清华大学联合组成的“中关村地区书目文献共享系统”(APTLIN)成功实现了3馆的联机公共检索服务、联机编目及馆际互借;(3)成立于1993年,基于中国教育科研网(CERNET)的“广东高校文献信息网络系统”;(4)自1998年开始建设的中国高等教育文献保障系统(CALIS)。
NSTL的联合编目始建于国家“九五”攻关项目,十余年来,历经了一期建设、二期升级和新时期改造,形成了鲜明的自身特色,并发挥了独特的作用。作为一种合作性编目(cooperative cataloging),NSTL的联合编目通过成员馆之间的合作协同,扩大了文献揭示的范围、缩短了资源报道的周期,并有助于发挥成员馆的专业知识力量;同时,NSTL联合编目也是交互式的联机系统,通过成员馆与中心馆之间的交互,减少重复劳动,执行统一的规范标准,提高了编目的一致性、标准化和规范化。如今,NSTL的联合编目,已从建立之初单纯的资源揭示和资源描述平台,发展成为衔接“联合采购”与“规范加工”和“联合上网”的重要纽带;从早期重视系统和功能的开发建设,发展成为今天更加强调质量控制和规范管理的资源建设;从封闭的图书馆业务系统,发展成为具有支持、保障意识、强调科学化和精细化管理的全局业务系统,在NSTL全新的数字业务平台中,具有不可替代的作用。
2 NSTL联机联合编目的建设沿革
国家科技图书文献中心(以下简称“中心”)的联合联机编目系统基于网络环境,在九家成员单位范围内,按照中心统一制定的编目标准规范进行分散编目、统一格式上传。各成员单位利用计算机技术手段把本馆编制好规范的书目、签到数据上传到中心馆。文献信息编目工作是中心文献信息资源建设的重要基础性工作。十年来,围绕着中心联合目录数据库的建设开展了一系列的研究工作,即联合目录系统的升级改造、数据标准规范的制定和培训、数据的整合与迁移、数据制备整合、理顺工作流程等方面取得了一定成绩,并积累了一定的经验。
2.1 九五攻关成果
Bridge 2000系统软件即“虹桥2000”,作为“九五”期间的国家重点攻关项目“全国西文文献信息计算机联合编目系统”的内容之一,是建立国家科技文献信息保障体系的重要组成部分。该系统以文献信息资源共建共享为出发点,面向科技、面向社会,充分利用现有的设备条件和通信设施,采用现代化技术手段,实现了网络环境下的西文文献的联合编目。该系统曾在14个图书文献部门安装,进行了不同程度的试用。利用该软件完成了文献采购、编目、检索、流通等工作。系统验收时已建成了50余万条记录的数据库。该项任务完成,为建立国家科技文献信息资源保障体系奠定了初步基础[1]。
2.2 “国家科技文献信息计算机联机编目系统应用研究”项目
为充分利用九五攻关成果,探讨国家科技文献信息计算机联机联合编目系统应用的可行性,就联机联合编目系统的改进、提高及推广的具体条件和范围提出建议和意见,于2001年启动了“国家科技文献信息计算机联机编目系统应用研究”项目。该项目于2001年3月9日立项。结合建设国家科技文献信息计算机联机联合编目系统的需要,从深入对比国内外联机联合编目系统的基础入手,根据实际应用需要,就国家科技文献信息计算机联机联合编目系统应用的可行性、系统的改进、提高及推广的具体条件和范围提出建议与意见。2001年12月14日通过胡均平为主任委员的专家委员会的评审鉴定[1]。
2.3 “国家科技图书文献中心联机联合编目平台建设”项目
为配合国家科技图书文献中心文献资源服务二期工程建设,进一步满足国家科技图书文献中心文献资源联机编目和用户对于编目信息资源检索查询的迫切需要,有效保护以往投资,充分发挥“九五”期间科研成果的效益,2002年5月23日正式立项,2002年7月5日下达经费启动该项目。项目组在深入调查、了解用户需求的基础上,借鉴国内外相应系统的经验,利用已有联机联合编目虹桥系统——Bridge 2000,配备了经招标统一采购的相应服务器设备,并在组织集中培训的基础上,初步搭建起国家科技图书文献中心计算机联机编目系统平台。该系统于2002年12月25日,加载了规范化处理的编目数据,在国家科技图书文献中心计算机联机编目系统平台上进行试运行,确保了国家科技图书文献中心文献资源服务二期工程建设如期完成。利用该平台用户可通过关键词、刊名、作者、主题词、出版者以及其他多种检索途径,进行布尔逻辑组配检索,获取简明书目、详细书目以及馆藏登到信息[1]。
通过前一阶段的运行,Bridge 2000存在如下问题:不支持Windows XP、.NET以及基于XML的数据交换;编程环境也不支持Delphi 7.0,因此无法兼容Unicode字符集;统计功能薄弱;Bridge 2000偏重于联机编目,而图书馆管理功能相对薄弱;数据备份和更新维护机制不健全;缺乏基于Z39.50协议客户端远程数据下载功能;系统无规范词表管理功能等等问题。
2.4 “国家科技图书文献中心联机联合编目建设”项目
联机联合编目平台建设为联机联合编目工作准备了必要的硬件基础和软件条件,但要真正实现联机联合编目,还需在平台试运行基础上进一步完善现有的应用软件,不断增加编目数据的数量和品种,建立相应的编目标准、流程和规范化运行机制,使中心的联机联合编目系统持续、有效地运行。同时,进一步实现和改善工程图书馆各成员单位的图书馆管理自动化也十分必要。作为国家科技图书文献中心,文献资源采集、编目、数据加工、揭示服务是信息资源保障建设的重要环节。为此,中心于2003年12月份正式启动“国家科技图书文献中心联机联合编目建设”项目。针对Bridge 2000系统中存在的问题,在保持Bridge 2000原有基本功能的基础上,根据国家科技图书文献中心的实际需求,进一步改进完善联机联合编目的功能。升级改造后的系统基本构成“管理子系统、订购管理子系统、编目管理子系统(含联机联合编目功能)、流通管理子系统(含典藏管理功能)、期刊管理子系统、统计管理子系统(未完成)、规范词表管理子系统(未实际应用)、OPAC(联机公共检索目录)子系统、数据备份恢复子系统、帮助子系统”等10个子系统,并于2005年12月底通过专家评审验收。升级改造后的系统将被称为虹桥Bridge2K系统[2]。
Bridge2K系统将充分借鉴国内流行图书馆自动化管理系统的应用经验和特点,突出国家科技图书文献中心的资源利用和用户服务的需要,主要体现了以下特点:
(1)系统设计思想先进:①采用OOA/OOD/OOP技术,将业务规则设计成COM+(组件对象模型)/CORBA(公共对象请求代理结构)物件;②系统架构采用CORBA体系结构,使之具有跨系统、跨平台、跨语言的开放性;③用MARC规范描述对象属性,进而建立基于对象间关系的数据间的链;④采用了.Net、Web Services/Soap(简单对象存取协议),即当时系统开发时较流行的系统工具和平台,使改进后的图书馆自动化管理系统更具有开放性和可扩展性;⑤引进通用规范,基于XML规范进行数据交换,提高了系统的开放性和兼容性。
(2)增加了主题书房、推介服务、个性化用户服务(SDI)功能。
(3)通过对Delphi 7的改进和完善,可支持Unicode,具有多语种的处理环境。
(4)统计功能单独设置统一入口,统计数据可动态刷新。
(5)增加主题词表、分类词表等规范词表管理功能。
(6)OPAC彻底本地化。
(7)增加Z39.50客户端软件,支持远程数据下载。
(8)用户界面(窗口)更友好;编目用户界面可以选择两种输入方式,一种是模板式,另一种是Marc格式。
(9)对数据可进行规范性检查和校核,加强了数据质量控制。
2.5 虹桥Bridge2K系统的完善和改进
根据国家科技图书文献中心的发展战略的需要,建立起以文献综合管理系统、联合联机编目系统、联合数据加工系统为主的内部业务平台和以网络服务系统为门户的对外服务平台,并调整部署NSTL联机联合编目系统(虹桥Bridge2K)作为NSTL各类文献书目数据、签到数据和馆藏数据的规范平台与单一输出源头,以促进NSTL内部的系统流程与业务机制的不断优化和规范管理。为此,虹桥Bridge2K系统将进行相应的功能扩展,基于OAI-PMH协议实现对NSTL数据加工系统、NSTL网络服务系统的动态实时交互;同时,对现有联合编目系统的内部流程和规范功能进行调整与改造,增强系统的数据规范与控制能力。2008年4月份立项开展“基于OAI-PMH联合联机编目系统的功能扩展”项目研究。经过功能扩展后的虹桥2K系统,具备了基于OAI-PMH数据接口的规范数据自动收割、错误数据自动反馈、数据接口管理配置等功能;同时在数据规范与书目控制机制上实现了深化。该项目研究于2009年4月30日通过专家评审验收并正式进入运转,目前已能够全面支持NSTL数据联合加工系统、NSTL三期网络服务系统的数据收割。
3 理顺工作流程,强化组织协调管理
3.1 加强联编的内部组织管理
为适应数字图书馆建设的需要,切实改变相关工作环节多头为政、系统关联差的状态,实现各环节数据的一致性,促进各项工作的有序高效运转,提高工作效能,2005年底,将联编工作纳入中心资源建设部管理,由中心资源建设部负责NSTL联机联合编目工作的组织管理与协调,即制定年度工作计划,督促检查年度计划的实施;组织制定联机联合编目工作的标准规范及相关规定。为了便于开展联机联合编目工作,在中心资源建设部直接管理下建立联机联合编目工作组,组内设立了编目质量控制小组、编目系统技术支持小组。明确了中心资源组、各编目工作小组、成员单位编目组、数据上传工作流程职责及工作激励机制。以上举措,有力地推进了联编工作的运转。
3.2 加强上传数据的时效性
为了理顺工作流程和加强联机联合编目工作管理,按照中心的统一部署,NSTL数据加工母体文献规范工作从2008年4月1日起,由联机编目系统及时为联合数据加工系统和网络服务系统提供规范的母体文献数据。为保证数据的时效性,上传数据时间逐步调整,从无序化趋于规律化,数据上传频率不断增加,新书目数据每周最少上传一次,签到数据每天上传。2009年实现了中心经费支持的科技期刊、会议录、工具书、报告、丛书等文献类型的书目、签到数据的常态化上传。截至2010年2月底,虹桥Bridge2K系统收录各种文献类型书目数据总量117480条,期刊签到量总计286372条。经过多年的磨合实践,理顺了中心馆与成员馆的业务层之间的关系;理顺了编目系统与联合数据加工系统和三期网络服务系统业务流之间的关系,保证了各环节数据的一致性,为联合数据加工系统和网络服务系统提供了数据的支撑。
4 加强科学管理,建立规章制度
规章制度的建设是编目工作实现科学化、规范化、格式统一标准化的重要条件之一。同时,随着编目工作自动化、网络化程度的逐步提高,工作手段不断更新,编目技能的学习和不断的培训,编目员从事网络环境下编目工作的熟练程度在不断提高,规章制度也在不断接受编目工作实践的检验,并随着编目工作的发展和人们认识的深化不断修改、完善,使之成为编目工作科学管理的准则和依据。基于上述考虑,2004年成立了“编目规范研究课题组”,在原《西文文献数据库数据处理手册》(1997试用版)的基础上,按照国际标准的规范体系对各类文献进行了相对科学、合理的划分,并按照统一的格式,以分册形式编写了连续出版物、科技报告、学位论文、西文图书等多种类型文献编目手册,在各单位编目工作中起到了重要的指导作用。2007年,NSTL联机联合编目工作组针对虹桥2K系统,参考新版《MARC21机读目录格式》,对NSTL各种文献类型编目手册的有关字段进行了修改与规范。为了进一步加强管理,在以上规章的基础上,2008年制定了《NSTL联机联合编目工作管理试行办法》、《NSTL期刊编目和签到工作规则》、《NSTL西文会议文献编目工作规则》、《NSTL电子资源编目手册》、《NSTL电子资源管理暂行办法》、《NSTL联编书目、签到质量控制操作细则》等规范。几年来,在制度的约束下,在各成员馆的大力协同合作和积极努力下,联机联合编目书目数据、签到数据的标准化与规范化水平得到了加强。
5 增强质量意识,提高数据规范
5.1 把好数据质量关
虹桥2K系统中设置有机审、查重、著录检测参数功能,建立了严密的数据质量审校流程。在书目、签到数据制作过程中虽有遵循的标准和规范,但由于各成员单位编目人员的编目水平高低不同,对编目规则的理解存在差异,容易导致数据质量良莠不齐,加之虹桥2K系统的质量检测识别能力不是很强,比较传统人性化,特别是同一个品种的多家馆藏数据上传质量的控制和合并馆藏,还需要在机审的基础上,人工逐条干预审核判断确认。为尽量减少误差,实行了机审和人工干预审校相结合,成员馆和中心馆两级把关的审校制度。即数据质控流程:成员单位本地机审参数加载、设置→本地机审→修改本地数据→上传中心馆;中心馆质检刷新→书目记录机审→人工审校确认→合格数据通过,不合格数据退回修改→审校完毕。审校人员按照质控流程对书目、签到数据上传的每一环节、著录格式的每一字段都要经过严格的审校,数据质量控制得到了提高。
5.2 数据规范与培训
书目数据的规范化是资源共建共享的基础。联机联合编目只有建立在统一标准的基础上,才能使书目数据的著录达到完整性。中心联机联合编目的格式采用中国机读目录格式(CNMARC)的著录格式,对各单位自动化管理应用MARC格式(USMARC、CNMARC)中心不作统一的限定,但对上传数据的格式要求须以CNMARC的格式上传。中心依据《中国机读目录格式使用手册》的著录规则,结合中心对文献编目揭示的特殊性,依据字段规则设置MARC格式的必备字段、非必备字段和可选字段,如连续出版物的著录信息块是10个字段,而中心只设200、205、207、210、225五个字段。对期刊题名和ISSN变化的揭示,为配合文献数据加工文献揭示的需要,连续出版物增加了912字段,用于详细记载ISSN和题名变化的断点的卷期年月标识,本字段有则必备。同时根据中心不同的文献类型的特征制定了相应的操作规则,进一步强调了MARC字段的必备性和相对应必备字段的关系。如110字段出版周期代码($aafa )(|也可用空格代替),要与326字段的$a最近的出版周期相对应($aMonthly)。对于单篇文献(论文、科技报告等)的著录应按统一会议名称进行集中著录,统一作一条编目记录;多卷会议录则应展开编目揭示。对日文汉字部分,使用GBK字符集中的汉字。与现行中文简体汉字不同的日文汉字(如“电”—電),可在“全拼输入法”状态下找到相应的日文汉字并录入。对以学协会、科研机构和同一个编辑部出版一组的套订外文期刊、文献,须以专题名称展开编目揭示,并在相关字段反映出套题名与专题名连接关系。为确保中心联机联合编目工作的正常运转和编目数据的规范,针对编目数据中不够标准规范的数据或字段间容易混淆概念的字段等存在的问题,以开展经常性的编目业务培训或进行电话个人业务指导。经各方大力协同、积极努力,对联机联合编目的概念和意识得到了加强,中心编目数据规范的水平大大提高。
同时实行任务与著录规范的分级管理激励机制,根据各成员馆年度编目计划量给予一定的书目、签到数据上传奖励补贴,在一定程度上对确保数据的质量和年度任务的完成起到督促作用。
6 联机联合编目工作发展的思路
在取得成绩的同时,我们也必须看到工作中还存在着一些问题。经过多年的运行,系统还存在性能不够稳定、适用性较差、系统不能正常更新维护的问题。CNMARC格式的转换中存在着转换的误差;本地编目上传后,仍出现上传与审校数量不一致的异常等功能缺陷;著录不够标准,文献类型选择不规范,会议录著录缺会议名称、时间、地点等问题等等。
基于目前中心虹桥2K系统应用中存在的问题和经细化管理的要求,如此的现状迫切需要构建一个技术先进、功能齐全、安全可靠、可维护性、扩展性、适应性强、多种资源类型标准兼容、使用方便的中心联编系统。
6.1 重新构建中心联合目录新系统
为适应国家科技数字图书馆建设和发展的需要,实现从文献备选—订单—发订—验收登到—编目—加工—收割—发布全业务流程的科学化、规范化、精细化管理,中心正在全力打造以“文献综合管理系统”、“联合编目系统”、“数据联合加工系统”为核心的数字业务工作平台,实现业务工作的高效运作。按照中心工作的部署,于2009年6月份立项启动“NSTL联合目录系统需求分析”项目研究。此项目由中国农业科学院农业信息研究所颜蕴教授牵头主持项目组工作。项目组针对虹桥2K系统应用中的优缺点进行了深入的调查研究和分析,在此基础上,结合数字图书馆建设的要求和联编实际应用的需要,从任务概述、数据描述、功能需求、性能需求、运行需求、安全性、编目数据核心字段及审校规则和签到数据必备字段及审校规则等几个方面提出了“NSTL联合目录系统需求分析”的需求说明书,于2010年3月初提交中心联机联合目录新系统研发项目组进行新系统设计方案。新系统的建设和启用之时,将标志着国家科技图书文献中心联机联合目录业务流达到一个新的水平。同时,对中国化工信息中心五个成员单位图书馆自动化管理系统虹桥2K需进行适应性改造。
6.2 强化数据规范和标准化
书目数据库的标准化、规范化直接影响着中心联机联合编目的整体服务水平。虽然中心已制定统一的标准规范和要求,但九家成员单位各自有本单位的编目规章和条例,编目人员对数据格式、规则的使用和理解都存在一定的差异性,使书目数据难以达到完全的一致性或标准性,上传中心的编目数据仍存在不规范的现象,需进一步深化规范。为确保书目数据制作的标准化、规范化,对现有编目标准规范需进行修改完善。根据中心对信息资源揭示的特殊要求,除系统要设置严密的质量控制功能外,需制定一系列详尽的编目、签到细则以及工作操作手册,强制推行各种相关规范措施,在规则的约束下进行操作,保证书目、签到数据的标准化和规范化。
6.3 提高编目及系统管理人员队伍素质
由于中心联机联合编目的运作方式是分散自主编目,各单位编目基础工作扎实程度不一,编目人员的技能水平参差不齐,有的不能正确掌握著录规则及检索点的选取方法。对MARC格式各个字段与著录单元之间的关系、字段指示符的特殊意义等的理解存在差异,导致数据过于简单,该提供的检索点不全,必备字段不完整。套录编目有现成的数据可以利用,但联机下载下来的数据还需要编目员去甄别、修改,才能转化成本馆的数据,如果编目员水平不高,套录的数据就有可能出现差错。编目人员的素质直接决定着编目数据的质量。为加强编目人员、质检人员的技术素质,可编制机读目录标准规范、工作操作手册和开展联机编目为主题的、更有针对性的培训班和研讨会,培养一支素质过硬的技术队伍。
(收稿日期:2010-08-30)