图书馆员需要互联网 互联网更需要图书馆员——在中文元数据应用国际研讨会上的总结发言,本文主要内容关键词为:互联网论文,馆员论文,图书论文,在中论文,研讨会上论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一
在过去的20年里,图书馆经历了两次大的冲击。第一次发生在80年代中期,计算机技术和通讯技术的结合推动了互联网的发展,有人预测随着无纸化社会的来临,图书馆将走向消亡;第二次发生在90年代末,并一直延续到现在,由于互联网的大量普及,电子信息以几何级数迅速膨胀,有人担心互联网的导引系统和搜索引擎会替代图书馆的功能,成为人们获得信息的重要途径[1],出现了图书馆还有没有存在价值的怀疑。
图书馆经受了第一次考验,图书馆不仅没有消亡,相反20世纪末出现了空前的新馆建设热潮,人们不再把图书馆看作是一个藏书楼,而是一种传播知识、交流思想的社会文化事业。今天,图书馆正在面临第二次考验:图书馆能否向人们提供比互联网的导引系统和搜索引擎更有效的服务手段?能否继续成为人们获取信息的“第一选择”[2]?
这是本次研讨会所探讨的问题。有人认为,元数据只是互联网资源建设或者说数字图书馆建设中的一个小问题,何必这样兴师动众,把这么多专家从世界各地请来呢?我想这里有一个前提,如果图书馆不去关注互联网资源组织和整序的话,或者如果认为图书馆没有必要在互联网上占有一席之地的话,可以说,靠着千百年来积累的经验和知识,图书馆这一专业似乎还可以维持一段时间,但是我们已经可以看到尽头了。我相信,没有人会赞同这一假设。
我们正在进入一个网络化时代。网络资源层出不穷,网页内容以每12个月翻一番的速度向前发展[3]。如何从浩如烟海的网络资源中获得所需要的信息,是互联网世界面临的一大难题。大部分搜索引擎都是以自动抽取关键词为主要手段,辅以一些如布尔检索、加权检索等增强措施,难以克服检索效率低、有用信息少的问题。有人讽刺地把这种现象叫做“互联网信息检索定律”:即在互联网上您总能找到(甚至只能找到)您不需要的东西[4]。
这些年来,图书馆界的专家们一直在探索如何将知识组织与整理的技术应用到网络上的问题。5年前,南京政治学院张琪玉教授就有关人工语言与自然语言的关系问题断定,自然语言要全面胜过人工语言是不可能的,除非它引进许多情报检索语言的原理和方法,而不是单纯的自然语言[5]。今天,在自然语言检索更加成熟的时候,张教授依然坚持“网络信息的人工标引在现阶段的必要性和合理性”[6]。在本次研讨会上,台湾辅仁大学图书资讯系吴政睿教授也认为,为了提高互联网信息的检索效率,有必要先行对资源做某种程度的加工。与会代表们都有这样的共识:时代赋予图书馆员一个新的使命,就是通过网上资源编目,把无序的网络空间变成有序的数字图书馆。实践将证明,图书馆员需要互联网,而互联网更需要图书馆员。
在过去的几年里,研究既能解决数据的结构化,又能克服数据过于烦琐的过程中,元数据应运而生了。有美国联邦地理数据委员会的地理元数据项目FGDC,适应于档案和原稿的EAD,以及广泛使用于图情界的DC、MARC和AACR等。特别是DC元数据,为国际图情界提供了比较成熟而又比较成功的资源描述手段,至今已被翻译成26种语言,其用户遍及世界各地,一些国家已经将其纳入国家标准中。DC元数据的影响逐步扩大,很有可能在将来成为各国都能接受的国际标准。
关于中文环境下的元数据应用,国内已经有一些研究和应用项目,在图情界以外,有中国21世纪议程管理中心、国家科委、国家计委、国家经贸委和中国科学院等共同开发的“中国可持续发展信息共享示范系统”,已经推出了地理、海洋、植物、自然灾害等元数据库。在图情界,国家图书馆、上海图书馆、广东中山图书馆、北京大学图书馆和清华大学图书馆等正在积极组织力量开发元数据项目。北京大学图书馆的拓片元数据项目,清华大学的建筑元数据项目和上海图书馆数字图书馆项目已经进入实用阶段。上海图书馆的数字图书馆项目在刘炜等一批年轻专家的努力下,参考和运用国际通行的元数据理论与技术,在跨库检索等数字图书馆的关键领域实现了突破性的进展。
二
本次研讨会对中文元数据的应用进行了实质性的研究,组织了两个专题讨论,一是有关元数据标准化的讨论,二是有关元数据开发与应用的专家论坛,请了9位专家共同回答与会者的提问。
国家图书馆、北京大学图书馆、广东省中山图书馆、上海图书馆和台湾辅仁大学图书馆介绍了各自元数据项目研究进展。北京大学图书馆馆长助理肖珑作了“中文元数据标准的设计与实现”的报告。该馆几年前以拓片为基础开展进行元数据研究实验,2000年5月,“古籍数字图书馆元数据”立项,开始以善本、拓片、舆图、敦煌文献,以及旧报刊等特藏文献为对象进行元数据开发研究,已经完成了中文元数据标准框架和拓片元数据标准等的设计,系统开发已接近完成。
广东中山图书馆副馆长莫少强介绍了该馆与北京世纪超星公司合作开发的超星数字图书馆项目。该项目采用中文化的DC元数据格式大量制作元数据,利用TRS中文全文检索系统作为书刊搜索引擎,实现数字图书馆的跨库快速检索和分布式数字资源共享。该项目根据《数字式中文全文文献通用格式》,采用DC15个项目加记录控制号共16个项目,以便中文数字资料的相互交换和国际接轨。
上海图书馆系统网络中心副主任赵亮以“上图数字图书馆项目的元数据应用”为题,介绍了上海图书馆元数据开发现状。上图数字图书馆以IBMDL2.4为开发平台,该系统的元数据方案采用以DC为核心集、多种元数据并存的方法,根据基于XML/RDF的资源描述体系将各类数据封装在一起,统一了元数据的描述方法,保证了原始素材内容管理中元数据的完整性,提高了元数据之间以及与其他资源对象数据之间的互操作性,同时也提供了一个统一的内容管理体系。
一些代表从自己的实际经验出发,对元数据的应用与未来发展进行了深入的探讨。如加州大学柏克莱分校东亚图书馆周幼兰女士根据自己多年从事资源编目的丰富经验,作了题为“元数据环境下国际华文书目交换的展望”的报告,该报告分析了MARC与DC之间的关系、元数据词语规范以及中文书目在元数据环境下进行国际交换的可能性,提出DC元数据集和各种MARC格式之间的对照表陆续出台,正好为悬而未决的国际中文书目交换提供了一个可行方案。她提醒与会代表不能因为有了DC元数据而舍弃MARC,而应有效利用“与生俱来”的元数据(比如题名、标识符、出版者等),使两者取长补短,发挥各自的特长。
台湾辅仁大学图书资讯系的吴政睿博士,在题为DC在图书馆应扮演的角色”报告中,提出了“一般性资料”(书目资料、网页以及数据库)的概念,建议图书馆界可以在一般性资料”上,应用DC元数据集作为其资料记载的格式,来一统上述三种主要的资料来源。吴政睿博士带来了最新出版的《都柏林核心集与图书著录》一书。吴博士的很多观点,如资料著录与资料格式分离的问题、标目与检索点等概念的缺陷等都有很多创新与独到之处。吴政睿博士还介绍了由他主持研制开发的梵谛冈传信大学中文联合馆藏系统(UCS)和台湾地区中文联合系统(UCSTW)的运作情况。
美国加州大学欧文校区图书馆的曾程双修女士在“应用元数据构建全球性的网上中文图书馆”的报告中,呼吁中美图书馆员之间加强交流,共同立项创建符合国际标准的网上中文资源,为此她提出了一项促进两国图书馆之间发展网上中文资源及其共享的合作建议。
负责参与制定中文元数据标准的中国数字图书馆有限公司的镇锡惠研究员在会上介绍了“中文元数据标准格式的研究和制定”情况。近年来,中国国家图书馆在中国数字图书馆的研究和开发以及“中文元数据工作小组”的项目研究上,做了大量组织与协调工作。
本次研讨会还邀请DC元数据项目的负责人、OCLC的S.Weibel博士,数字图书馆专家、日本图书馆情报大学的杉本重雄教授,澳大利亚墨尔本大学的L.Nevile博士等,分别作了精彩的演讲。S.Weibel博士从DC元数据应用的角度,向与会代表展示了国际元数据发展的趋势;杉本重雄教授介绍了日本图书馆情报大学元数据应用的实践,并就元数据在亚洲地区的应用与发展提出了不少建设性的意见;L.Nevile博士作为DC元数据计划在澳大利亚应用的总代表,介绍了澳大利亚元数据应用的现状和趋势,给予中国同行不少很有价值的启示。
三
中文元数据的研究在我国还刚刚起步,本次会议是国内图情界首次有关中文元数据研究的专题研讨会,与会专家希望通过本次会议在元数据研究领域形成一些共识,为今后的发展起到积极推进作用。为此汇总了会上各位代表的观点和认识,提出如下五点意见。
1.重视数字图书馆资源建设。要把网上信息资源的组织与整理放到重要的议事日程上,加强对网上信息资源描述和管理的研究。要加强图情界同行之间、数字图书馆项目之间的沟通、交流与合作,通过对元数据的理论研究与应用开发,提高数字图书馆建设的整体水平。
2.开展专题调查研究。组织“元数据应用”的地区性或全国性调查,全面了解元数据普及与应用的程度,广泛征求研究人员和用户对DC及其他元数据的意见,并公开调查结论,以促进国际元数据应用的交流和发展。
3.加快中文元数据标准化研究的进程。研究国际上先进、通用的元数据标准或应用方案,对目前流行且具有国际化前景的各类元数据方案进行比较研究。在保持与国际标准接轨和兼容的基础上,充分考虑中文资源应用特点,吸收和参考各种成熟、规范的编码体系,研究符合中文资源应用需求的扩展领域,形成适用具体应用要求、适合中文资源特点的应用规范,提高互操作性。
4.促进中文元数据应用的技术推广工作。鼓励开展一些标准化程度高、技术含量大、应用效果好的合作项目,推动现代信息技术环境下中文元数据的编码、著录规范及相关技术的探索实践。同时,努力探讨与实施中文元数据注册管理机制,推动标准化、模块化的中文元数据应用方案的交流与推广。
5.在推广元数据应用时,应进一步了解和重视以MARC为代表的元数据的利用与发展趋势。针对各种元数据的不同特点,取长补短,发挥各自特长,对各种信息资源形态与特点的资源进行有效的内容组织与信息挖掘。加强各种元数据格式之间的融合,提高中文元数据应用的互操作性。
(收稿日期:2001-05-10)