网络环境下书目信息资源共享的思考,本文主要内容关键词为:信息资源论文,书目论文,环境论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G257[文献标识码]A[文章编号]1003-2797(2003)02-0002-05
如何有效利用现代技术设备开展书目信息服务,尤其是在网络环境下整合书目信息,以便提高书目信息的服务质量与效率,是我们近几年一直进行的研究课题。
1 我国书目信息服务现状分析
在社会主义市场经济条件下,我国的书目信息服务情况可用几句话来概括:书目信息服务的内容不断增加,书目信息服务的范围不断拓展,书目信息服务的领域逐步扩大,书目信息服务的方式越来越多,书目信息服务的质量与效率逐步提高,书目信息服务的手段越来越先进,书目信息服务中存在的问题也越来越突出。
1.1 我国图书情报机构的书目信息服务状况
从武汉大学出版社出版的专著《书目情报需求与服务研究》中披露的调查资料可知,国家书目信息、专题性文献及出版物推荐目录信息、地方文献及出版物目录信息三者的被利用率,分别占调查样本数的51.7%、48.53%与33.1%,由此可见书目信息资源在人们工作和生活中所起的重要作用。书目信息服务的提供方式,一般有传统印刷型方式及现代技术型方式两种。长期以来,我国书目信息主要是以传统印刷型形式出现。1996年以后,随着因特网及其他新技术、新材料、新工艺的出现,我国书目信息服务的内容与形式明显增加,如通过网络向社会大众及本馆读者及时通报馆藏文献信息;通过网络查阅、订购、下载书目文献信息及出版物内容信息;利用网络享受联机文献借阅和复印等信息服务内容;提供CD-ROM封装盘片形式的可供货书目信息;网上发布并可下载的图文并茂的出版物外观、内容提要及其他书目服务信息,等等。
我国图书馆界于20世纪70年代中期开始将MARC等书目信息新技术、新规则介绍到国内。与此同时,我国高校图书馆也开始进行微型机西文编目、查目、新书通报和流通管理的试验。当时北京大学图书馆研制出“北京地区西文新书通报系统”和“西文图书联合目录系统”,南京大学图书馆采用简化MARC格式进行了“西文编目研究”,中南工业大学图书馆研制出“微型机湖南地区西文期刊目录系统”,武汉大学图书情报学院研制出“微型机图书情报西文书目检索系统”和“图书馆流通管理自动化系统”等等。20世纪80年代中期,我国有更多高等学校和科研院所进入计算机文献信息服务研究领域,陆续开发出实用的微机编目系统,并开始进行局域网环境下的联合编目工作,其中比较有代表性的有上海交大、复旦大学、中科院上海分院联合开展的“上海地区西文书目信息检索网络”研究计划,中科院、清华大学、北京大学三所图书馆联合开展的“APTLN”书目信息检索网络建设与研究工作等。
我国图书馆自动化工作开展至今已近30年。在众多图书馆自动化管理系统中,原北京图书馆与深圳图书馆的自动化系统在图书馆界有较大影响,并且已推广到全国多家省市公共图书馆与高等学校图书馆。20世纪90年代后我国图书馆界加快了编目自动化的研究进程,利用网络环境实现计算机编目的应用研究也逐步开展起来。1995年国家投资建设的“中国教育和科学研究计算机网络(CER-NET)”加快了我国高校图书馆的计算机编目和书目数据库的建设进程,全国各高校通过校园网就可进入CERNET,方便地通过网络利用其他高校的信息资源,而且还可以借助CERNET与INTERNET相联,从而直接利用因特网信息。
在国家有关政策的支持与鼓励下,我国信息化基础设施的建设取得了重大成就。20世纪90年代建成的中国公用分组交换数据网(China PAC)、中国公用数字数据网(China DDN)、中国公用计算机互联网(China NET)等,为我国高校、公共和专业图书馆开展联机编目、合作编目创造了良好的网络环境。近些年我国电信部门陆续推出了ISDN、ADSL等多种较高网络传输速度的新型数据传输方式,为我国图书情报部门提供了较过去更好的书目信息传递工具。20世纪90年代我国又推出了中国文献机读目录标准(CNMARC),为进一步推进我国文献机读目录信息的交换和共享创造了良好的条件。
1.2 我国出版发行界的书目信息服务状况
我国出版界于1991年开始正式采用CIP(在版编目)规则,1996年国家新闻出版署信息中心专门成立了CIP处,负责组织、规划、协调与管理全国的在版编目工作。目前,全国有超过百分之五十的出版社已进行CIP工作,并正在研究利用计算机处理出版社在版图书的目录信息。在数据通信和计算机网络等现代技术手段被引入出版业之前,传统印刷型书目一直是我国出版发行部门的主要书目信息服务工具。通过印刷型书目信息报纸预告新书及可供图书信息,为书店及广大读者提供有效的订购参考信息。
改革开放以来我国出版社数量不断增加,出版物的品种与数量直线上升,传统的印刷型书目信息服务方式已暴露出诸多不足。因此,引进发达国家的先进技术,利用网络环境实现出版信息的传递和出版物的交易,已成为我国出版发行部门的共识。1995年,新华书店总店与北京、辽宁、上海、江苏、浙江、湖北、四川、广东等八家省级书店联合研制我国出版发行业的互联网——“全国出版物发行信息网络(CPRN)”,并希望将该网络建设成为覆盖全国、以新华书店为主体、以出版社为源头、兼容其他发行渠道和社会读者,集批发、零售、订购、查询于一体的出版发行信息系统。1998年10月,该项目完成了网络“中心”和八个省网络“分中心”的硬件配置建设、软件安装以及与信息产业部CHINA PAC和 CHINA DDN通信骨干网的联接工作。1998年底,“全国出版物发行信息网络”投入试运行,并将工作重点逐步转向发展网络成员及建设可供书目数据库等方面。一方面,希望能够吸收更多的出版社、地市县书店、集个体图书发行机构成为网络成员,使它们能够享受通过网络订购图书的优质服务;另一方面,希望各个网络成员不断将可供书目与征订书目信息充实进网络数据库,满足网络成员订购、查询与余缺调剂的需求。该项目后期进展不理想,多种原因导致网络成员的发展工作陷入停顿,“全国出版物发行信息网络(CPRN)”的运作出现困难。目前,新华书店总店信息中心已改与网络信息技术公司联手,建设具有电子商务功能的网站,利用因特网向国内外用户提供书目信息并开展出版物销售服务。
国家新闻出版总署一直在积极推动建设“中国出版物在版编目数据库”,使广大读者能够通过网络查阅出版信息和可供出版物信息。与此同时,一大批书业网站(如“当当书店”、“人民时空”、“旌旗书店”、“北京图书大厦”、“上海书城”等)正通过网络向广大读者提供可供货书目信息,方便读者在线浏览与购买出版物。
2 我国书目信息服务中存在的问题
我国书目信息服务工作存在的问题,归纳起来主要有:
(1)国家书目信息报道的时滞过长,文献被重复报道的现象时有发生。与发达国家的书目报道仅需一周时间相比,我国《全国新书目》的报道周期长达一个月。此外,在《全国新书目》、《全国总书目》、《中国国家书目》中收录的文献及出版物存在大量的重复;就是出版发行行业自己编制的《社科新书目》、《科技新书目》以及省级书店的宣传书目中,重复的书目信息也不少。
(2)书目信息格式不一致。无论是出版机构在网上发布的书目信息,还是书店系统长期使用的传统印刷型书目信息,其格式与我国图书馆等信息服务部门的书目信息格式不完全一致,与出版社在版编目的格式也有许多差异。由于格式的不一致,直接影响了书目信息的兼容与共享。
(3)统一书目信息格式存在着困难。就CIP数据而言,它对书目信息服务部门的确重要;但对出版社而言,有没有CIP数据,CIP数据的质量如何,并不影响出版物的销售,所以它们对CIP的重视程度就不如信息服务部门,目前仍然有将近一半的出版社未执行CIP数据;那些已执行CIP数据的出版社,也存在着诸多问题,主要表现为数据不详尽、标识符号不准确、著录项目遗漏、著录格式不规范等。
(4)图书正式出版后的数据与出版前征订目录中的数据时有变动。例如图书的“估价”项,据武汉大学出版社总编室的同志介绍,有将近百分之二十的图书正式出版时,“定价”与原“估价”不同。又如“页数”、“出版时间”、“书名”等项,出版后的正式数据与出版前的宣传数据都会有所不同。如果将出版前书店的征订目录数据直接作为图书馆的目录使用,必然有部分数据在出版物到馆后需要修改。这时在图书馆机读目录数据库的多个数据文件之间,就很容易因修改的遗漏而产生记录彼此的不一致。
(5)书店征订目录不适合图书馆直接使用。一般来说,书店征订目录中没有提供图书信息检索点的排检项,其分类也比较粗略,仅指出了出版物所属大类,没有给出具体的分类号。在图书馆等信息部门的信息服务中,书目信息中的排检项十分重要,它是读者能够接受正确信息服务的切入点(如书名、作者、主题、分类号等常用的检索点)。如果图书馆直接用缺乏主题词与详尽分类号的书店征订目录作为自己的目录,将对读者通过书目进行的信息检索十分不利。
(6)出版社在版编目(CIP)数据产生的延迟直接影响书店征订目录的编制与出版物的推销宣传。书店系统编制征订目录,是希望社会公众在图书正式出版之前就能了解这些出版物的信息,以便赢得更多的订数,占有最大的市场份额,获取较好的经济收益。为了改变传统发行方式下出版物信息产生与传递不及时的问题,出版发行部门非常希望出版社能在图书正式出版前就尽早提供准确的出版物信息,以便书店及时编制出征订目录。一般情况下,出版物的在版编目(CIP)数据都是先由出版社编制,再报送并等待国家版权局审核批准,然后由出版社以订单的形式传递给发行部门。这种运作方式使得直接利用CIP数据编制征订目录的设想难以实现,也无法满足书店获取订数所需要的充足的宣传时间。
(7)书目信息来源于它所对应的出版物以及编辑生产它的出版社。出版社的编辑人员虽然具有较强的稿件编辑、组织与加工能力,但缺乏能够准确确定每一种出版物的在版编目数据的知识,也缺乏编制书店征订目录与图书馆书目所需的知识。因此,目前我国出版物的在版编目数据(CIP)质量存在这样或那样的问题,无法满足书店与图书馆等书目信息服务部门在编制书目时的各项要求。
3 网络环境下整合我国书目信息的措施
为了提高书目信息的通用性与兼容性,我国图书情报界自20世纪70年代起就采用文献信息著录交换用国际标准(MARC),并开始书目自动化应用的研制与推广工作。我国图书发行部门为了增加出版物的销售,非常重视编制与发行出版物征订目录,各种征订目录(如《科技新书目》、《社科新书目》、《上海新书目》等)一直都在为宣传推销出版物服务。出版社编制的图书CIP数据,有不少地方与图书情报界的书目不同,与书店的征订目录也有不少差异。这三类书目的数据来源、编制单位及信息传递路径都不相同。在这种情况下,寻求一种能整合三种不同书目信息的途径与方式是非常必要的,也会遇到各种阻力与困难。为此,笔者提出如下一些建议。
3.1 统一思想、提高认识是整合书目信息的前提
要使书目信息整合工作得以顺利进行,首先必须统一思想,提高认识,使三大书目信息部门的领导和有关人员都能认识到整合书目信息的重要性,并积极支持这项工作。具体而言,出版社必须加强在版编目(CIP)工作的组织及在版编目工作人员的队伍建设,提高CIP数据的编制质量;书店等图书发行部门要加强征订书目的组织工作,提高书目数据工作人员的业务素质及工作责任心,以保证所给出的出版物分类号、主题词(或关键词)的质量;图书馆与情报部门应提高对书目信息整合重要性的认识,重视对出版社、图书发行机构有关技术人员的培训,帮助他们提高CIP及征订书目数据的质量,同时需要改变自身对CIP数据及征订书目数据的不信任态度,制订直接采用CIP数据及征订书目数据的措施,为整合书目信息营造良好的软件环境。
3.2 以出版社在版编目为基础整合我国书目信息
抓源头、带全面是整合我国书目信息的主导思想。由于出版物书目信息的源在出版社,所以,建议以出版社在版编目数据(CIP)作为三种不同书目信息格式整合的突破口。具体来说,应在国家在版编目条例的基础上,制定在版编目的补充规定,对在版编目数据项做适当的修改和补充,使CIP数据成为一种能满足各方面书目信息应用要求的书目信息数据。为此,建议由国家信息服务主管部门发布对整合后书目信息格式的具体要求,由国家信息与文献技术标准化委员会出面组织协调,成立由国家重点(权威)出版社在版编目编制人员、书店及出版社征订书目信息组织人员以及图书馆和情报部门编目部技术人员共同组成的“中国书目信息格式整合工作小组”。在充分协商的基础上,按照国家文献书目信息交换标准(参照有关的国际标准)的要求,充分考虑各个信息服务部门的业务特点与要求,制定出符合书目信息资源共享要求的新的书目信息著录格式。出版社在版编目人员只要严格遵照新的书目信息格式组织CIP数据,经国家版权部门审核通过,就可以传递给书店、图书馆及其他信息服务部门直接加以使用。
3.3 充分利用网络环境实现书目信息的整合
为了满足书店征订目录与图书馆藏书目录多方面的要求,可以考虑充分利用网络资源,将出版社、批发书店与图书馆联系在一起,形成全国范围的庞大书目信息广域网。审核后的出版社在版编目(CIP)数据可经过这个网络迅速传递到批发书店和图书馆等信息服务部门,使它们在第一时间就能直接用CIP数据编制征订目录和馆藏书目。为此,整合后的书目信息格式必须与在版编目(CIP)数据格式高度统一,书店、出版社、图书馆(包括信息所等信息服务部门)都必须具备网络应用条件。为了给规范化的书目数据的传送奠定物质基础,需要加快“金版工程”建设。应在国家信息产业部与新闻出版总署的指导和协调下,继续完成“全国出版物发行信息网络”和“全国新闻出版管理信息网”以及与之配套的四个大型数据库的建设。这四个大型数据库为“新闻出版管理数据库”、“中国百科术语数据库”、“图书在版编目数据库”和“国家新闻出版版权数据库”。一旦“金版工程”完成,就能从根本上解决在版编目信息、征订目录信息传送慢的问题。这项工作可以在新闻出版总署“金版工程”的统一规划下,集中全国出版社、书店、图书馆、电信部门与网络公司等多方面的力量,建设这个全国性的网络平台;各出版社可以通过该网络直接将本社出版物的CIP数据传递给国家版权局审核,核准后又可以经由网络传递给书店,书店据此能顺利地转换成征订目录。国家重点信息工程中国教育与科研网(CERNET)已运行了五年多,它在上世纪末就已吸收我国大多数高校及科研院所的图书馆入网,使数以百计的我国高校图书馆通过该网络共享书目信息资源。如果再将全国公共图书馆自身的自动化管理系统也接入CERNET,就能实现以图书馆系统为基础的书目信息服务广域网。由于CPRN与CERNET都以电信数据通信网为基础,所以,通过电信部门的网络平台完全可实现这两个全国性的广域网的对接,使整合后的书目信息能够真正在网络环境下快速传递,实现书目信息资源的网络化利用与共享。
3.4 编制书目格式转换软件,灵活应用整合后的书目信息
为了整合我国的书目信息,让我们先对三大书目的格式及内容作些分析。一般来说,书店的征订目录包括征订号、书名(丛书名)、版本、出版者、类别、责任者、开本、字数、页数、装订形式、估价、出版时间、ISBN号、内容简介、读者对象等;出版社的在版编目(详细级)包括书名(及有关信息)、责任者、版次、出版地、出版者、出版时间、丛书的详细信息、附注、ISBN号、排检项、其他注记等;图书馆的图书目录(详细级)包括的内容与CIP数据基本一致,不同之处是增添了索书号和定价项,去掉了其他注记项。可见,三者的信息很大部分相同。不过,由于书店是依据出版社的新书预告编制征订目录,当时该出版物的CIP数据尚未完成,二者的著录格式、著录项目及内容明显存在差别,且产生的时间不同步。一方面,由于双方的信息都来源于出版社,所以通过出版社能够做到著录信息内容的一致性。另一方面,整合书目信息后还能有效解决征订目录著录不够规范、缺乏统一著录标准的问题,并能解决《社科新书目》、《科技新书目》等书目报及出版社征订书目单中书目信息重复、彼此体例不一致等问题。至于出版社的在版编目数据和图书馆目录数据,由于双方内容比较一致,可根据规范化的要求统一书目的项目。
由于三种书目信息都源自出版物,所以可设想以在版编目(CIP)作为整合三种书目信息的纽带。虽然目前我国CIF数据还存在一些质量问题,但只要做好CIP数据的编制与核查工作,实现出版社、书店、图书馆(以及信息所)书目信息的共享是完全可行的。具体思路是:以现行在版编目的著录格式为基础,按CNMARC(国家文献信息机读目录通信格式标准)的要求设计规范化的书目信息格式。建议其主要著录项目包括:书名、著作者、出版项(出版地、出版者、出版日期(出版日期也可以待图书正式出版后通过网络即时传送))、估价(出版物正式出版后,通过网络迅速将定价传递给书店和图书馆,以便修改此项内容)、预计出版日期(此项目供书店征订目录使用,图书馆可作为订购时的参考因素)、装帧、开本(包括外形尺寸信息)、字数、页码(此项目待出版物正式出版后再传送)、类别、ISBN号、内容提要(此为新增项目,有利于信息检索及用户订购)、关键词(由出版物著作者在提交书稿时一并提供)、读者对象、附注等。
为了实现书目信息资源共享,节省三家单位书目编制的人、财、物力,实现一家编目、多家共享,需要对整合图书馆目录、出版社在版编目和新华书店征订目录的编制工作进行具体规划。如果从现在起就规定这三家单位要按照整合后统一的书目格式著录和传递信息,则首先必须对这三家单位的相关技术人员进行培训,使他们立即按照新的规范生产和传递书目信息,同时要逐步将过去已建成的庞大书目信息数据库加以改造,使数据库中的记录内容都符合规范化的要求。为了使这三家单位目前已经建立的书目信息数据库还能够继续使用,而且不至于因为对新书目规范的不熟悉而导致书目信息的编制与传递利用出现差错,笔者建议集中技术力量编制几套相应的书目格式转换软件,使整合后的书目信息能够得到灵活的应用。这一设想的操作思路是:集中我国三家书目信息服务部门及信息技术部门的技术力量,编制在版编目(CIP)数据和以CNMARC格式为基础的整合后书目信息数据的转换软件,编制图书馆(信息所等)目录和以CNMARC格式为基础的整合后书目信息数据的转换软件,编制征订目录和以CNMARC格式为基础的整合后书目信息数据的转换软件。目前这三个部门内部的书目信息的著录、编制以及书目数据库的建设等,仍然可以按照过去的方式运转,本单位过去已经建立的庞大的书目信息数据库的内容也继续保留使用。这样做既能够尊重过去业务人员书目信息工作的习惯,保证目前的书目信息服务工作效率与速度不受影响,也能够充分利用过去建立的庞大的书目信息数据库记录。这三家单位之间的书目信息的传递与资源共享。可以借助网络及转换软件实现。也就是说,在不同的书目信息服务部门之间需要传递与共享书目信息时,借助转换软件,先将本单位的书目信息转换成标准(规范)的CNMARC格式的书目信息(项目的选取可参照上面的分析确定),然后通过网络快速传递给对方;对方收到信息后,只要利用自己的转换软件将其转换成本单位自己的书目信息格式,就能够直接加以利用。这样的操作方法不仅大大降低了书目信息整合的难度,而且执行起来也比较容易。