关于“211工程”文献信息资源网建设的构想,本文主要内容关键词为:资源网论文,文献论文,工程论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
摘要 文章介绍了“211工程”文献信息资源网建设的方针、 目标和意义。提出了文献信息资源网的功能、模式、系统集成和数据库建设等方面的基本构想。应利用现代信息技术建设一批文献信息中心,为全国高等学校的教学和科研提供全面服务。资源网建设必须以资源共享为出发点,进行整体规划和调控。强化管理工作是资源网建设成败的关键。
关键词 文献资源 信息网络 高等学校 数据库 系统集成
Infrastructure of Construction of Document and Information Network of "211 Project"
Dong Chengtai
(Peking University Library)
Abstract
The paper introduces the guiding principles andgoal of the construction of Document and Information Networkof "211 Project" and the infrastructure about the functions,model of network, system integration and construction ofdatabase.It also describes the meanings of the informationresources network and presents the suggestion on building upa group of document centers with
advanced
informationtechnologies to supply services to teaching and scientificresearch for all universities in China.And,it mentions thatthe construction of the network needs to plan integrativelyand distribute rationally. The paper especially emphasizesthat the scientific management of the network is the key link.
1 概况
国家教委为使我国在21世纪初有若干所高等学校和重点学科达到或接近世界先进水平,提出“要较大幅度地改善仪器设备、图书情报和通信等办学物质条件”,并优先进行大学教育与科研计算机网络、文献信息资源共享服务系统等公共服务体系建设。
对公共服务体系建设从一开始就做了明确分工:大学教育与科研网建设由清华大学牵头,文献信息资源共享服务系统建设由北京大学牵头。从1994年初北京大学即着手制定规划。国家教委于1994年7 月在香山召开了公共服务体系专家论证会,主要讨论了“大学教育与科研计算机网络(Cernet )方案”和“‘211 工程’文献信息服务系统( ChinaAcademic Library and Information System简称CALIS)方案”。在香山会议后,根据专家意见对CALIS 方案进行了修改并上报国家教委“211工程”办,国家教委于同年9月将修改后的方案发送到全国若干重点大学征求意见。根据反馈回来的意见,方案又做了进一步修改,并于1995年4月24—26日在北京大学又召开了三天专家会议,进一步对修改后的方案进行论证。经过多次论证和征求意见,对CALIS方案均无原则分歧,方案已经基本成熟,并已于1995年5 月作为报批稿正式上报国家教委审批。
2 系统建设的方针
文献资源是我国国民经济建设、科学研究和培养专门人才的基础条件。我国目前不仅在文献信息服务手段和效率,而且在文献资源的收藏、积累和原文献提供方面均远远落后于西方发达国家。特别是近年来国外书刊价格连年上涨,外汇汇率并轨及其他一些因素的影响,使得我国各图书、科技信息等收藏及服务机构不得不大幅度地压缩外文书刊的引进,最近几年每年以30%以上的速度递减。据国家科委科技信息司统计,1994年全国外文书刊订购总量比1986年下降了80%左右。我国文献信息机构(特别高校图书馆)面临空前的困境。如此发展下去,我国的科研与教育将面临“断炊”、“断粮”的境地。
国家教委将大学文献信息服务系统(CALIS)列入“211工程”规划并作为公共服务体系建设的首要项目之一,为我国高等学校图书馆摆脱目前困境,摆脱传统观念束缚,走资源共建、共知、共享的信息社会化、整体化建设的发展道路,提供了一个绝好的机遇。
为了实现“211工程”的目标,必须抓住机遇,根据我国国情, 在有限资金条件下,依靠现代信息技术手段,利用“中国大学教育与科研网络(Cernet)”,采用“整体规划、合理布局、相对集中、联合保障”的建设方针,在高等学校范围内选择若干所有条件的大学图书馆,给予专项投资,配备现代信息技术装备,强化文献信息资源的投资力度,重点建设一批文献信息中心(以下简称“中心”),形成多层次、多类型、用现代通信网络连成一体的、面向全国高等学校的文献信息共享服务系统,成为为我国高等学校教学与科研服务的文献信息资源保障体系。
这些“中心”的文献信息资源建设和服务是全方位的。我国高等教育涉及文、理、工、农、医各个方方面面,要考虑各个学科发展的需要。这是因为学科的发展往往超出人们的预料,今天以为是可有可无的学科,或许明天可能会对科学技术和国民经济的发展起重要作用。
要实行全方位的文献信息资源建设和服务,任何一个学校仅凭自身的力量都无法承担和完成这样重大的任务。无论是文献信息资源建设或是资源网建设,都必须站在信息社会化和资源共享的角度,来考虑“中心”的设置。这些“中心”应在充分考虑现有资源、设备和技术条件的基础上,选择条件较好的大学图书馆作为“中心”进行建设,并由这些“中心”分工协作进行文献信息资源收藏、加工、存储和开发,为全国高等学校的教育与科研所利用。
“中心”选点应根据下面的条件确定:
(1)原有文献信息资源丰富、基础雄厚;
(2)国家教委批准建设的重点学科点在全国或本行业、 本地区内最多;
(3)图书馆原有业务工作基础较好, 有一支基本符合要求的图书资料专业人员队伍;
(4)具有现代信息加工和提供手段, 即已建立图书馆自动化集成系统和本校建成校园网,其现代信息加工和提供手段必须符合国内或国际标准;
(5)学校和图书馆在同行中有较好的协作基础, 有为全国兄弟院校服务的切实可行的措施;
(6)根据合理布局的需要。
3 系统的目标与功能
有关系统建设的规划,参见文献[1]。 系统建设的内容实际是两个方面:一是文献资源建设;二是资源网建设。本文将主要讨论资源网建设中的有关问题。
3.1 系统建设的目标与原则
系统的总体目标是:以中国教育与科研网为依托,以文献信息资源共享为出发点,到本世纪末建立起以全国性综合文献信息中心、学科文献信息中心和地区文献信息中心为基地,并与国内外主要文献信息系统广泛联网的,为全国高校服务的文献信息服务系统(即文献信息资源子网),形成中国高校教学与科研的文献信息保障体系。
建立文献信息资源共享服务系统,应遵循以下原则:
(1)整体规划,合理布局,重点投资,分步实施,从易到难, 讲求实效;
(2)采用先进技术手段,提供快、全、 准的信息检索和传递服务;
(3)全方位开放,不仅面向国内高校,而且面向社会乃至面向世界;
(4)在引进国外文献信息的同时, 大力开发本国与高校系统的文献信息资源;
(5)必须注重标准化,除符合TCP/IP协议和Internet标准外,为了资源共享还必须符合国家或国际标准化组织有关文献情报工作及信息技术等标准;
(6)发挥中央和地方、学校和社会等多方面的积极性, 多渠道筹集系统建设资金。
3.2 系统功能
(1)书刊的联机公共书目检索(OPAC-Online Public Catalog ) 建立中外文书刊联合目录数据库,建立联机公共书目检索系统。 在广域网环境下,读者可在本地、本单位或自己家中使用上网微机,通过多种检索途径在网上查找所需文献资料。
(2)书刊联机联合编目 建立联机联合编目系统, 实现广域网环境下的联机联合编目,包括联机查重、联机上载(Up Loading)、联机套录(Down Loading)和公共编辑界面等信息加工手段,动态建立联机联合目录数据库。
(3)文献信息检索
建立多种类型和多种形式的数据库及文献信息查询系统,并和国内文献信息系统实现广泛联网,读者可通过检索国内外各种类型的数据库,得到某一学科或专题的详尽的文献线索乃至全文。方便读者学习、研究和科研立项及成果鉴定查新。
(4)馆际互借与原文献提供 建立馆际互借系统, 配合文献信息检索和OPAC,读者可通过网络提出原文献需求,系统将以FAX、E- MAIL、FTP或邮寄复印件等方式为读者提供期刊、会议录、 科技报告等连续出版物中的论文或图书的部分章节,和通过文献传递机构(如邮递等)提供图书原件(借阅)。
(5)建立书刊协作和联合采购系统
建立书刊协作和采购协调机构,对书刊采购和文献资源布局进行宏观调控,以减少不必要的重复,达到文献信息资源的合理分布与采购经费的合理使用,并在广域网环境下建立书刊协作和联合采购系统。
4 系统模式
建立一个包括上述功能的文献信息系统,应采用何种模式为宜?是集中式(如OCLC或RLIN)还是分布式(如OhioLINK)?
(1)集中式的书目中心如RLIN功能较单一,即使是OCLC 在联机联合编目和馆际互借方面取得了史无前例的成就,现在又向信息检索方面拓展。正如李华伟先生在谈到为什么建设OhioLINK时讲到,OCLC“在致力于发展其他子系统时——大多是当地运行的操作,例如联机公共查目(OPAC)、流通、连续出版物管理和采访——比原计划逾期而且未取得成果”[2]。
(2)由于国家的经济实力决定,不可能有很大的资金投入。 我国不少重点大学图书馆已经装备有小型计算机和局域网并安装了自己的图书馆自动化管理系统,因此我们必须在充分利用现有设备条件的基础上构造我们的系统。
(3)现代信息技术的飞速发展,特别是Client/Server 技术的出现,为我们构造系统提供了有利条件。
因此,根据我国国情和现代信息技术的发展,不可能也无必要采用集中式模式,只能以现代通信技术为依托,在有条件的重点大学图书馆设立我国高等学校全国综合文献信息中心、学科文献信息中心和地区文献信息中心[1],通过Cernet采用系统集成方法和策略, 将各“中心”联成一个整体。这决定了我们所面临的是一个不同机种、不同操作系统、不同类型的数据库管理系统的异构型分布式处理环境。
5 系统的集成
“Client/server的巨大变化令人难以置信。这个变化不是一次改革,也不是一次进化,而是一次革命。在过去的30年里,计算机工业朝集中式的以主机为中心的方向发展,而在近5年中, 该工业实际上已经开始了分布式的以网络为中心的研究。”[3]
集中式Client/Server已有比较成熟的产品,而在WAN 环境下必然呼唤分布式Client/Server技术的出台。虽然“Client/Server本身就是一种分布式处理技术”[3],但在WAN的环境下,分布式系统的设计和实现还是一个新领域,有关产品还不够成熟。尽管如此,由于Client/Server体系结构提供了一个开放和可伸缩的环境,有较高的性能价格比,对于异构型分布式系统在技术上已经有了许多突破,有利于系统的集成与扩展。
由于整个系统的资金投入有限,因而一方面不得不利用原有设备,另一方面各图书馆现有设备满足本馆需求尚且勉强,无法承受“中心”的负载。因此在充分利用已有设备条件的前提下,要实现系统功能还需有足够的经费投入。在系统集成时我们面对两类情况,一类为新设备,另一类为老设备。
对新增设备,在系统集成策略上,应充分考虑OhioLINK的经验,即对于新增设备采用相同的开放的软硬件平台和统一的应用软件。这样系统易于实现,系统开销小,运行效率高。例如在客户机和服务器上运行同样的操作系统,可以很容易地在服务器和客户机之间移动程序和功能,管理也很容易。对于异构形分布式环境,处理起来则困难得多。
对原有设备,因其计算机机型各异,操作系统及数据库管理系统各不相同,图书馆自动化系统标准化程度亦有差异,应在系统功能“无缝集成”总前提下,根据不同情况区别对待。对于开放系统环境下开发的符合标准数据格式的系统、开放系统环境下实现的非标准数据格式的系统和非开放系统环境下实现的非标准数据格式的系统等,可分别采用与新系统集成、改造和废止等方法处理。
系统是在90年代中期开始建设,应采用90年代最新技术成果,坚持系统的开放、互连及标准化建设,尽可能采用最新技术手段与工具,并注意未来信息技术走向。面对众多的产品和技术,结合原有设备条件,对于系统的软件、硬件以及应用软件是购买还是自主开发,都将不得不做出艰难的选择。
6 数据库建设
在资源网建设中,数据库建设是核心内容。否则有了通信网络和各种应用软件(如OPAC及联机联合编目系统等),而无信息资源可以利用,就会出现国家教委不允许出现的“有‘路’无‘车’、有网无用”的情况。
信息资源开发和数据库建设的内容包括引进国内各种类型数据库和国外部分数据库,自建我们自己的书目、综合文献、数值等多种类型和全文、多媒体等多种形式数据库,并注重上述数据库的网上服务和光盘数据库的发行。
(1)在原有工作的基础上, 首先建立中西文书刊联合目录数据库,因为这是最基础的服务,在我国高等学校已有较好基础。同时引进国内外中西文期刊题录数据库,链接中西文书刊联合目录数据库,进行网上服务,使读者知道他们所需要的文献何处可以得到,达到“共知”。
(2)自建各种类型和各种形式的数据库。 重点开发我们自己的信息资源,特别是中文文献资源。
(3)根据高校自己的经验,继续采用“统一标准、集中培训、 分散加工、联合建库”办法,进行联合开发。
(4)组织专门质量控制机构, 负责各种类型和各种形式的数据库的质量控制。
(5)成立标准、规范研究机构,负责标准和规范的研究和制定。
(6)强化人员培训。
7 几点议论
(1)关于传统观念。国家教委关于“211工程”高等学校文献信息服务系统建设,就是要改变过去那种条块分割、“小而全”的模式。随着我国信息基础设施的改善和“211工程”的启动, 必须改变多年来习惯于“小而全”的思维方式,学会从信息社会化和资源共享的角度去思考问题。在过去的模式下,各学校都要保留经常使用的文献,因此出现了大量重复订购的现象。复旦大学图书馆编辑的1995年《全国高校图书馆进口报刊预订目录》中共收入71所高校订购的6000种进口报刊,其中有些报刊重复引进多达20几种。例如Philosophy of Science 共订购了21份,花费13000元人民币;National Geographic Magazine 共订购24份,花费人民币12000元。因此, 必须进行文献资源的合理布局和协调采购。从资源共享的观点,无论谁家收藏的文献资源都不应是独家私有,而是整个社会的文献资源的组成部分,都有义务为全社会提供服务。从一个学校来看文献的收藏可能是不全的,而从全国来看却是完整的。
(2)关于全局观念。“211工程”文献信息系统,应该是全国文献信息资源保障体系的组成部分,而且是一小部分。根据中国科学院文献情报中心编制的北京地区西文期刊联合目录统计,仅北京地区西文连续出版物即有27000余种(尚不包括北京图书馆和社会科学院的收藏), 预计全国收藏的西文连续出版物总数在4万种以上。 这是一个不小的数字。根据乌利希(Ulrich)《国际期刊指南》(CD版)统计,全世界西文期刊年出版量约17万种,其中学术性刊物近6万种。 如果全国实行联合保障,能够引进西文期刊5万种, 即等于一个英国大英图书馆的收藏水平, 大约可保证科研与教育需求的85 %。
其它文献需求可通过Internet以国际上文献信息资源作为补充。因此,必须和全国各大文献信息机构进行文献协调,实行资源网互连。
(3)关于信息自立。中国是有着几千年悠久历史的文明古国, 有光辉灿烂的文化。中文文献数据库建设是炎黄子孙责无旁贷的使命,是利在眼前功在千秋的事业。这是1995年2 月在广州召开的“中文文献数据库国际研讨会”上与会海内外代表的共识。在我们讨论我国文献信息数据库建设时,特别是在中文文献数据库建设问题上,不应该出现由外国机构建库,我们“引进”,或是与外国机构共享版权的现象。这是有关“信息自立”的问题[4]。信息是世界构成的三大要素之一, 是继物质和能源之后的又一重要的经济资源[1]。既然如此, 它自然也如政治、经济一样,有一个独立自主问题。固然,我国的信息事业非常落后,我们要认真学习和充分利用国外信息技术和资源。正因为如此,我们从一开始就必须有这种意识。正如发展我国的汽车工业要防止“殖民化”一样,在发展我国的信息产业时也需有所考虑。
(4)关于系统的成败。国家教委关于“211工程”建立公共服务体系的决策是英明之举,为我国高等学校图书馆摆脱目前困境、步入现代信息社会行列提供了机遇。然而如何把握机遇,使国家的投入真正取得应有的效果,使我国高等学校图书馆步上新的台阶,真正能够为全国提供有效服务,这是一个十分重要的问题。“钱不是万能的”,有了钱(当然根据我国国情,国家能投入的钱是很有限的)不等于系统就一定能够建成或者说达到预期的效果。影响系统成败的因素很多,有技术因素,也有非技术因素,而管理是决定因素。光有英明决策还不够,还得有科学的规划和英明的指挥,后者则最重要。