数字图书馆信息资源宏观管理问题,本文主要内容关键词为:宏观管理论文,信息资源论文,数字图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着社会经济和技术的发展,人们对于信息的关注点不断发生变化。早期,人们侧重于信息源的收集与管理;后来,随着计算机的应用,人们希望提高信息处理和传递效率,更多地注意信息流的控制;当代,人们为了追求信息效益最大化,越来越注意信息资源的优化配置和信息过程的综合性、全方位宏观管理和协调。数字图书馆作为知识经济时代的新事物,其信息资源宏观管理问题具有明显的时代感。
许多学者倾向于从狭义和广义两个层次理解信息资源。狭义的信息资源仅指信息内容,广义的信息资源是指与信息活动紧密关联的各要素(信息内容、技术、设备和人员等)的集合。[1]本文讨论狭义的数字图书馆信息资源宏观管理问题。
1 调查和规划数字信息资源建设内容
作为数字图书馆宏观管理机构,应该承担的一项基础性工作,就是对现有而且不断增加的数字信息资源进行全面调查摸底。这项工作可以和数字信息资源申报登记制度结合起来。某一件数字信息资源产品一旦申报成功,申报单位就拥有了该产品的版权。为了避免重复浪费,其他单位不宜再制作同样的数字信息资源产品,更不可能再通过申报。并非每一件数字信息资源产品都可以成功通过申报。数字信息资源产品的申报登记过程同时又是严格的鉴定、审批过程,其间应该有规范化的鉴定、审批程序和标准,包括是否符合技术质量要求,是否妥善解决了版权问题,是否遵守统一的标准规范,等等。
数字图书馆的信息资源包括各种不同类型。按照原文献的版权拥有情况,可以分为公有领域和超过著作权法保护年限的作品的信息资源和仍然享有著作权的作品的信息资源;按照数字化文献的篇幅,可以分为指南型数据库(包括题录型数据库,如书目数据库,文摘型数据库)和全文数据库;按照数据库的表现形式,可以分为纯文本数据库和图像、音频、视频、多媒体等内容的数据库;按照数字化对象的原载体,可以分为图书数据库、报刊数据库和其它文献数据库;按照数字化文献的来源,可分为图书馆、博物馆、档案馆、政府部门、出版新闻机构和其它企事业单位等不同文献收藏和拥有单位的数字信息资源;按照数字信息资源是否可在网上查阅,可分为网络数字信息资源和非网络数字信息资源;按照级别,可分为永久保存级、服务级、镜像级和链接级数字信息资源;按照学科领域,可分为自然科学和社会科学及其下属各个学科的专题数字信息资源;按照应用目的,可分为农业、工业、国防、教育、科研、新闻、医疗等方面应用的数字信息资源。当然,许多数字信息资源库往往是交叉的、综合的。如此门类繁杂的数字图书馆信息资源建设,应该有专门机构进行统一规划和协调。这项工作可以由国家图书馆及其中国数字图书馆工程联席会议办公室与国务院信息化工作办公室配合组织。
从长远看,一切有利用价值的文献,一切人类知识和文明成果,都应该分期分批数字化,变成让人们能够通过网络访问的数字信息资源。这是一项庞大浩繁的巨大工程,不可能一蹴而就,必须区分轻重缓急,分阶段、分步骤、有计划地进行,必须由各有关系统、部门和单位分工协作、携手共建。
在数字图书馆建设的起步阶段,有几项基本的数字信息资源建设工程项目需要举全国各有关单位之力完成。
第一是尽快建立健全全国文献和数字信息资源联合目录。这同时也是对全国可以进行数字化的潜在文献资源和已经数字化的信息资源的一次全面调查摸底。这个联合目录应尽可能完备。首先,它是国内出版和收藏的所有图书报刊的目录。即包括近现代印制的普通图书报刊目录,又包括列朝古籍目录;既包括中文图书报刊目录,又包括少数民族文字和外文图书报刊目录;既包括大陆地区的图书报刊目录,又包括台港澳和海外华文图书报刊目录;既包括图书馆馆藏图书报刊目录,又包括散落在非图书馆机构和民间的图书报刊目录。在这个联合目录不断完善的过程中,每种报刊都应该建立详细的篇目索引。其次,它是图书馆、博物馆、广播电台、电视台等机构收藏的非书资料目录。再者,它也是档案馆等机构已经公开的档案文件目录。同时,它也是所有网络数字信息资源的目录。
第二,尽快实现全国所有新出版物的数字化。近些年新出版的图书报刊都有现成的电子印刷排版文件,实现数字化,不需要重新录入或扫描,是文献数字化的一条捷径。这些电子印刷排版文件散落在各新闻出版单位,这些单位并不法定承担长期保存这些文献资料的任务,容易造成流失。因此,应该尽快制定法规,严格实行和完善与图书呈缴制度相配套的电子印刷排版文件呈缴制度,及时将当年和近些年新出版物的电子印刷排版文件集中起来,建成数据库,纳入数字图书馆信息资源的收藏体系。这项工作可以由国家图书馆及其中国数字图书馆工程联席会议办公室与新闻出版署及其国家版本图书馆配合组织实施。数据库的内容可以按照现行知识产权法规,在尊重著作权、出版权和读者使用权的前提下,陆续在局域网或者因特网分层次提供阅览。
第三,根据轻重缓急,分期分批开展各类文献的数字化。统筹规划,先选择一批重点文献数字化,然后逐步实现某一文献信息单位、某一城市、某一地区、某一系统乃至全国所有重要文献的数字化。现成重要文献的数字化是数字图书馆建设的一项基础性工作。国际通行的做法是首先选择公有领域和超过著作权法保护年限的作品的数字化,这一点,我们可以借鉴。建设数字图书馆的目的在于应用,是否具有较大参考和应用价值,是否符合国家和各个地区经济、政治、文化和社会发展需要,是否具有特色,是选择实施数字化的文献资源的重要标准。可以组织专家对本学科和领域的文献资源加以分门别类,确定哪些应该首先数字化,哪些应该第二批数字化,哪些可以留待以后有条件时再数字化,哪些不需要数字化。
第四,对互联网各种信息资源进行系统收集整理保存提供,去伪存真,去粗取精,同时建立网络数字信息资源指引库。互联网的信息资源瞬息万变。其中,有许多内容具有长期保存和参考价值,一旦消失,将造成永久遗憾。可以明确国家图书馆,也可以由中国数字图书馆工程联席会议办公室协调,明确几家或者若干家图书馆分工负责,承担起网上数字信息资源的系统收集、整理、保存、提供的职责,建成互联网数字信息资源长期保存数据库,将内容科学分类,提供读者长期查阅。有些因特网信息资源,特别是外文信息资源,涉及知识产权和技术等因素,一下子无法建成现实数据库,可以先建成虚拟数据库。虚拟数据库又称指引库,相当于传统的“二次文献”,是通过建立网络链接,指引用户获取特定网址的信息资源。这项工作可以和上述建立健全全国文献和数字信息资源联合目录的工作结合起来。
2 设计数字信息资源体系结构
数字图书馆如此庞大繁杂的信息资源应该有序化。换句话说,应该按照严谨、科学、方便、适用的体系结构组织信息资源。这里面临的一个问题是:数字图书馆的信息资源是集中还是分散?目前,国内外网络信息资源形成了两种基本体系结构:集中式结构和分布式结构。
像美国国会图书馆的“美国记忆”和我国同方集团的中国知网的网络信息资源都可以看作是集中式结构。用户查询“美国记忆”和中国知网分别直接检索存放在美国国会图书馆和同方服务器上的数据库。这种集中式数字信息资源的检索采用单一客户机——服务器结构,用户通过互联网查询特定数字信息资源检索系统,这个系统有自己的索引、标引和检索机制。
分布式结构是指数字信息资源分散存储在不同的空间,而且由于建立目的和存储对象的差异,各部分数字信息资源可能由不同的机构和组织建立和管理,其存储结构也不尽相同。但是,可以通过互联网络将这些分散在不同地理位置、结构相异的数字信息资源连接起来,形成有机整体,实现整合检索。对于用户来说,检索分布式与集中式数字信息资源没有什么特别差异。
分布式结构又可以分成两种基本类型,一种是闭合型,一种是开放型。
美国加利福尼亚大学的数字图书馆就属于闭合型,它整合了该校分布在不同城市各分校图书馆的数字信息资源,形成一个界面统一的数字信息资源检索系统。闭合型分布式系统的各相对独立的组成部分是有限的、固定的。其检索系统的核心任务是解决分布在不同地理位置的各分系统之间的相互沟通和相互操作;其典型形态也可以称作“联盟型数字图书馆”,即由一系列正式或非正式合作的机构组成的数字图书馆。这些分支机构支持共同的服务和标准。
联机计算机图书馆中心(Online Computer Library Center)的NET First属于开放型。它类似于网络搜索引擎,但检索效率远远大于普通搜索引擎,是经过规范的网络数字信息资源检索器,能够提供多种信息查询功能。美国康奈尔大学的数字图书馆也属于开放型。它坚持开放结构、整合和分布式原则。在此基础上,建立了“网络计算机科学技术报告图书馆(NCSTRL)”,这是一个全球开放型分布式的数字图书馆。其信息资源具有三个特征:位置和管理的独立性、组成部分的动态性和可扩展性。凡是互联网上的信息资源,只要符合一定标准或处理过程,就可以成为某个开放型分布式数字图书馆的馆藏。
我国数字图书馆的信息资源可以采取集中式和分布式结构相结合的办法。可以考虑集中建立若干个类似“美国记忆”的大型数据库,这样的数据库可以集中存放在某一地点的服务器上,读者统一访问该服务器。但是,从长远来看,我们不可能将所有数字信息资源都集中在某一点,因此,还是要采用分布式的结构体系。分布式结构体系充分利用了互联网的特点,体现了数字图书馆不同于传统图书馆的基本特征,实现了数字信息资源跨越空间分布的整合,是数字图书馆的典型结构。我们的目标就是利用分布式技术将分散在不同空间位置的数字信息资源整合成一个完整的检索系统。
3 促进数字信息资源整合
数字图书馆用户很可能需要从整个数据库或者几个数据库,从整个信息资源站点或者多个站点,甚至从全国数字图书馆网站或者更大范围一次性查询有关数字资源信息。这就需要对一定范围的数字信息资源进行合理而科学的整合,使读者达到一次性跨库、跨网站检索的目的。
数字信息资源的整合是连接各部分数字信息资源使之成为一个整体,把各部分的功能和效应组合成一种新的功能和效应。
首先,数字信息资源与传统文献资源需要整合。现在存在两种倾向:一种是把数字信息资源和传统文献资源完全割裂开来。有的认为数字信息资源可以取代传统文献资源,数字图书馆可以取代传统图书馆,因此有忽视传统图书馆业务和读者服务的倾向;有的认为数字信息资源和传统文献资源是毫不搭界的两码事,因此形成数字图书馆与传统图书馆两张皮。另一种是把数字图书馆神秘化、超技术化,炒作数字图书馆概念,无限扩大数字图书馆的内涵和外延,把数字图书馆弄得玄而又玄,远离现实。我们说,数字信息资源是传统文献资源的延伸和发展,二者互相补充,密不可分。数字图书馆也是图书馆,只不过是传统图书馆在知识经济时代的延伸和发展。我们主张数字信息资源和传统文献资源建设并举,二者相得益彰。数字图书馆的信息资源建设首先应该将传统特色资源数字化,以至逐步实现所有主要馆藏的数字化。当然,这样的信息资源已经不仅仅是传统馆藏文献资源的简单数字化,它是经过严密组织的、融合了国内外图书馆和其它机构有关信息资源的、可以通过互联网远程有效检索阅览共享的信息资源。这样,读者可以同时一次性检索利用数字图书馆的信息资源和图书馆的传统文献资源。
数字图书馆实质上是一种面向用户的网络信息资源体系,这是数字图书馆对传统图书馆的超越,其特点在于其已经具备了资源整合功能。相对于传统图书馆,数字图书馆更具重于向用户提供集成的、相互关联的、系统有序的信息和知识,包括网络信息参考咨询和个性化定制服务等。
其次,数字图书馆的数字信息资源与其它数字信:息资源需要整合。如果不加“数字图书馆”的定语,数字信息资源是一个更加宽泛的概念,是指对于国民经济和社会发展有利用价值的数字化和网络化信息内容,包括政府数字信息资源和企业数字信息资源、公益性数字信息资源和盈利性数字信息资源以及公共数字信息资源、单位私有数字信息资源和个人数字信:息资源等。
1993年底以来,国家有关部门陆续启动了支撑整个国民经济信息化的一系列工程项目。这么多数字信息工程建设项目,应该加强统筹协调,避免各自成为“信息孤岛”,造成重复浪费。因此,数字图书馆宏观管理部门应该注意与这些信息工程项目的资源整合。
无论是数字图书馆工程之间,数字图书馆与传统图书馆之间,还是数字图书馆与其它数字信息工程之间的信息资源整合,都牵涉标准规范问题。从整体来看,数字图书馆用户面临的是一个分布、异构、变化和开放的数字信息资源服务环境。为了有效、广泛和长期利用数字信息资源,数字图书馆宏观管理部门应该组织建立数字图书馆建设者共同遵循的各个层次的数字信息资源标准规范,其中主要包括数字信息资源采集和加工、组织和存储、检索和服务的标准规范。也有学者将数字信息资源标准规范分为内容创建、描述、组织、管理、服务、长期保存等方面。[2]
各国较大规模的数字图书馆合作项目在启动之初都致力于建立数字信息资源建设的标准规范描述体系,以指导、协调和约束项目参与者。近些年,科技部也启动了“我国数字图书馆标准与规范建设”项目。[3]我们应参照各国的经验,参照国际通行的标准规范,分析我国有关标准规范应用环境和制定程序,建立和推广适应我国数字图书馆资源建设的标准规范描述体系,并纳入国家标准系列。
整合信息资源还要从体制入手,明确有关机构来履行统筹协调职能,从国家层面对信息资源的开发利用进行规划、组织、协调和合理配置。理想的境界是通过整合,使所有有价值的数字信息资源都有部门和单位负责开发,同时避免重复开发;使跨时空分布的数字信息资源成为一个用户可以无障碍利用的统一的数字信息资源整体。可以参考美国联机计算机图书馆中心(OCLC)的模式,赋予国家图书馆以国家级的数字信息资源整合中心职能,整合数字图书馆、传统图书馆和其它数字信息资源,面向全社会提供信息服务。该中心重点对目录数据进行管理,逐步建立全国文献和数字信息资源网上联合目录,实现分布式的信息资源统一导航、检索、定位与服务。
4 推进数字信息资源共建共享
数字图书馆的数字信息资源共建,可以采取项目负责制。由中国数字图书馆工程联席会议办公室及其资源建设咨询委员会提出指导性项目指南,各有关单位根据自身情况提出项目申请,由专家鉴定,投资部门审批立项。每个数字信息资源建设项目,可以由一家承担,也可以多家联合承担,还可以由一家牵头和协调,联合全国或者某一地区、某一系统有关单位共同承担。有的大型数据库需要共同参与才能完成;有的专题数据库需要有一定基础和实力的单位分担,由其他单位协助。各文献资源拥有单位都可以从自己的实际情况出发,为数字信息资源建设做出力所能及的贡献。
数字图书馆信息资源建设是一个长期的不断积累过程,应该从实际出发,量力而行,不应该一开始就贪大求全,要求每一个图书馆或者其他单位都一律大张旗鼓地进行数字信息资源建设。即使有条件自主制作数字信息资源的单位,也可以先对一些有较大参考价值的文献资源进行数字化,从零开始,从一做起,然后不断补充完善。人家已经数字化的资源,应该尽量避免重复数字化。
数字信息资源建设,可以自建数据库,也可以从社会上购买、引进。对于大多数数字图书馆的用户单位来说,应该提倡“拿来主义”,应该充分利用社会上已有成果,购买和引进数字信息资源。
购买和引进数据库,特别是国外较大型数据库,应该建立合作采购机制。中国数字图书馆联席会议办公室可以定期通报国内外可供数据库信息,收集各单位购买、引进意向,组织专家对数据库进行调研、评估,实行合作采购、集体谈判、费用分担和资源共享策略。
小布什总统新上任时,美国总统信息技术咨询委员会(PITAC)向他提交了三份报告,其中之一是《数字图书馆:对人类知识的普遍访问》。该报告开篇第一句话对数字图书馆的目标进行了比较精练的概括:“任何人在任何时间任何地点都可以用任何连接互联网的数字设备来访问任何人类知识。(All citizens anywhere anytime can use any Internet-connected digital device to search all of human knowledge.)”[4]这里强调的是数字信息资源共享。
无论是数字图书馆工程,还是其它信息工程,特别是政府投资项目的信息工程的数字信息资源,其主体部分,都应该向社会大众提供公益性服务,实行资源共享,切忌自我封闭,造成资源浪费。数字信息资源共享,千万别忽略了数字信息资源利用的弱势地区和弱势群体。我们提倡社会和谐公正,同样包括建立数字信息资源利用的和谐公正环境。
我国城乡之间,东西部之间,目前存在较大的“数字信息鸿沟”。互联网上面向农村、农业和农民的数字信息资源严重匮乏。广大农村地区,特别是中西部农村地区,网络信息基础设施严重不足,利用计算机和网络信息的水平十分有限。农村、农业和农民已经成为当前我国网络信息利用的边缘区域、边缘行业和边缘人群。几乎所有农村物质贫困背后都存在着不同程度的信息贫困。信息贫困严重地影响我国农村社会的健康发展。数字信息资源共享,如果缺失了农村地区,排除了农民的参与,就不算圆满。数字图书馆建设是逐步缩小城乡信息环境差异的一个契机。国家有关宏观管理机构应该把数字图书馆与农村地区的信息化建设作为一个有机整体,通盘考虑,加强农村网络基础设施建设,尽快实现网络“进村入户”,给农民创造上网条件,加强涉农网络信息资源开发、整合和提供,吸引农民上网,加强农村信息技术人才的培训,提高农民上网能力。经过“跨越式”发展,让农村人和城里人一样能够分享数字图书馆的信息资源大餐。要做到这一点,就应该给农村地区更多的政策倾斜,包括加大资金投入。建议在数字图书馆启动阶段,政府加大专项资金投入,为农村地区开通网络、配备计算机、培训人员,同时减免农民的上网资费。
总之,我们的目标是,通过一段时间的共同努力,消除不同地区、不同层次、不同类型读者的信息资源服务环境差异。这样,即使一个西部地区的农村读者也可以和北京的读者一样,在当地随时查阅和获取国家图书馆,甚至美国国会图书馆的数字信息资源。
收稿日期:2006-08-10