文献分析研究——90年代以来我国书目数据库研究综述,本文主要内容关键词为:分析研究论文,书目论文,文献论文,年代论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1我国书目数据库研究与建设的历史回顾
在我国,最早着手于书目数据库研究的机构,当然是北京图书馆(现在的中国国家图书馆)。几十年来,它一直承担着“编印国家书目、编制回溯性书目和联合目录,成为国家书目中心”的任务。自1988年起,北京图书馆开始进行中国国家书目数据库的建库工作;1990年,它正式向国内外发行“1988年以来出版的中国国家书目数据库”;1995年,它又着手于国家重点科技项目“中国国家书目回溯数据库”,该库建成之后,将与1990年发行的书目数据库共同组成建国以来我国完整的国家书目机读数据库。这一书目数据库的建立,为所有打算建立本馆书目数据库的图书馆提供了完整的机读书目数据,为国际间的文化交流提供了有利条件,不仅可以节约大量人力和时间,而且,统一编目的数据适应网络化发展的总趋势,便于联机检索和资源共享。
继国家图书馆之后,90年代,特别是90年代后半期,各地区、各系统的图书情报部门纷纷开始了对书目数据库的研究,其研究覆盖面相当广泛。从研究层次上讲,包括宏观层次的整体书目数据库构建研究和微观层次的具体书目数据库的建设研究;从文种上讲,包括中文书目数据库(其中又有古籍书目数据库和近、现代文献书目数据库)和西文书目数据库;从时间跨度上讲,包括新书书目数据库和回溯书目数据库。
随着市场经济的深入发展,要求书目数据库进行市场化运作。到目前为止,我国的书目数据库市场已基本形成,其中活跃着四家大型书目数据库生产商,分别是:北京图书馆建立的《中国国家书目》(光盘),覆盖1988年以来的中国国家书目,拥有23.5万条记录;中国科技信息研究所重庆分所开发的《中文科技期刊数据库》,库容量为170万条记录,年报道量为26万条记录;中国科技信息所等单位开发的《中国科技文献数据库》,其库容量为120万条记录,年报道量为27万条记录;上海图书馆承建的《中文社科报刊数据库》,数据累积达40多万条,月报道量为15000条记录。书目数据库进入市场,促成了我国书目数据库行业的形成,而且也提高了书目信息服务的效率和效益。
290年代以来我国书目数据库研究的现状
2.190年代以来我国书目数据库研究的时间分布
根据对《全国报刊索引(1990~1999)》的统计,以及在大量阅读原文的基础上,可以得出:我国从90年代初期开始在国家正式出版物上交流和探讨书目数据库的有关问题。最早见于刊物的研究论文发表于1992年北京图书馆馆刊的第2期,自此之后,公开发表的论文一共有78篇,其年代分布如表1:
表1我国书目数据库研究论文数量统计
数量/年份1992 1993 1994 1995 1996 1997 1998 1999
2211
13
28
29
11
表1表明:第一,自1992年,我国的图书情报部门开始利用正式的信息交流渠道来研究书目数据库的有关问题。就阅读原文的情况而言,当时的论文都源自作者的直接经验,文章后没有列出公开发表的文献为参考文献。这在某种程度上是因为:走在我国书目数据库研究前列的北京图书馆,直到1991年底才开始由机读目录数据的脱机小生产向联机过渡。第二,从1992年到1995年,有关机读书目数据库的文章寥寥无几。原因在于:首先,国家在宏观上没有对信息资源的开发和利用给予足够的重视,图书情报部门的信息管理自动化系统建设力量薄弱;其次,书目数据库研究尚处在实践探索时期,可借鉴的先例很少,因而形成文字的研究成果也就更少。第三,以1996年为界,此后有关这一专题的文章纷纷涌现。这是国家信息政策转变的结果:1995年,文化部在《文化科技“九五”计划及2010年长远规划》中规定了图书馆方面的奋斗目标;1996年,国家科委信息司在《“九五”国家科技服务业发展计划》中明确提出要在“九五”期间重点开发各类数据库(包括书目数据库),计划到1999年将实现联机编目、采购协调、馆际互借、查询与检索、出版检索刊物等电子出版物。同时,这也是整个社会发展的结果:人类“资源观”的改变,将信息列为推动生产力发展的重要因素。Internet的普遍应用和推广,改变了人们开发和利用信息资源的活动,形成了更为科学的信息资源共享理论。第四,表中1999年研究论文呈下降的趋势,是因《全国报刊索引》的发文时滞所致,而并非研究过程中的低谷期。
上述可见,我们可依1996年为界,将我国书目数据库的研究过程分为两个阶段:其一,初期阶段,这一时期对书目数据库的研究仅仅停留在浅层次的探讨上,如,参考文献[3]主要是对北京图书馆在书目数据库建设方面的工作介绍和经验总结,而对于其发展,只是大概地提了建立各类书目数据库和制作光盘的想法;当然也有对外的经验介绍,如参考文献[5]中就系统地介绍了书目数据库在台湾的建立和发展;另外,当时的研究论文表明:有关的许多基本概念还没有明确下来,最有代表性的是书目数据库本身的提法就不统一,有“机读目录中心”、“书目资料库”、“书目数据库”等。其二,繁盛阶段,在这一阶段对书目数据库的研究全面开展起来,从理论到实践、从建库方式到数据标准化等等。有关各个主题的研究状况将在本文第三部分中作详细论述。
2.290年代以来我国书目数据库研究的主题分布
根据对90年代以来有关文献的阅读和分析,笔者将我国书目数据库研究的主题细分为四个方面:(1)建设书目数据库的理论,包括建设书目数据库的地位、原则、政策、制度等;(2)建设书目数据库的方式,它是与具体的图书情报部门建设书目数据库相联系的具体方法,如建设书目数据库的程序、步骤等;(3)建设书目数据库的模式,它是介绍对各个图书情报部门都有指导意义的宏观建库方案;(4)书目数据库的质量控制,包括书目数据的质量控制和整个建库过程的质量控制。其主题分布状况如表2:
表2我国书目数据库研究论文主题分布
专题名称 建库理论 建库方法 建库模式 建库质量
篇数 19 52
10 17
注:主题分布中的论文总数98篇大于年代分布图中的论文总数78篇,是因为有些论文是两个或多个主题并重
由表2可以看出:在书目数据库研究中,大多数论文都是产生于本馆的建库实践或作者自身的建库经验,因而,有关书目数据库建设方法的文章有52篇,约占论文总数的53%;对于书目数据库的质量管理问题,有17篇,占论文总量的17%,大多文章都根据自身的实践,提出了操作性很强的建议;关于书目数据库建设的理论以及基于书目数据库建设方法而产生的建设模式研究的文章共29篇,占论文总量的30%。从总体上说,在书目数据库的研究方面,应用研究略大于理论研究。书目数据库本身就是一个操作性和应用性很强的研究课题,所以,我国对于书目数据库的研究,是符合书目数据库自身的特性的。
390年代以来我国书目数据库研究现状
3.1书目数据库建设理论研究
现代信息环境下,书目数据库不仅是图书情报自动化管理的基础,更重要的是它是网络环境下实现信息资源共享的基础,是进入信息高速公路的快速通道,这就是当今书目数据库在整个信息化社会中的地位所在。90年代以来,党和国家非常重视图书情报事业的发展,颁布了许多有关发展我国图书情报事业的指导文件和各种业务工作的规范文件,如:1991年出台的《国家科学技术情报发展政策》、1995年中共中央、国务院作出的《关于加速科学技术进步的决定》、1995年文化部推出的《文化科技“九五”计划及2010年长远规划》、1996年国家科委信息司拟订的《“九五”国家科技服务业发展计划》,其中对书目工作和书目数据库的建设问题都有明确规定。书目数据库理论是书目情报理论与现代数据库技术相结合的产物,因而,其理论研究也是从这两方面着手展开的,内容包括:书目情报理论、数据库理论和信息资源共享理论。又由于书目数据库以服务为宗旨的特性,其理论具有较大的实践指导性和可操作性。
3.2书目数据库建设方法研究
90年代以来,我国的图书情报部门在书目数据库的建设方法上经历了三个阶段:一是完全自行建库阶段,指各馆根据本馆馆藏,按照自动化系统的要求,编制MARC输入工作单,并校对输入工作单数据,加上必要的标识,再按工作单将编目数据人工输入到计算机中去。它在中文书目数据库建设的初期,特别是较早建立图书馆自动化系统的单位中经常应用。这种方法比较直接,不存在格式、数据转换等技术问题,但建库速度较慢,耗时耗力。二是采用现成标准化的机读目录产品集中建库阶段,也就是通过一定方式将得到的标准化机读数据转入本馆的计算机中,建库人员再按到馆新书进行查重、检索到的记录在其后加上本馆的业务注记,存盘后建库完成,如遇到未在库中检索到,则对此书重新编目。这一方式的建库速度和自动化程度都较高,但因现有的标准化书目数据库产品不齐全,在实际运作中命中率不高,因而这种方式的应用面不广。三是合作建库阶段,它实现了前两种建库方式的有机结合,既利用外来数据进行部分查重,又集中部分建库人员自行建库,它是当前最有效的建库方法,尤其适用于大型书目数据库的建设。
3.3书目数据库建设模式研究
目前,大多数图书情报部门在建设书目数据库的时候,其建设过程大都是“三段式”的:第一步是建库前的整顿,它包括馆藏文献分析、建库条件分析以及建库工作流程分析,它是建库工作高效、有序地进行的保证。第二步是书目数据的采集和输入,书目数据采集的内容包括对文献形式和内容特征进行描述的数据、对文献进行标引的数据以及非文献数据(也就是各馆的馆藏信息)。书目数据的输入,目前有两种主要方式,联机菜单式数据输入方式和格式转换数据输入方式。这一步骤是保证数据质量的关键,因而,无论是在数据采集阶段还是在数据输入阶段,都要确保数据的准确和全面,当前最为有效的措施是及时作好数据的校对工作。第三步是书目数据库的试运行和后期维护发展,数据库的建设并不是一劳永逸的事情,在其运行中不但会有很多例行的日常维护,也会暴露出前期工作的不周全之处,并且书目数据库的新功能开发也是后期发展所必须的。
3.4书目数据库建设质量研究
书目数据库的质量是整个书目数据库生命力的体现,同时,书目数据库的建设又是一项牵涉多方的长期工程,为了防止“豆腐渣”工程的出现,从建库的各个环节入手来保证书目数据库的质量,成为图书情报部门的一致看法。书目数据库的质量包括两个方面:一方面是书目数据的质量,它主要取决于数据著录、标引和录入的质量。数据在著录阶段的质量控制涉及各种标准规范的统一、齐备,著录人员的素质,以及工作流程的科学性、合理性等方面的因素;在标引阶段的质量控制主要依靠标引人员有丰富的知识和标引人员对分类主题有透彻的理解;在数据录入阶段的质量控制主要依靠录入人员的水平和素质,计算机系统的排错能力等。另一方面是书目数据库本身的质量问题,它主要取决于书目数据库的及时性、准确性和覆盖率。其及时性表现在,对书目数据从加工到提供服务的周期长短;其准确性表现在,加工和提供的书目数据是对原文献的准确揭示和真实反映;其覆盖率表现在,书目数据库对各学科或本专题信息资源的网罗和反映程度。
421世纪我国书目数据库业的发展趋势
近十年来,我国在书目数据库的研究和实际建设中都取得了重大发展,就未来书目数据库的发展势头来看,呈现出以下趋势:第一,走统一管理之路,建立起全国统一的管理部门,制定长远的、整体的发展规划,成为书目部门的共同呼声。当前,我国急需有一个全国性的图书馆自动化领导机构,制定出全国或地区网络的长期、中期和近期发展规划,这个机构在图书馆自动化系统的设计、硬件配置、软件开发上起到宏观调控的作用。同时,它也负责书目数据的标准化问题,统一书目数据的格式和著录标准,拥有对各项标准的解释权和监督执行权;第二,走联合建库、资源共享之路,目前我国图书馆界资源共享程度还不高,全国性的图书馆网尚未建成,重复劳动的情况比较严重,书目质量控制得不到保证。据1996年测算,各图书馆每年重复编制的机读书目数据约为150万种,以人年平均编目1000种计算,每年全国约有1500名图书馆工作人员的编目工作属于浪费。因此,我国图书情报界要真正实现书目数据共享,只能靠联合建库的方式,建立起中国的OCLC。第三,走市场化道路,实现公平竞争,书目数据库市场是我国信息服务市场的重要组成部分。目前我国已建成和使用的书目数据库中,能“以库养库”的不多,市场化的发展,有利于各图书情报部门在建设数据库时充分论证其投资回报率、市场可行性,真正做到将用户的需求放在首位。
标签:文献回顾论文;