《杜威十进分类法》的电子化及未来研究重点,本文主要内容关键词为:分类法论文,电子化论文,重点论文,未来论文,杜威论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[摘要] 本文论述了DDC电子化的背景,电子版DDC的结构和性能,电子时代DDC的研究重点。
[关键词] 杜威十进分类法 电子化研究
随着电子信息时代的到来,分类法的电子化(机读化)和分类法在电子(计算机)环境中的设计和应用已经成为国际上分类法研究的一大热点。其中,美国对《杜威十进分类法》(DDC)的电子化及其在电子环境中的使用研究最为突出。1993年,电子版DDC的问世,标志着分类法电子时代的真正开始。然而,我国的分类法电子化研究几乎还没有起步。因此,笔者希望本文所述能对我们进行自己的分类法电子化研究有所启发和促进。
1 DDC电子化的背景
由杜威于1873年首次提出,1976年首次出版的DDC,至今已被译成30多种文字,在世界上至少135个国家的20余万个图书馆广泛使用。一百多年来,DDC一直以印刷形式出版。直到1989年,DDC详本第20版(简称DDC20)和简本第12版仍然是以印刷形式出现。不过,这一次的出版过程不同以往。因为,这一次的出版;不仅采用了计算机而且首次采用了自动化的编辑支持系统(ESS),为DDC的电子化拉开了序幕。
ESS是为了实现DDC20的联机编辑支持,由自1911年以来一直负责出版DDC的森林出版社提出并支持lnforonics公司于1984年至1986年建立的联机编辑系统。[1]在ESS生产印刷版DDC20的同时,相应建立了ESS格式的DDC机读数据库,亦即形成了ESS格式的电子式DDC。这种电子式DDC既不同于印刷版DDC,也不同于生产第十九版DDC的印刷磁带。在ESS的DDC数据库中,与每个主表或附表类号相对应的每个记录均集中了有关这一类号的所有信息,包括类号、类名、各种注释、索引标目、DDC手册中有关该类的说明、参见指引等字段。
早在60年代,美国的Robert R.Freeman和Pauline Atherton就开始研究分类法(UDC)在计算机系统中的应用。此后,特别是当联机目录在图书馆广泛应用之后,如何使用分类法来改善联机目录主题检索的效果在美国成为一个研究重点。[2]另一方面,对如何设计适合于联机系统使用的分类法也进行了研究。[3]在这些研究中,对DDC电子化影响最大的应是1984年初,在美国图书馆资源委员会和森林出版社的支持下,由OCLC研究办公室主持,利用出版第十九版DDC所用的印刷磁带转换出DDC机读数据进行研究和实验,并于1986年初完成的“DDC联机研究项目”。该项研究的结果表明:DDC可以作为联机目录检索时进行主题查找、浏览和显示的工具,从而提供字顺主题方法所不能提供的新式检索策略,最终改善联机目录检索效果;同时,为了适应联机系统的特点,有必要改进机读型分类法(联机分类法)的设计和应用。[4]
为实现计算机系统之间分类法数据的交流,更好地发挥机读型分类法在联机或机助分类标引、联机检索、分类法数据的规范控制、分类表管理和出版、书目记录中分类号的变动等方面的作用,必须规范分类法机读数据的格式。为此,由美国国会图书馆的网络发展与MARC标准办公室牵头,于1987年开始了美国分类法数据机读目录格式(USMARC Format of Classification Data,下称分类法机读格式)的研制工作。以美国几部常用分类法的数据特征为基础,经多次讨论修改,并进一步咨询了来自国会图书馆分类法、DDC、国家医学图书馆分类法、UDC的专家代表后所形成的分类法机读格式,被美国图书馆协会的机读书目信息委员会于1990年6月批准为分类法机读格式的暂用文本。待这一格式作进一步试验修订后,将作为分类法机读格式的正式标准。[5]在这个分类法机读格式中,详细规定了适用于美国各种分类法的数据记录格式,对各字段、子字段的内容和形式作了具体说明。[6]其中,要求每个记录至少包括如下字段:008(固定长数据单元,包括有关该记录内容的处理信息);084(分类表及其版本信息),153(类号、类名及类目等级)或154(一般解释性的索引词,它是一个不与某个类号或类号区间相对应的概念,出现的机会不多)。
分类法机读格式提出后,负责DDC编辑管理工作的国会图书馆十进分类法部分析了着重于分类法联机查找的分类法机读格式与着眼于计算机编辑打印的ESS格式之间的异同,并决定继续采用经适当调整后的ESS编辑打印第二十一版DDC(计划1996年夏季出版),但是,又以分类法机读格式出版发行电子版DDC。因而,他们设计了一套自动转换程序,以便将ESS格式的DDC数据记录自动转换成分类法机读格式的数据记录。
1993年,正值DDC诞生(提出)120周年之际,森林出版社(该社于1988年并入OCLC)推出了电子版DDC20——电子杜威系统,一个易于使用的DDC光盘系统。它是在ESS格式的DDC数据库基础上,根据计算机查找DDC的需要,参照分类法机读格式产生的世界上第一个自动化的交互式分类法系统。
2 电子杜威系统的结构和性能
2.1 电子杜威系统的三个组成部分
电子杜威系统的主体是一个包括DDC20主表、附表、相关索引、手册、DDC20出版后所出现的变动等全部内容,以及OCLC联机联合目录的国会图书馆机读目录中与各DDC类号相对应的几个最常见国会图书馆主题标题和一个节选的书目记录样例的光盘数据库。
为便利用户查找DDC20光盘数据库而设计的系统软件是电子杜威系统的第二部分。
第三部分是电子杜威系统用户指南。它向用户解释怎样利用系统的程序功能,以提高分类标引的效率。与用户指南配套的还有一本电子杜威练习册和一本快速参考指南。
2.2 电子杜威系统的性能
在电子杜威光盘数据库中,每个记录均集中了与每个主表或附表类号有关的信息,包括类号、类名、类目等级、各种注释、索引词、相关的其它类号(如参见类号)、DDC20出版后的变动数据、相应的若干主题标题和一个书目记录样例。借助专门设计的系统软件,尤其是方便使用的窗口式用户界面,电子杜威系统具有以下特性和功能。[7]
(1) 允许采用关键词、布尔逻辑、位置逻辑、截词等方法查找类名、注释、索引中的词或短语,进而获取类号。也可单独用类号或者用类号与关键词组配进行查找。
(2) 不仅允许用户进行DDC主表和附表的全文浏览,而且能够在一个屏幕上显示某一类的等级链上移动,进行上位类和下位类查找。
(3) 为方便浏览和显示,电子版DDC将手册的内容分成独立的记录(在ESS记录中,与各类号有关的DDC手册的内容是包括在各类号的记录中),但是,当查找到某个类后,若有必要,可以根据有关提示,迅速调查手册记录中的有关信息。
(4) 电子版DDC20包括了印刷版DDC20出版后的修订变化数据。虽然目前的DDC20光盘只是截止1993年3月,但以后将逐年出版每年只是修订信息的刊物DC&,即DDC,Additions,Notes and Decisions。
(5) 电子杜威系统能够提供DDC记录的标号显示(Labeled display)。
(6) 用户可以在一次查找过程中集中有关一个课题的所有记录。
(7) 用户界面除具有帮助功能和随时进入查找的灵活性外,还可提供直接用显示中的词构造查找提问的便利。
(8) 为帮助用户进行类号组合,用户界面还设有一种注释插入(Notepad)功能。它允许用户复制记录或记录的一部分存入一个窗口,这个窗口可以在用户浏览记录单或某个DDC记录时随时打开。除非用户予以删除,否则这个注释插入窗口将一直保留不变。
(9) 电子版DDC的记录中包含有与特定类号相对应的若干个(一般是5个)国会图书馆主题标题。这些标题是OCLC联机联合目录的国会图书馆机读目录的书目记录中,与该类号共现较多的几个。如下图,是用“计算机通讯”一词查到DDC20的“004.6接口与通讯”类时,用标题显示命令获得的屏幕显示的一部分。
004.6接口与通讯
类号频率:123 LCSH标题数:25
顶端的5个标题:
计算机网络 57 46.34%
数据传输系统22 17.89%
综合服务数字网络 8
6.50%
计算机界面
4
3.25%
电子通讯 3
2.44%
它表示,国会图书馆机读目录中有123个书目记录标引了类号004.6,这些记录共标引了25个不同的国会图书馆主题标题,其中,“计算机网络”这一标题的出现频率(标引次数)最高,一共在标引了该类号的123个记录中的57个记录中出现过,共现比率为46.34%,余下类推。不难看出,标题与类号的对应并不总是确切和固定的,但是,显示与类号对应的一些标题,仍然能够帮助检验所选类号是否正确。
(10) 电子版DDC在各类号记录中还提供标引了该类号的国会图书馆机读目录样例。下图就是屏幕显示的004.6类的一个书目记录样例。
004.6接口与通讯
050TK5105.5$b.N473 1989
082004.6 $220
245网络89:$b……会议录
260伦敦:$b Blenheim联出版物,$cc1989
650计算机网络$X会议
它只是抽取了国会图书馆机读目录中标引了该类号的某个书目记录的几个字段(050字段是国会图书馆索书号,082字段是DDC分类号,245是书名字段,260为出版项字段,650是主题标题字段,$2或$b等是子字段标识符)。这种书目记录样例所提供的类号使用示范,可以帮助分类或检索人员正确使用该类号。
3 电子时代DDC的研究重点
电子杜威系统的开发意味着DDC电子时代的开始。电子版DDC的问世,既为DDC的研究提供了新的条件,也对DDC的研究提出了新的要求。笔者从美国图书馆协会的1994年冬季年会上了解到,为保证电子版DDC的有效应用和继续发展,DDC在电子时代的近期研究重点主要是:
3.1 怎样依靠电子版DDC的决策支持特色,提高电子环境中的分类标引效率。包括:
(1) 以主题标题和主题描述为基础,提供候选的DDC类号;
(2) 检验组合而成的类号,或进行类号组合(组配)。
3.2 研究DDC用于增强联机目录和数据库的主题检索功能。
这是为了更好地发挥电子版DDC在计算机检索,尤其是联机检索中的作用,在已有研究基础上进一步探讨DDC在电子环境中的设计和应用。具体的研究方向包括:
(1) 研究DDC作为一种转换语言使用(例如在多语种目录或不同数据库之间);
(2) 如何进行分类号的自动分解,实现单论题分类号的分面检索。也就是在不改变DDC的等级体系和先组类号等特性的同时,又能在计算机中进行分面检索;
(3) 探讨增加多分面类号或完整类号到书目记录上的可能性;
(4) 能否或如何采用代码显示单个或多个DDC类号表达的多个论题之间的关系。
3.3 如何在电子信息环境中运用DDC作为一种普遍的组织方法。
这个方面的研究是为了扩大DDC的应用范围,以便它能在更广泛的信息组织中发挥作用。具体方向包括:
(1) 探讨DDC在校园信息系统、国际性互连信息网络(Internet)的信息检索中作为一种基础结构来使用;
(2) 探讨DDC用作电子文档(如公司信息文档)的组织方法;
(3) 研究DDC在专家系统中用于组织知识库的潜在能力。
3.4 利用电子版DDC和计算机,为特定的主题领域开发专门的分类工具。
3.5 研究DDC在自动标引和叙词表自动编制中的应用。例如,将DDC作为一种发掘等级关系及其它关系的工具。
3.6 研究DDC在书目行业和地方数据库中的实际运用。包括:(1) 分析类号的应用;(2) 分析类名的应用。
3.7 研究DDC索引的改进,以增强它在分类法和联机主题检索中的功用。包括:补充OCLC数据库中高使用频率的组合类号到DDC索引中;(2) 在DDC索引中引入能直接与DDC类号对应的主题标题。
上述这些方面并不都是全新的课题,有些方面的研究实际上已经进行,并取得了一定的成果。但是,有理由相信,随着整体研究的全面开展和不断深入,不仅电子时代的DDC将会迎来一次飞跃,而且,在它的带动下,整个分类法领域的研究将会面貌一新。