五部分类主题一体化词表的比较研究,本文主要内容关键词为:词表论文,主题论文,一体化论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 五部一体化词表概况
分类主题一体化语言是兼容分类语言和主题语言两者之长,消除两者之短的新型检索语言。它从问世至今,一直得到专家和学者们的高度重视和良好评价。
在一体化词表发展过程中,学术界将之分为4种模式,(1)分面叙词表;(2)叙词表式索引;(3)分类表一叙词表对照索引;(4)集成词表。《中国分类主题词表》是以《中国图书馆图书分类法》第3版(以下简称《中图法》),含《中国图书资料法》第3版和《汉语主题词表》(以下简称《汉表》)为基础编制的第3种模式即分类表—叙词表对照索引式的一体化检索语言,是我国使用最广泛的分类语言和主题语言相互兼容、互换的检索工具。它是将已有的分类表和主题词表加以对应,为每个类号列出对应的主题词和主题词串,在每个主题词或主题词串下列出对应类号。这种对照索引在分类法和叙词表之间架起了一座桥梁,从而实现了体系分类法和主题法兼容,先组式语言和后组式语言兼容。但因受原表体系结构、专指度等因素制约,其兼容程度受到种种限制。只能实现部分等值兼容、不同程度兼容而一部分无法兼容。文中其余四部均属第1种模式即分而叙词表模式的一体化检索语言,是分面分类表和传统的字顺表为主体的叙词表相结合的产物。分类表和叙词表是其主要部分,两者均依概念的分析与综合原理构成,分类表有助于族性检索,而叙词表部则有助于对志指词的快速存取,同时提供了穿越分面结构的词间关系。由于实施统一的词形、词义和词间关系控制,因而能够实现两种后组式语言的兼容,两者一一对应,相互指引,等值兼容。
以图表形式介绍5种词表的概况。
2 结构上的比较
一体化词表的组成部分,通过术语的统一,词间关系显示的互补以及用同一标记作为联结件或转换器而有机地结合在一起。通过简化宏观结构和精细微观结构增强其词表的功能,并且宏观结构简明化,微观结构精细化已成为这种词表的发展趋势。
2.1 宏观结构
如图表一所示,《分面叙词表》由2部分组成,属于二分结构,《Unesco叙词表》和《教育主题词表》由4部分组成,属于四分结构,《基础叙词表》由3部分组成,为三分结构,《中国分类主题词表》则由2个对应表组成。无论是二分、三分、四分结构,共主体是分类表和字顺表,宏观结构比较简明,克服了传统叙词表结构庞大繁杂,分类显示不足的缺点。通过分类表和叙词表两者的有机结合,相互补充和辅助,起到以少胜多,以简驭繁的作用。可以同时体现学科知识分类和事物主题分类,既可满足族性检索需要,又能满足特性检索需要。其作用超出了学科显示、词族显示、字顺显示三者之和。情报检索语言的一体化代表了今后的一种发展方向。
2.2 微观结构
一体化词表中,分类表以类目结构分类显示概念等级、并列关系,叙词表部以款目结构字顺显示概念其它关系,两者互相补充。可见,分类表结构和词间关系显示成为这种词表关键。
2.2.1 分类表结构
(1)分类体系
《中国分类主题词表》分类号—主题词对应表的左栏是《中图法》(含《资料法》)类目原文,右栏为类目所对应的主题词和主题词串,是一部用主题词或主题词串作注释的等级体系分类法。具有“鸟瞰全貌”、“触类旁通”的优点,但在提示专深主题、复杂主题和实现多途径检索等方面存在明显不足。其余4部词表均采用分面分类理论建立词汇分类体系,属于体系—分面分类法,即克服了列举式体系分类法缺乏专指性、及时性和灵活性的缺点,又弥补了自由分面分类法人为性大、难以判断查找的不足,体系一分面分类法代表了分类检索语言的一种发展趋势。
(2)类目展开方式及标记制度
《中国分类主题词表》依据文献内容的学科、专业性质及其它特征展开类目,划分成22个大类,采用字母加数字混合号码,基本遵循层累制标记制度。
《分面叙词表》先按传统学科划分大类后在每一学科下进行分面分析,划分为4大类,主要采用大写字母的单纯号码和字母加数字混合号码和顺序标记制度(类表二大类除外)。
《Unesco叙词表》基本大类划分为若干传统学科,大类下按传统划分为小学科,无传统学科时采用分面分析,划分为7个基本大类。采用第一级及最末级类目用一位字母表示,中间采用双位数字,每双位数字后加小圆点表示一级类目的混合号码,其标记制度为层累制,半层累制和起讫制。
《基础叙词表》一、二、三级类目按传统学科系划分,从第4级起运用分面技术展开分为24大类,采用纯字母单纯号码和层累制、起讫制的标记制度。
《教育主题词表》类目展开遵循学科体系—组面—亚面形式分为16个大类,类目采用双字母加数字混合标记,按层累制配号。
后4种词表均以“按××划分”为分面标头指示分面标准。
笔者认为《Unesco叙词表》标记制度比较灵活,字符较少,功能较强。采用双位数字加标记符号方法使其具有等级分明、简单明了的优点,便于计算机自动扩检和缩检。其混合标记制度使该词表具有较强容纳性,便于在任何类列、类系上扩充新类。
(2)类目关系显示
我们用表格形式列出5部词表在显示类目关系上所用方法:见表二
由表二比较中可以得出:
第一,4部词表(《中国分类主题词表》除外),均设置大量先组词(较多的带提示性组代关系),能够引导主题词组配,提高标引质量。
第二,类目关系显示逐渐深入,便于用户迅速选词和换词,扩大和缩小检索范围。
第三,分类表类目等同关系的显示,有助于提高标引速度和标引的准确性。
2.2.2 字顺叙词表结构
(1)款目构成
除《中国分类主题词表》的参照相关叙词后无分类号外,其余4部均在相关叙词后列出专指分类号,《教育主题词表》还设有词号。
(2)等同率
等同率即非叙词与叙词的比率。从等同率的高低,可看出词表入口词的丰富程度。笔者计算5部词表的等同率,结果为:《分面叙词表》43.75%,《Unesco叙词表》为53.71%,《基础叙词表》46.61%,《教育主题词表》为22.95%,《中国分类主题词表》19.10%,可见,我国叙词表等同率大大低于国外词表等同率。
(3)参照关系
5部词表参照关系对比见下表。
通过上述对比,可以得出:
第一,每个相关叙词后标记相应分类号及词号,能够加强叙词表分类表的联系,实现快速转查。
第二,检索入口词的多寡决定等同率的高低,关系着检索效率的高低,国外叙词表中入口词较多,几乎达到正式叙词的1/2,而我国只有1/5左右。
第三,《基础叙词表》采用符合国际标准数学符号作为参照符,使这些描述与所使用语言无关,增强了词表的适用性,有利于资源共享。国际通用符号的使用和完善的参照关系是该词表的一大特色。
第四,《中国分类主题词表》在族首词下采用等级关系全显示的方法,将词族索引和S、F关系融于字顺表中,既节省了篇幅,又较为简明。
3 结论
《中国分类主题词表》是《中图法》和《汉表》全璧本,两者相得益彰,它成功地创造了编制大型综合性一体化词表的经验,创立了以主题词或主题词串作注释对应于体系分类表类目之下的一体化词表编制模式,为推动专业一体化词表的编制奠定了基础。但不容否认,与其它几部词表相比,其在编制技术上和标引方法上还有待进一步完善,笔者对《中国分类主题词表》的改进初步提出了7点建议。
(1)完善宏观结构。编制规范化英汉对照索引,方便用户从英文名选定汉语主题词。对于非叙词,加注“用”参照项,索引款目如表四。
(2)在主题词—分类号对应表的相关叙词后标注分类号,减少用户来回翻阅的时间,增强其易用性,具体格式见下表:
(3)通过同义词、近义词有效控制,增加检索入口词,提高其等同率。
利用有关工具书,将具有检索意义的被落选的同义词、被合并的近义词或反义词及过于专指的词作为非叙词收录在词表之中,从而提高非叙词所占比率。
(4)对分类表类名进行规范,提高兼容程度。
在重视分类表体系结构的同时,也重视类名字面形式的规范,对类目名称进行词汇、词形控制,增强类目与主题词的对应关系。
(5)加细类目细分程度,避免由于采用上位标引,靠类标引起的主题标引的不一致。
类目设置较粗或划分标准与文献不相适应,由采用靠类标引或上位标引方式而转换的主题词必然会与文献内容不相适应,可适当加细类目细分程度和多重列类法适应分类主题一体化标引一致性的要求。
(6)修订词表时,其对于母表(《中国分类主题词表》)和子表(《中图法》、《汉表》进行综合考虑,可将三者编制机构合并,随时以简报或其它形式将类目、主题词修订(增、删、改)信息传递给用户,并建立修订类目与主题词的对应关系,使其有机结合,协调发展。
(7)《中图法》分面改造
在用户可接受原则下,修订、改造分类法遵循《中图法》编委会提出的第3版修订的“稳定、完善、提高、发展”八字方针,既要保持分类号码连续性和完整性原则,又要遵守与知识发展同步原则。
完善多重列类法,在类目体系结构基本不变情况下,进行多重列类。标引时借鉴《国际十进分类法》附加符号合成标记法“’”搬号法,将多重列类中所涉及文献主题联结起来,并实行轮排,改进最前、最后标号法。那么一篇《钢筋混凝土公路斜拉桥》文献,标引号为U448,34'14'27,而不是U448.34(最前标号法)和U448.27(最后标号法),这样就能充分揭示文献所包含的各个主题,真正发挥多重列类横向展开,多向成族的作用。
标签:主题词论文;