WebDewey与电子LCSH结合技术探讨_主题词论文

WebDewey和电子版LCSH组配技术探微,本文主要内容关键词为:电子版论文,探微论文,技术论文,WebDewey论文,LCSH论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

杜威十进制分类法和美国国会主题词表是目前世界上最为通用的两种受控词表。作为传统先组列举式词表,它们都以组配技术来增强各自适用性和生命力。杜威十进制分类法和美国主题词表的组配功能在各种分类法主题法教材中已有阐述,但限于资料的局限性,这种阐述多半是概论性的,缺乏典型例子的分析。电子版杜威法和美国国会主题词表的具体使用也鲜有涉及。本文首先简要介绍了视窗杜威和美国国会主题词表系统的特点,然后从使用的角度,通过对具体例子的分析来探讨两者的组配功能。

1 视窗杜威和电子版美国国会主题词表

1.1 视窗杜威

视窗杜威由OCLC于1996年组织开发。它集杜威法双版主表、复分表、相关索引、手册以及与美国国会主题词表的匹配五个部分为一体。主表(Main Classes)与六个复分表(Tables)以超文本方式在使用界面展示,主表类目显示的内容包括类目本身、类目注释以及对应的相关索引词和美国国会主题词。DDC介绍和术语以附加的形式显示,在“Show”选项中选择后,如图1所示,相关内容在新的窗口出现。相关索引和匹配的美国国会主题词则以数据库方式储存以提供检索。

视窗杜威提供浏览(Browse)和检索(Search)两种检索方式,检索点包括类号、类名、类目注释、相关索引词和美国国会主题词,所有的检索都会指向相应的类号,包括复分表类号。以相关索引词和美国国会主题词为检索点的益处是它们提供了大量类名以外的主题词,或者说,它们更为详细地阐释了类号和类名所覆盖的内涵,因而可以用来帮助有效地寻找参考类号。尤其是匹配的美国国会主题词,它的更新速度比杜威法要快,可以用来帮助新主题、新概念的分类,比如“Semantic web”、“Web portals”之类的新概念,通过匹配的美国国会主题词的检索可以得到参考类号。在检索功能方面,视窗杜威支持字段检索和常用的布尔逻辑检索。图1显示的是视窗杜威的浏览界面,浏览方式可以得到比匹配检索更多的结果选项,因而更为常用。另外,视窗杜威还提供检索以外的增强功能,比如保存检索历史,记载类号的工作区域,允许用户记录个人使用心得的注记区域。这些增强功能以菜单方式在界面显示,以便于使用。

1.2 电子版美国国会主题词表

与视窗杜威相比,美国国会主题词表系统要相对简单一些。如图2所示,系统提供浏览与检索两种检索方式,检索点包括标题词、自由浮点组配词、关键词、和美国国会分类法分类号。其中,标题词指正式标题词,包括单元词和已组配的复合词。自由浮点组配词指不能单独使用的、只能用来组配的标题词。关键词既包括正式标题词也包括自由浮点组配词。在检索功能方面,系统提供字段检索、布尔检索和截词检索。在词表展示方式上,系统支持等级式和字典式两种方式,标题词和自由浮点组配词都分别以这两种方式展示,用户可根据需要在检索界面选择,通常等级展示更为常用和实用。在标题词展示方面,系统除了显示常见的范围注释,以及等同、等级和相关词间关系外,还链接了与标题词对应的杜威法类号、美国国会分类法类号和含有该标题词的书目纪录。用户可根据需要进行察看。

图1 视窗杜威的浏览界面

图2 美国国会主题词表检索界面

2 视窗杜威的组配功能

2.1 通用复分。

视窗杜威的六个复分表,一般通用复分表(Table 1:Standard subdivisions)可以自由使用外,其余五个复分表都必须在相关注释的指导下使用。一般通用复分表使用的复杂情况主要表现为二种。

第一种表现为一般通用复分表已作为一般性问题反映在主表中,在复分时需要将主表与一般通用复分表进行核对,以便正确组配类号。如对“Abbreviation and Symbols in Mathematics”主题的标引,Mathematics的类号是510,“Abbreviation and Symbols”的复分号为0148,仔细比较Mathematics 510类表和一般通用复分表,可以得知510中的“0”其实是来自一般通用复分表。因而,在复分时需要去掉一个0,正确类号为510.148。

第二种情况表现为一般通用复分表在有些类目下进行了改动,这种改动可能直接体现在有关类目中,也可能反映在类目增设的复分表中。如对“Aserial on Human Diseases”主题的标引,“Serial”的复分号在一般复分表中为05,但在“Diseases”类目中,通用复分表已改动为“616.003-616.006 Standard subdivisions”,所以正确类号应为616.005而不是616.05。又如对“Health insurance systems in Canada”主题的标引,地理区分在一般复分表中的类号为“09”,而在“Health insurance systems”368.382类目下注明使用的复分表中,也就是增设的复分表中,地理区分已改为“009”,因而正确类号应为368.38200971而不是368.3820971。

通用复分还有一个有趣现象是,在处理涉及两国之间的主题概念时,采用使用两次地区复分表,在两国代码之间加一个零。如对“International commence between Japan and China”主题的标引,某一国家国际贸易的主类号为382.09,类目注释表明可用地理复分表区分,日本的地理复分号为52,中国的地理复分号为51,因而,正确类号为382.0952051。

2.2 在有关类目下增设复分表

除了使用六个复分表外,视窗杜威还根据需要在有关类目下增设了更为细化和适用的复分表。这种情况在视窗杜威中非常常见。如对“Remolding Railroad Buildings”主题的分类,在铁路建筑物的主类号725.33下,如表1所示,类目注释表示类号组配用721-729类目下的复分表,从该类目下显示的复分表中可找到“Remolding”的复分号为0286。这种在类目下增设的复分表有时也会对一般通用复分表进行改动,如上一节所提到。

表1 725.33类号复分注释

2.3 仿分

类目仿分在视窗杜威中主要表现为两种情况,一种是对主题的细化,另一种是为了处理交叉主题。如对“Psychology of hyperactive children”的标引就属第一种情况,异常儿童心理学的基本类号为155.45,该类目下注明异常儿童类型可依教育类的学生类型371.91-371.95仿分,因而,正确类号为155.454。对“The use of commodore 64 digital microcomputers in computer chess”主题的标引属第二种情况,计算机国际象棋的基本类号为794.17,类目注释注明该类号可继续依计算机类的计算机类型004-006区分,特殊计算机类型的类号为004.165,因而,正确类号为794.174165。

2.4 类目组配

除了使用复分、仿分技术外,视窗杜威还大量使用主类号组配来处理多学科和交叉学科主题。如对“Professional ethics of dentists”,“Disco dancing advertising”,“Library classification for physics”等诸类复杂主题的标引都采用了组配来自不同学科大类的主类号。“Professional ethics of dentists”的正确类号由来自伦理学的行业职业伦理174.29(主类号)和来自医学的牙科医生617.6092组配为174.296176092。“Disco dancing advertising”的正确类号由来自广告学的行业广告659.19(主类号)和来自艺术类的迪斯科舞蹈793.33组配为659.1979333。“Library classification for physics”的正确类号则由来自图书馆学的主题图书分类法025.46(主类号)和物理学530组配为025.4653。对这种复杂主题处理的诀窍是找到正确的主类目,然后在相关类目下找到用允许类号组配的注释。

3 LSCH的组配功能

3.1 自由浮点组配词

美国国会主题词表除了列出正式单元标题词和复合标题词外,大量使用自由浮点组配词来表达复杂概念。自由浮点组配词包括主题、地理、年代和形式四种。这四种自由浮点组配都必须按照注释来使用,主题、年代和形式三种自由浮点组配词的使用在其范围注释中说明,例1是一个主题自由浮点组配词,按照范围注释,“History”一词可以与国家名称、城市名称、机构名称、宗教著作统一题名、某一特定人群、种族和主题标题词组配。地理组配的使用表示在正式标题词后,如例2所示。在对复杂主题进行标引时,首先要确定该主题反映的主要概念,然后以该概念为检索点对词表提供的单元词及复合词进行查询与搜索。在确定合适的复合词在词表中不存在后,开始进行自由浮点词检索与组配。在地理组配词的使用方面,美国国会主题词表规定按照国家-区域-城市的次序排列,美国、英国和加拿大三个国家除外,这三个国家的国家名称可以略过。在引用次序方面,按照标题词-主题组配-地理组配-年代组配-形式组配的次序进行。

——History

Use as a topical subdivision under names of countries,cities,etc.,and individual corporate bodies,uniform titles of sacred works,and under classes of persons,ethnic groups,and topical headings.

例1:主题自由浮点组配词

Labor supply(May Subd Geog)

例2:地理组配说明

3.2 典范标题

美国国会主题词表提供的另一种组配方式是按典范标题组配。美国国会主题词表在手册中规定了23个范畴的典范组配,这23个范畴包括动物、化学元素、疾病、教育机构、产业、语言、植物与农作物等,在每种范畴,词表列举了一个可仿照的典范。在具体标引时,可按例子进行组配,如对“Control of the color fading of apples”主题的标引,可仿照植物和农作物类的“Corn”标题词组配,对“Disclosure of corruption in the oil and gas industry in Thailand”主题的标引可仿照产业类的“Construction industry”标题词。在使用时,先查询可仿照的标题词,然后以该标题词为检索点查询词表提供的正式标题词,最后进行仿照。

4 结论

通过上述分析可得知杜威十进制分类法和美国国会主题词表对组配技术的驾驭能力,它们的共同点是力图通过组配方式来全面而详尽地表达复杂主题概念,两者的不同只在于采用了不同的表达语言,一个通过语词而另一个通过代码。但这种组配技术的大量使用也带来了实际使用上的难度,视窗杜威的组配技术除了上文提到的几种外,还包括数次复分或仿分,比如,在复分表中再次使用增设的复分表,在仿分的过程中要求再次依有关类目仿分,在实际标引工作中,需要在主表类目和复分表中反复查看以确保类号的正确性。美国主题词表的使用也表现为同样的情况,一个正确标引的确定需要在正式标题词、自由浮点组配词和典范标题列表中数次核查。如上述提到的“Control of the color fading of apples”的例子,用自由浮点组配可以找到答案,用典范标题组配也可以找到答案,虽然两个答案是一致的,但不得不进行核对和确认。这些复杂性都给使用者带来了困难。组配技术运用的规律性和一致性似乎还有待于在两部传统词表中得到进一步的保障。

收稿日期:2007-04-27

标签:;  ;  ;  

WebDewey与电子LCSH结合技术探讨_主题词论文
下载Doc文档

猜你喜欢