同义词库在网络信息组织中应用的调查、分析与优化_多语言论文

叙词表在网络信息组织中应用的调查分析及其优化,本文主要内容关键词为:词表论文,组织论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G254.2 [文献标识码]A [文章编号]1002—1167(2007)06—0183—04

网络化的叙词表联机显示是叙词表在网络环境下应用的主要形式之一,其中既有原印刷型词表的数字化,也包括数字化环境下编制和生产的数字化词表。对叙词表在网络信息组织与检索中的应用进行全面调查与分析,并提出优化对策,是知识组织领域研究的重要课题之一。

1 英文叙词表在网络资源组织中应用的调查与分析

1.1 叙词表应用的调查

叙词表在网络信息资源组织中的应用实践及研究,主要集中在国外,笔者采用“thesaurus*internet*resources*organization”、“controlled*vocabulary*internet*resources*organization”、“subject*heading*internet resources*organization”等作为检索表达式查询相关数据库及搜索引擎,对英文叙词表在因特网资源组织中的应用进行调查。结果详见表1。

1.2 叙词表应用现状的分析

1.2.1 叙词表应用的两种类型

根据是否可直接使用链接资源,可将对表1所调查的43种叙词表归纳为两种类型:一是仅供选择词汇使用,独立于检索系统之外。通过浏览叙词表,选择检索词,以所选用的词汇作为检索入口词,不直接链接资源,这种叙词表有17个,占39.5%;二是叙词表嵌入在检索系统之中,作为检索系统的一部分,检索与浏览词表后,可直接使用选中词链接(检索)相关资源,此类叙词表共有26个,占60.4%。可见,第二种类型(即通过选中叙词表中优选词或正式叙词,直接实现链接资源)已占多数,能够更加方便用户检索,节省用户时间。

1.2.2 检索途径与功能的发挥

对表1所调查词表的检索功能进行分析,其中有26种词表提供了主要包括关键词检索及字顺浏览等2种以上检索途径,占60.5%,在其余17种提供1种检索途径的词表中,有10种仅提供了检索功能(主要是关键词检索),占23.3%,7种提供了浏览功能(主要是字顺浏览),占16.3%。虽然提供2种以上检索途径的叙词表占60.5%,但仍有近40%的叙词表只提供1种检索途径。可见网络叙词表的多途径检索功能有待加强。

1.2.3 语种与应用的学科范围

表1中有12种为多语言叙词表,占27.9%,其中文种在5种以上的叙词表有6部,有的文种多达到18种,可见叙词表向多语种发展成为其发展趋势之一。

应用于标引与检索所有学科主题的叙词表有10种,占23.2%,应用于某一具体学科领域的叙词表有33种,占76.8%。可见叙词表在学术性、专业性的网络信息组织中起到不可替代的作用。

通过逐一对所调查的叙词表进行浏览,发现有些词表在显示、使用帮助、词表的管理系统等方面还存在的不足。

2 叙词表用于网络信息组织的优化

计算机技术、多媒体技术与超文本链接技术的有机结合,为叙词表的网络化、利用叙词表改善检索界面提供了条件。可从以下方面对用于网络环境中的叙词表进行优化。

2.1 词表显示与操作的易用化

第一,在主要检索页面与检索入口词的显示上,在界面上使用“建议使用的词汇”、“叙词”、“主题标题”等。提供按等级、字母和分类浏览、多种检索等多种方式的检索人口,提供布尔逻辑操作,支持浏览与检索策略。第二,在词间关系的显示上,提供简单、可理解的术语描述标识符与词汇之间的关系。如以“NT”、“BT”、“RT”和“USE”等符号显示词汇间的关系,或使用完整的形式描述叙词间的关系,如“上位词”、“下位词”、“相关词”等,也可使用“+”、“-”、“·”等进行指示。第三,在具体的操作方式上,提供如拖拽、超文本链接、双击等灵活的方式,将检索的词汇直接粘贴在数据库检索系统中,节省用户时间。并为存贮用户浏览叙词表所选择词汇,提供“词汇存贮”功能。第四,在获取资源上,直接在相关词下实现资源链接。

在检索界面上向个性化方向发展,借鉴National Monuments Record Thesauri方式,分别为新用户及经常使用用户提供两种不同界面。在词表的显示与操作方面要向易用化发展。

2.2 创建词表的帮助文件

在叙词表页面上设立帮助文件,有助于用户正确理解与使用叙词表。可以“Help”、“About Thesaurus”、“using the Thesaurus”、“how to use thesaurus”、“Search tips”、“Our online guideline”等作提示语,建立帮助用户使用叙词表的各种措施。可借鉴Art and Architecture Thesaurus词表的经验,其“?Help”内容有“怎样使用屏幕”、“检索技巧”、“如何读检索结果”、“如何读完整记录显示”、“怎样进行等级浏览”、“如何使用AAT联机(PDF版)”、“关于AAT”等。通过设立专门的链接栏目,采用超文本格式,做到帮助文件简洁明了,图文并茂,易于理解。

2.3 实现知识组织间的互操作

网络环境中知识组织系统间的互操作已是亟待解决的现实问题。这方面研究与实践上已取得一些进展。如英国的HILT(High-Level Thesaurus Project)研究计划,旨在研究网络环境下,利用现有的叙词表、分类法等工具,主要通过DDC类号,建立一种映射关系,通过相互之间的映射使它们联系起来,实现协作主题检索、跨库交叉检索。可以预计将会有更多实现互操作的兼容与互换的多语言产品和服务出现。

2.4 开发叙词表管理系统

应该开发与研制功能强大的叙词表管理系统,系统应该实现以下功能:(1)能够自动生成建议的候选词汇,用户可创建临时的叙词表或分类词表;(2)支持多语言功能;(3)文档、在线帮助功能。在线帮助功能包括索引和全文搜索,用户可以便捷地找到关于某个主题的信息;(4)浏览和搜索功能。以WebChoir为例,它是为创建叙词表、开发分类词表和管理元数据提供完全基于网络和J2EE平台,并支持多语言的工具软件开发的一整套工具软件,是专门为商业和非赢利组织创建叙词表使用的。

2.5 向多语种叙词表发展

多语种叙词表是网络叙词表发展方向之一。多语种叙词表消除了语言障碍,用户只须使用熟悉的术语,就可获得该术语的其它语言的对等词。可采用IFLA《多语言叙词表指南(2005)》构建多语言叙词表,其主要方式有:一是创建新的叙词表,以一种语言开始,作为主表达款目词,再同时列出与其概念相同的用其他语种表达的款目词;二是合并现有的叙词表,可合并两种或多种现有的叙词表成为一种新的多语言检索语言,或将现有叙词表相互链接;三是将一种叙词表翻译成一种或其它语言的叙词表。

[收稿日期]2007—10—08

标签:;  

同义词库在网络信息组织中应用的调查、分析与优化_多语言论文
下载Doc文档

猜你喜欢