一种新型知识组织系统——思维导图可视化词典,本文主要内容关键词为:词典论文,思维论文,组织论文,知识论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
我们被淹没在信息的浪潮中,但仍然渴求信息。因为很多信息资源没有得到良好的组织,实际上很难应用,甚至变成无用的信息。这就要求我们组织和控制信息,不断推出各种知识组织系统(KOS),以适应信息环境的变化。 思维导图可视化词典(Thinkmap Visual Thesaurus,简称TVT)就是一种新型知识组织系统,它使词汇及其词间关系可视化,具备互操作性,并在传统词表的基础上衍生了新的功能,被广泛应用于教育、心理和经济等多个领域。
1 思维导图
近年来,在网络、电视、报刊等媒体上出现一个思维导图热,被称之为新的学习革命。思维导图(Mind mapping),由英国心理学作家Tony Buzan于1971年提出。它是放射性思维的表达,是一种运用图形技术,动态地记录信息和思维的方法,因其反映了人脑的思维过程,有助于改进学习和清晰的思考,所以被誉为一种新型的学习方法和学习工具。思维导图有四个基本特征[1]:
(1)注意的焦点清晰地集中在中央图形上;
(2)主题的主干作为分支从中央图形向四周放射;
(3)分支由一个关键的图形或者写在产生联想的线条上面的关键词构成、 比较不重要的论题也以分支形式表现出来,附在较高层次的分支上;
(4)各分支形成一个连接的节点结构。
思维导图目前被广泛应用于个人、家庭、教育和商务机构,用于记录笔记、头脑风暴、摘要总结、理清思维等。国外还出现了形形色色的基于思维导图原理开发的软件,如广泛用于教学的Inspiration[2],商务类软件Mind manager[3], 用于个人应用软件Mindgenius[4],免费软件Freemind[5],学习软件Thinkmap Visual Thesaurus等等。
2 思维导图可视化词典简介[6]
《纽约时报》评价TVT是“创造性的,富于想象的,独创的和奇妙的”。 它是由美国纽约Thinkmap研究所开发研制的三维交互式参照工具。它基于Java语言编写的图形显示工具——思维导图词表构建软件。该软件综合运用网络和数据库技术,使从WordNet(词网)数据库中检索到的数据集合形成可视拓扑图,使数据集合之间的概念语义网络动态地显示出来。它提供一个功能强大、操作灵活、具有生动视觉效果的交互式界面,吸引并鼓励广大用户学习和参与其中。
Thinkmap研究所于1998年2月发布了TVT第一版,作为可视化技术研究前沿,立即受到广泛关注。现在应用的第三版于2005年1月20日发布,收录了超过145000 个英文词汇(word)和115000个涵义(meaning),包括名词、动词、形容词和副词,提供美语和英语两种读音。它显示包括属种关系、整部关系、组成关系、反义关系、类似关系、属性等17种词间关系。TVT第三版提供桌面版和网络版两个版本, 其中网络版可以动态升级和更新,除英语外,还提供荷兰语、法语、德语、意大利语和西班牙语的检索。TVT通过升级换版,不断改进其界面及性能, 现在用户已经遍布作家、记者、工程师、教师、学生以及其他语言爱好者。
2.1 TVT工作原理[7—8]
TVT是一种思维导图,它的动力引擎,即TVT构建软件,基于java语言,并结合XML配置语言构建可视化效果,与服务器端Wordnet数据库交互信息。用户在可视化界面即客户端应用程序内点击一个数据对象时,应用软件通过HTTP与思维导图应用服务器(TAS)进行交互。配置有思维导图终端用户的TAS可以发送请求到任何Java数据库连接(JDBC)或者兼容数据库,客户端应用程序再把数据传送并显示给终端用户。
图1 TVT工作原理
2.2 TVT与WordNet[9]
WordNet是由普林斯顿大学认知科学实验室开发的在线词汇语义网络, 是一个基于心理语言学原理的机器词典。这个系统中的名词、动词、形容词和副词都聚类为代表某一基本词汇概念的同义词集合,并在这些同义词集合之间建立起同义关系、反义关系、上下位关系、属种关系、整部关系等。 该数据库包含50000 多词汇和40000多词组,这些词和词组归属于70000多个涵义(sense meaning)。WordNet数据库列出一个词的各种不同涵义及其解释,用户一旦选定某词的某一涵义后,用户可以看到该词的同义词及各种相关词。TVT以底层Wordnet数据库为数据源,该数据库基于WordNet原理,并在词汇和涵义数量以及词间关系上进行了扩展,从而发展到现有规模。
3 思维导图可视化词典的使用及特点
3.1 思维导图可视化词典的使用
查询词汇时,TVT以蜘蛛网形式显示结果集,构成交互式视觉图。查询词作为中心词显示在图的中央,与其相关的词和涵义用辐射线连接分布在它的周围,这样构成一个语义网。例如,用户在检索框中输入检索词school(学校),点击“查看”(look it up)后,系统自动生成以检索词school为中心词的语义网,其四周是代表与中心词不同关系的词汇。用户可以点击他认为能够正确表达检索要求的词汇,使其成为中心词。这样经过多次反复实践,当找到适当词汇时,在右键单击词汇出现的快捷菜单中指示进一步操作。用户可以选择“检索网络”或者“检索图像”,由系统指定的检索机制完成检索任务(如图3所示),方便用户进一步了解词义。
如图2 , 在以检索词“school ”为中心形成的语义网络中, 四周节点代表school的不同涵义,每个涵义连接的词汇即与该涵义相关的词汇。节点的不同颜色表示涵义的不同词性(名词、动词、形容词和副词),界面右侧把各涵义按四种词性分类显示,并与节点颜色相对应。 节点之间的虚线表示涵义之间的关系, 如“educational institution”(教育机构)与“school”之间是属种关系(a type of)。打开工具栏的“设置”按钮即展开个性化定制菜单(如图3),用户可以在此设置显示界面、选择词间关系、内容过滤、语言选择、打印设置等。
3.2 思维导图可视化词典的特点
(1)界面友好,方便用户操作。TVT充分利用网络和数据库技术,以三维动态语义网形式显示词汇,界面简洁直观,词间关系完全“可视化”。用户在词义和词间关系的引导下,很快找到符合自己心意的词汇,仿佛经过一次奇妙的语义探索旅程,不经意地会有些令人惊奇又欣喜的发现。这比查询传统词表按部就班的操作有趣多了。另外,TVT具备了电子化词表所能提供的许多友好措施:① 查错功能,如果用户拼写错误,系统会自动提供多个候选词汇,方便用户选择;② 用户可以个性化定制字体的字号,颜色,控制显示的词间关系种类等。③ 提供美语和英语两种读音;④ 词性过滤。这些措施使得TVT只需极少甚至根本不需要培训就可以使用。
(2)提供分级内容过滤功能[8]。TVT为适应不同层次用户使用, 提供四个不同等级的内容过滤功能:① 非限制级,即保留任何从数据库中查询到词汇;② 一级限制,过滤掉查询结果集中不雅的词汇;③ 二级限制,自动过滤掉那些包含毒品、赌博、种族歧视、色情、暴力等内容的检索结果,是系统默认等级;④ 三级限制,也是最严格的一级,过滤掉凡是有攻击性的或不适于儿童阅读的词汇。
图2 TVT的界面
图2 TVT的使用
(3)强大的教育功能[10]。TVT在传统词典基础上延伸出新的功能,使得用户不再局限于检索领域的专家和学者,而逐渐扩展到教育、写作等其他领域。因其独特的知识显示方式,TVT在教育方面得到了广泛应用。它直观的界面, 使学生能够轻松地掌握使用方法;它根据词义连接词汇,学生可以通过词汇之间的语义关系查词,能更精确地理解词汇含义和把握词间关系;而且学生可以根据它提供的英语和美语发音来纠正读音;另外,它能够扩展应用到网络检索,使学生获得更多信息。查询TVT的过程是一个探索和求知的过程, 学生很快能发现它的趣味性并投入到学习新词汇中去,这对于改进学生阅读、写作和交流技巧,无疑是个强大的教育资源。此外作家和记者可以利用可视化词典选择合适的表达词汇,从而丰富自己的作品。企业中,员工把它作为词汇查询的工具,在书写报告等文书时就不必担心会出现词穷的困境。
4 思维导图可视化词典简评
TVT一发行就得到广泛好评,其优点显而易见,但也存在一些不足之处。首先,检索者很容易迷失在词汇的探索过程中。这主要因为它深入揭示17种词间关系,在使用过程中,用户要仔细推敲各种关系,在多次词汇选择后,很容易忘记自己曾经点击过的词汇。为了解决这个问题,可视化词典设置了“前进”和“后退”按钮,用于简单导航。但如果配置一个简易的可视化导航图,标记用户点击过的所有词汇路径,用户就可以一目了然。其次,可视化词典允许用户选定词汇后进行网络和图像检索,但它却不适用于网络检索导航服务。急于获得答案的检索者不会花费心思在它“游戏般”的环境中寻找合适的检索词,[11] 另外,单独的一个词汇或词组无法确切地表达检索用户复杂的检索要求。所以,TVT 的功能更倾向于揭示词汇和词间关系,方便用户查询和学习,而把词汇网络作为辅助了解词汇的一个手段。
TVT,虽然名为“thesaurus”,而它并非也不属于传统意义上检索领域中所指的叙词表,但是不可否认,它与叙词表很相似。根据美国国家标准ANSI/NISO Z39.19—2005对“thesaurus”的定义, “叙词表是以已知次序和结构组织起来的受控词典,词间关系用标准关系指示符明确标注出来,并且这些指示符应能互逆使用。编制叙词表的目的在于提高系统,特别是后组式信息存储和检索系统的标引一致性,并通过连接入口词和款目词促进浏览和检索”。[12] 由此可见,TVT并不是供标引和检索用的规范化词典,因此不宜把它视作叙词表。但是TVT作为一种词典, 也属于知识组织系统的一种,即术语工具(term list)。它不仅提供词汇的定义,还显示其同义词和相关词,便于全面了解词义。另外,TVT底层数据库WordNet从语义角度出发来组织词汇,目的在于揭示词汇之间的同义及其他关系。在计算语言学领域,WordNet被广泛应用于语义分析和消歧,信息语义检索,主题含义识别, 图像检索,文本语义分类,汉语语义分析,文本过滤,语料库语义标注等方面。所以,我们还可以把TVT看作是WordNet的一个新应用。
网络和计算机技术的发展,给传统词表注入了新的活力。TVT 率先应用可视化技术,融合思维导图和知识组织系统于一体,充分展示词(组)之间隐含的各种关系,给用户营造一个轻松、友好的使用环境。它给中文知识组织系统构建带来一些启示:(1)传统词表因排版等因素限制,提倡参照度为2—5个[13]。现在,数据库、计算机技术的使用已经突破了传统词表的许多限制,提高参照项数量,能给用户提供更多选择,从而增强词表的功能;(2)把可视化技术引入词表等知识组织系统,便于融合词表使用规范,同时给用户提供友好的使用界面;(3)随着使用环境、使用对象和使用目的的迁移和变化,各种词表在表现形式、内部结构和系统架构上已突破传统模式,并依托先进技术进一步改进和创新,使得知识组织系统各具特色,异彩纷呈,甚至衍生出新的功能。
收稿日期:2006—06—19 编发:刘炜 赵亮