Taxonomy、Folksonomy和Ontology的分类理论及相互关系,本文主要内容关键词为:相互关系论文,理论论文,Taxonomy论文,Folksonomy论文,Ontology论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类思想在人类认识世界的过程中有着悠久的历史,对事物或观点的表达、交流和记录起着重要的作用。一些与分类相关的概念经过长时间的演变容易衍生出其它的意义,而一词多义的情况,也有因语言转译的原因,导致一些词汇经过语言的转换有可能未能显示出原本意义,概念的模糊容易产生理解上的混淆,在学术沟通上形成障碍。本文整理出Taxonomy、Folksonomy和Ontology的概念,在分析各自特性的基础上,对概念间的关系做了进一步的比对,为分类学相关研究提供借鉴。
1 分类相关概念解析
1.1 Taxonomy内涵、特性及应用
Taxonomy这个词的历史很悠久,Taxonomy由希腊文taxis与nomos或nomie组成,taxis指排列(arrangement)或分类(classification);nomos指管理(management),nomie表示有方法有系统的法则或是一种专门学科知识。Taxonomy的常见译名有分类学、知识分类学、专家分类等。Taxonomy是一个意义很宽泛的词,在不同的语境下有不同的意义。Taxonomy的原意是揭示生物体之间的进化发展关系,延伸到信息科学领域是指对信息、知识的分类组织,它是信息构架(Information Architecture)中一个重要部分。从广义上来说,Taxonomy包括对任何事物,包括具体或抽象事物的分类组织,其概念应该包括三个基本要素:Taxonomy是对事物的一种分类,既可以指方法,也可以指产品,如分类表或分类系统;Taxonomy揭示事物之间的等级关系,如生物体之间的种属关系,主题词内涵之间的属分或其它等级关系;Taxonomy的目的是帮助认识、查找或定位事物[1]。具体来说,Taxonomy有以下几种涵义:(1)生物分类;(2)分类的科学或技巧;(3)知识分类学;(4)由范畴(Categories)和联结范畴的关系所组成的一种架构;(5)分类表或分类系统;(6)知识地图。
Taxonomy有以下基本特性:(1)Taxonomy是由上而下产生的信息架构;(2)Taxonomy由相关专家集体编撰,知识体系具有权威性,较为严谨单纯;(3)Taxonomy有系统化专门化结构、由专家制定控制;(4)Taxonomy以利他为出发点,比较客观。
Taxonomy作为知识分类学(法),在图书馆学界很常用,通常是由专家编制的专业层次目录,具有权威性。如杜威十进分类法、中图法、冒号分类法及各式各样的分类法都是Taxonomy应用实例。这些分类法通常是作为一个标准和一种工具而存在,由于形成了统一的标准,用户可以根据这些编目规则找到所需的图书[2]。网络环境下,Taxonomy经常地被用在因特网(Internet)、企业内部网络(Intranets)或企业外部网络(Extranets),与数字时代的信息检索软件有密切关系[3]。
1.2 Folksonomy内涵、特性及应用
Folksonomy一词由Thomas Vander Wal所创,是Folks和Taxonomy组合而成的新词汇,Folksonomy是与Taxonomy(知识分类学)所对照发展而来,以显示其自由、草根(Root)的特性。folks字源是德文,意思是人民、群众(people),而-sonomy则是由taxonomy一字演变而来,表示一种有系统、专门的学科知识。Folksonomy有多种译法,如分众分类、大众分类、社会分类、自由分类、民俗分类、通俗分类等。从资源组织角度来讲,Folksonomy是由大众所产生的一种分布式分类系统,通常由使用者个体与群体,将网络资源加上标记(如图像、影像、网址与文件),自由地随着社会情境来标记信息所创造出的分类结构[4]。Folksonomy是Web2.0环境下信息组织的一种新方法、新理念、新技术,被认为是下一代因特网的重要特征。
Folksonomy是共享内容管理系统的用户用于对其个人创建或发布的内容进行分组或分类以便于检索的一种方法,与传统信息组织理念和方法相比,Folksonomy特点突出体现为:(1)Folksonomy是一种技术,也是一种理念,所标注的对象包括书签以及一切基于网络或者说是以网络为传播手段的数字资源;(2)Folksonomy是一种基于因特网的信息检索方法,该方法以合作创建的、不受限制的标签为基础,并通过标签来归类网页、在线图片和网络链接等;(3)Folksonomy分类的原理是大众自发的用标签对网络信息标识和共享的过程,向大众提供一种协同构建与共享各自网络资源标签的开放平台,通过用户自己制定分类标准和提交资源标签来实现;(4)Folksonomy的分类是平面化的,没有等级层次的划分;(5)Folksonomy的作用不只是分类,还有搜寻和发现功能。
Folksonmy作为一种新兴的网络信息组织方式,其发展与图书情报领域密切相关,因为图书情报领域的核心知识之一即信息组织,Folksonomy的广泛应用,对于向来以分类与索引为核心任务的图书信息服务而言,其概念并不陌生,但网络信息量大且变动大,如何利用使用者信息来提升信息组织与检索效益,则是图书情报界所需关心与学习的[5]。Folksonmy应用最受瞩目的两个网站是收集个人相片图集的Flickr及收集网络好友书签的Del.icio.us,Flickr产生于2004年2月,主要目标为:帮助使用者分享自己的图像给其它人及提出新的组织图像方法;Del.icio.us产生于2003年9月,以分享群众的知识为目标,实现三种功能:(1)保存链结(如网页、Blogs、音乐等);(2)与好友分享书签;(3)藉由他人的书签、发掘到新信息。
1.3 Ontology内涵、特性及应用
Ontology是近年信息科学界最热门的词汇之一,国内一般将其译为本体或知识本体[6]。Ontology的概念最初起源于哲学领域,并在很长一段时期都是哲学研究的一个分支,哲学视阈的Ontology是对世界上客观存在事物的系统的描述,即存在论,也就是最形而上的知识。后来随着人工智能的发展,Ontology被人工智能界赋予了新的定义,人工智能领域认为Ontology是一种知识的人工引擎。20世纪90年代,信息科学的发展面临着种种新难题,Ontology作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛应用,如知识工程、数字图书馆、信息检索和Web上异构信息的处理、语义Web等[7]。信息科学中的Ontology定义为“Ontology是共享概念模型的明确的形式化规范说明”,该定义包含四层含义:概念模型(Conceptualization)、明确(Explicit)、形式化(Formal)和共享(Share)[8]。网络时代的来临,在对数字化信息资源组织时,需要一个多用途径、具弹性的表达工具以便能顺应智能型的信息表达和检索,由于Ontology具备可明确地详述语义和关系的计算机语言表达能力,因此网络社会下Ontology便被应用于更多领域。从知识组织的角度观察,Ontology的确比分类表与索引更适于Web环境下作知识的表达[9]。
由以上定义可以归纳出Ontology的核心与重点:术语或词汇、术语关系、概念化与形式化的规范说明,描述特定领域的知识,并能清楚的表达知识,使得知识能够不断地分享与再使用。
Ontology作为一种能在语义和知识层次上描述概念体系的有效工具,自上世纪90年代以来,也引起了图书情报学领域研究者的极大兴趣。基于Ontology的信息组织研究为信息组织在语义层面上打开了一个崭新的空间,它赋予了信息资源更准确、更完备的语义,使得计算机能够对信息资源更好地理解,进而实现信息服务的语义化和智能化。从Ontology的定义来看,Ontology与图书馆学中传统的信息组织方法有许多相似之处。传统分类法是以知识门类的层层划分、以代码为标识来揭示和组织信息的,比较全面和客观地反映了知识全貌及其内在的逻辑联系。Ontology是用于描述或表达某一领域知识的一组概念或术语,可用以组织知识库较高层次的知识抽象,也可用来描述特定领域的知识[10],其核心作用在于定义了某一领域、领域之间的一系列的概念和它们之间的关系。在这一系列概念的支持下,Ontology实现了领域知识的分类。Ontology与传统知识分类工具的一个根本区别就是系统的概念、特性、限制条件等都是计算机可读(理解)的。Ontology为现代分类方法提供了一种更严谨的概念体系,它是某一知识领域或应用领域的概念模型[11]。
2 分类相关概念间的关系辨析
2.1 Taxonomy与Folksonomy关系
Taxonomy指分类法,是由相关专家集体编撰的权威的知识体系,是信息构架中一个重要部分;Folksonomy则是指群众自发性定义的平面非等级标签分类。
Taxonomy强调放诸天下皆准的知识体系,不会因人、因地而有所不同;而Folksonomy则是由下而上所产生的信息架构,其内容与个人需求及社会文化情境息息相关。
Taxonomy以利他为基础;Folksonomy以利己角度出发。
Taxonomy等级式分类法便于按学科对信息进行汇集;Folksonomy供按照不同的属性(分面)查找资料,易于为大众使用和共享。
Taxonomy相信专家学者专业人士,花费大量财力、物力雇专人将内容进行分类;而Folksonomy则鼓励大众为了自己的需要用自己的语言标记内容,然后通过更多人的参与,进行人或tag的匹配,或者进行有效的搜索。
Taxonomy研制、维护成本较高;Folksonomy由庞大的使用者群集体创作,维护成本低。
2.2 Taxonomy与Ontology关系
Taxonomy与Ontology在文献中被关联的频率较高,Taxonomy在基本功能上和Ontology具有一致性,它们都是概念和概念关系的集合。一般认为,各种分类法也可以看作Ontology,因而Taxonomy本质上也是一种简单化的Ontology。Taxonomy和Ontology两者都针对某一特定领域的知识,都基于概念,以等级结构展示术语;Taxonomy和Ontology两者都要靠专家来制定,具有相对严格的规范,由少数专家所控制。
在体系结构方面,Taxonomy是单一树状体系,Ontology的体系则要庞大得多,使用多个Ontologies是相当普遍的,每个Ontology提供一个特殊领域的概念,一起使用则形成了一个丰富的沟通词汇;在词间关系方面,Ontology作为知识的主体,所关心的是描述一个工作或领域概念的知识分类以及定义知识的语意说明,Ontology的词间关系是各种知识组织工具中最为复杂和丰富的,包含了种属、上下等有可能出现的各种词间关系,并对各种词间关系都做了详细说明,而且其词间关系是网状的,既包括纵向关系也包括横向词间关系[12]。另外,Taxonomy分类表具有内容结构难以经常修订、语意简单、缺乏对所应用资源的专指性等不足,Ontology似乎更可作为知识表达的基础,避免重复的领域知识分析且由于统一的术语和概念可达成知识共享的目的。
2.3 Folksonomy与Ontology关系
Folksonomy是完全由普通用户在共享和协作的基础上对领域概念进行表达和描述,积累形成的,门槛极低,大众都可以用,算草根技术,而Ontology概念模型的明确、规范化说明,是一种领域概念建模工具,Ontology的构建是一项复杂的工程,需要在领域专家与系统开发人员的合作下完成。Folksonomy没有Ontology中对概念规范化的说明,更没有复杂的网状结构和丰富的语义关系。因此,同样作为一个知识体系,Ontology是形式化的、包含丰富语义,而Folksonomy则是非形式化的、包含稀疏语义。
在以往的思考和研究中,Folksonomy与Ontology经常被学者们联系起来。Folksonomy虽然是由普通用户在共享和协作的基础上对领域概念进行表达和描述而形成的,但并非绝对“自由”,并非没有体系,只是做标注(tagging)的人没有意识到自己的体系而已。Folksonomy的一个极端形式是Topic Maps(ISO13250),Topic Maps可以看成一种Ontology,因此对应于极端自由的Folksonomy,极端规范的、形式化的概念体系是Ontology[13]。实际上,Folksonomy的出现为知识共享和发现提供了一种新的方式,也为人工智能领域的研究者提供了一个新的角度理解Ontology,特别是为Ontology的构建提供了新的途径。Folksonomy对资源的组织有其自身的价值,通过Folksonomy构建Ontology,也许是Ontology工程中最实用的一种方式。已有研究[14]调用Wordnet的工具为相关性强的标签建立语义层次关系,帮助用户发现与自己兴趣相关的资源,利用这种方法,既可以充分发挥传统信息组织方法的优势,也可以利用当前Folksonomy这一新理念的优点。国内出现了融合Folksonomy与Ontology优点的网站——兜乐,兜乐是一款新颖的中文社会书签系统,除了书签的网络化管理、社会化共享的大众化功能外,兜乐的特色在于词汇服务,它是管理收藏夹的小助手,帮助归类网址、推荐文件夹、维护收藏夹,还能推荐可心的资源[15]。兜乐最主要的特色是把标签置于受控的概念之下,形成一个有等级的体系。
综上所述,本文对Taxonomy、Folksonomy及Ontology这些分类学的相关术语在其定义、内涵和概念差异上做了归纳梳理,它们既有区别也有联系,它们之间各有优劣,在不同的情况下应当有区别地对待使用,以更好地实现知识、资源的组织与管理。
收稿日期:2008-04-27