国外民间经济应用研究的前沿进展与热点分析_语义分析论文

国外Folksonomy应用研究的前沿进展及热点分析,本文主要内容关键词为:热点论文,进展论文,国外论文,Folksonomy论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

自2004年Vander Wal[1]提出分众分类法(Folksonomy)后,Folksonomy的相关理论与技术作为社会标记的重要方法和手段开始逐渐地受到国际学术界的广泛关注。Vander Wal明确提出Folksonomy是为用户共享信息(任何与URL有关的事物)和便捷检索进行自由标记的一种方法。Folksonomy是一个创造词,由社会性书签服务中最具特色的自定义标签(Tag)功能衍生而来。Folksonomy=Folks+Taxonomy,Folks在英文中是比较口语化的词,表示一群人、一伙人的含义;Taxonomy则是指分类法,是信息构建(Information Architecture)中一个重要组成部分。而Folksonomy是指“群众”自发性定义的平面非等级标签分类,称之为“分众分类”[2]。

本文对2003-2012年Elsevier Science电子期刊全文数据库中Folksonomy领域的发文进行统计,其研究呈逐年上升趋势,如图1所示。

图1 Folksonomy载文量统计

学术论文发表的时间分布在一定程度上反映了该研究领域学术研究的发展脉络,如表1所示。

由表1可见,2005年和2006年关于Folksonomy的研究论文仅有6篇,处于萌芽阶段,到2007年就达到17篇,是2006年的3.4倍,增长幅度较大。从2008年开始,国外关于Folksonomy的研究总体呈逐年稳步增长趋势。其研究的发展趋势基本符合普赖斯文献指数增长规律:当一个学科处于诞生与发展阶段,会引起许多不同的思想交流,正是由于学科内容的相互渗透、交叉,丰富了Folksonomy研究的内容,推动了Folksonomy的研究进展。根据“Pew Internet & American Life Project December 2006”调查显示,上网的美国人中28%开始使用标签。从网络公司Hitwise的数据可以看出,随着互联网用户信息意识的增强,像Flickr和Del.icio.us这样的标签网站越来越受网络用户的青睐。

笔者分别以Folksonomy、Social Tagging、Collaborative Tagging为检索词(国外Social Tagging等同于Folksonomy、Collaborative Tagging),通过Elsevier Science电子期刊全文数据库进行检索并进行人工去重,检索到相关文献352篇,剔除“Book”、“Reference work”涵盖的46条,共检索到相关文献306篇。306篇文献关键词及话题量统计如表2所示。

由此可见,迄今为止,国外有关Folksonomy的研究主要集中在4个领域:Ontology、Library2.0、Web语义检索、学科信息导航。本文将对上述4个领域的研究热点和发展前沿进行分析和阐述,以期对国内Folksonomy的应用研究起到借鉴作用。

2 Folksonomy在Ontology相关领域的应用研究

Folksonomy作为一种功能比较完善的Web2.0下的知识组织工具,对于网络知识系统的构建有其自身不可替代的价值,尤其是为本体的构建提供了新的思路和途径。

(1)Folksonomy是生成本体的潜在的知识来源。Chen等[3]结合认知心理学,提出以开放的目录工程(Open Directory Project,ODP)作为基准,利用由Folksonomy中得出的术语、概念关系生成本体,这是第一个利用Folksonomy发现本语、概念关系,并利用它们构造本体的方法。这种生成本体的方法符合人类的思维定式,具有一定的合理性。同理,将由Folksonomy中得出的类的属性和实例映射到已有本体中,能够起到丰富和补充已有本体的作用。

(2)基于Folksonomy的本体评价和维护。Solskinnsbakk[4]认为,可以利用Folksonomy评价本体的结构,这便于在早期阶段检测本体构建存在的问题,特别是节省手动的本体工程检索的成本。对此,提出了本体和Folksonomy的等级关系质量的评价方法,该方法基于构建浅层语义来表示本体和大众分类标签。

(3)Folksonomy与本体融合。Folksonomy和本体是Web 2.0环境下两种新兴的网页内容分类方法,虽然它们的角色很相似,但其知识构建维度存在一定差异。Fefie Dotsika认为,Folksonomy采用的是一种平面化的非等级的结构,是自底向上的非正式社会分类模式,缺乏准确性和可复用性;本体结构是一种以类层次结构为主的网状结构,采用自顶向下的正式分类模式,缺乏灵活性和可扩展性[5]。为了将二者融合,使其发挥各自所长,既有利于本体构建,又有助于Folksonomy的语义,信息科学领域学者们试图构建一种满足当前网络的知识系统,既具备社会网“收集知识”的特征,又具备语义网“知识表达和推理机制”的特征,具有很大潜力的混合系统——基于Ontology和Folksonomy的网络知识系统。2007年,Van Damme等[6]提出了FolksOntology,即分众分类和本体相融合的方法,研究如何充分利用由Folksonomy中抽取出的资源生成本体,如何使从Folksonomy中抽取出的所有资源能够被有效利用。具体而言,首先试图从辅助构建本体的社会标注系统中整合一切合理的数据和可调用的功能,包括标签清洗、根据已有本体对同义标签进行合并、过滤低频标签等;利用映射和匹配的方法整合本体和Folksonomy,如利用现有的词汇资源WordNet和已存在的本体创建映射;最后推动用户参与机制来验证提取术语、语义关系等。这种方法不是完全自动化的创建本体,而是一种结合人类集体智慧的半自动化方法。

Folksonomy在本体生成、本体评价和维护以及本体融合中,提供了一种构建本体的社会标注系统,不仅使本体构建由手工迈向自动化,而且使基于Folksonomy的标签本体(包括构建、改造、映射、合并等)也具有了形式化的特征。Folksonomy与本体融合既不以本体作为融合的受体,也不以Folksonomy作为融合的落点,而是把两者放在一个平等的层次上,充分发挥Ontology的语义优势和Folksonomy的构建、使用优势,利用两者去解决更高层次的相关问题[7]。

3 Folksonomy在Library2.0相关领域的应用研究

近年来,Library2.0成为国外Folksonomy应用研究中一个新的领域,2005年,Houghton[8]将Library2.0定义为在图书馆现有空间(虚拟空间和物理空间)的基础上,增加更多的互动、协作,以满足社会团体的需要。2008年,Parry[9]把Library2.0简单地理解为:在图书馆团体中用户有强烈的参与意识。Folksonomy强调“以用户为中心”,邀请用户参与到网络信息组织中,为自己感兴趣的信息添加标注,因而大量用户都有标引机会。国外图书馆界已经开始将Folksonomy应用于Library2.0的实践和理论探索,并呈现出良好的发展态势。美国密歇根州安阿伯地区图书馆(Ann Arbor District Library,AADL Library)、北卡罗来纳州立大学图书馆(Noah Carolina State University Library,NCSU Library)和新泽西理工学院图书馆(New Jersey Institute of Technology Library,NJIT Library)等都引入了对馆藏添加标签、评论、级别评价等功能,允许用户自定义标签,并根据用户标注结果形成标签云,帮助用户缩小检索范围,减少用户浏览和筛选时间[10]。为使用户能够准确地标注所要表达的内容,图书馆还以标签为导向,设立了标签推荐功能,既方便了用户标注,也在一定程度上建立了标签间的联系,增强了语义丰富度。Folksonomy凭借在揭示和组织网络信息方面的优势,应用到很多网站的知识构建中,如Del.icio.us、Flickr、Connotea、H20 Playlist、LibraryThing、豆瓣等[11]。

Library2.0是Web2.0在图书馆的应用[12],但更多地借鉴了Web2.0的理念,Library2.0从多个应用层面反映出Web2.0用户参与的典型方式,包括:博客、分众分类、社会化书签、社交网络等。

Folksonomy在Library2.O中的应用价值毋庸置疑,但如何更好地应用于Library2.0将是今后研究的一个重要问题。

4 Folksonomy在Web语义检索相关领域的应用研究

4.1 Folksonomy各要素之间的语义关系

Folksonomy使用户能够免费标注各种Web资源,以便分享和搜索。在Folksonomy中,标签作为信息检索的途径起到重要的引导作用。然而,由于标签之间缺少一致的语义关系,标签的相关性缺失导致数据稀疏,使得用户很难查找相关资源,影响了用户信息检索的效率。为解决这一问题,Uddin等[13]提出在Folksonomy中,建立标签之间的语义关系,不仅要考虑标签、资源、用户三者之间的关系,更要考虑三者之间的关联,为Web语义检索提供行之有效的方法。资源、用户、标签三者之间的关系如图2所示。

图2 资源、用户、标签关系

在网络环境中,沿着标签路径,用户和资源紧密相连[14]。一方面,通过相同的标签能够检索到拥有相关主题的资源;另一方面,当用户利用相同的标签索引,或者他们对相同的资源进行标引时,用户之间便建立了关联。从图2中可以看出,资源1和资源2、资源3和资源4都是通过标签2、标签4连接相关主题资源的。此外,资源是通过用户的共享建立关系。当用户描述内容时,也是各自分享资源的过程,例如用户1、用户2、用户3和文件2的关系。标签(Tag)是用户根据自己的喜好、特点为资源添加的记号,用于形象地反映资源的基本属性,代表用户的一种偏好,在此基础上实现资源的分类及共享,这是Folksonomy的具体表现形式。

Mathes[15]指出,标签是一种由用户产生的元数据,与特定的元数据不同,它具有很强的主观性。相同的标签被赋予不同的资源,表明用户使用的资源具有某种共性。标签通过自身的特性,把不同的资源进行归类,方便用户查找、使用。用户对相似资源使用相同标签,表明知识组织中存在着重合的部分。标签能帮助用户发现有共同特征的群体。同理,相互独立的标签也可以通过用户和资源产生联系。

4.2 Folksonomy在Web语义检索中的应用

用户根据关键词进行查询,依据查询结果判断检索主题,运用Folksonomy对检索主题进行分类,通过用户个性化分类库查找所需资源。在判断检索主题时,需要进行检索匹配,以获取网络数据库中的资源,其中用户个性化分类库的资源都是在网络数据库的基础上经分类、标注和筛选的[16],如图3所示。

图3 基于Folksonomy的检索

用户利用Folksonomy对资源添加标签,系统通过标签与本体的映射进行标签推荐,扩充标签的语义;检索时用户输入关键词,系统通过与本体映射判断检索主题;语义检索系统处理关键词与资源的语义推理匹配,实现语义检索;最后将检索结果返回给用户。

4.3 Folksonomy在Web语义检索中的优势

作为Web2.0时代信息检索的途径,Folksonomy的信息检索性能高于其他途径。国外学者Morrison[17]以社会化书签网站中的Folksonomy、搜索引擎和主题目录为对象,通过实证研究比较三者信息检索的性能。3/4的不同信息需求的参与者共生成103条查询结果,其中运用Folksonomy搜索的结果和其他系统的搜索结果有重叠,而且利用搜索引擎和Folksonomy搜索的资源在相关度上远远高于单一的信息检索系统的检索结果。最突出的优势在于,Folksonomy查全率和查准率高,以某一个“类别”标签对检索结果进行约束,按照用户所期望的类别内容输出,精确反映用户信息检索需求[18]。在查询处理上做进一步规范和完善,有助于提高Folksonomy在Web语义检索中的性能。

5 Folksonomy在学科信息导航服务相关领域的应用研究

学科信息导航作为学科领域获取资源的重要途径,是图书馆虚拟馆藏建设的重要内容。图书馆将Folksonomy应用于学科信息导航的信息组织和服务工作中,通过清晰明了的学科分众分类,有助于节省用户检索时间,提升学科信息导航服务的实用性和科学性。

随着Web2.0时代的到来,Folksonomy的出现方便了万维网上数字信息资源的管理。Folksonomy已日益成为一个可供知识寻求者选择的分类资源和学科信息导航资源。传统意义上,专业系统中分类法一直履行这些角色。然而传统分类法中,分类学家或者专业的学者制定的有关领域的分类结构常常不能反映用户的个性化需求[19]。此外,一方面知识更新的速度快,导致分类法的款目过时得非常快,在一定程度上影响了知识分类和信息导航的效率和效果;另一方面分类法的维护很浪费时间和精力。为了解决上述问题,国外学者Kiu等[20]提出分类和分众分类的融合算法,即TaxoFolk,整合成分众分类法分类,以加强知识的分类和学科信息导航。TaxoFolk算法包括数据挖掘技术,即形式概念分析(FCA)、ID3分类和简单匹配系数(SMC)。三种不同的分类域和Folksonomy用于识别和评估阈值不常见的标签和过滤无效的标记值到自动化的TaxoFolk中,以此来整合过滤的标签和预定义的分类法,增强知识的导航,并通过实验分析确定了最适合TaxFolk结构构建的阈值[21]。

目前,国外学者开始将Folksonomy置于图书馆学科信息导航领域进行研究,如Russell[22]提出,通过上下文权威标注方法,利用用户在标签社区中使用标签的权威度,可以发现和定义认知权威性,查找出某一领域的权威专家及发现专业人士经常涉足的领域知识。Chi-Ling等设想将Folksonomy应用到图书馆信息服务中,但目前仍停留在理论层面上,具体实践还有待深化[23]。

5.1 秉承Folksonomy开放性的理念

Folksonomy是一种自下而上的、具有开放性的模式[24]。图书馆应充分认识到用户参与信息资源建设的必要性,并尽可能创造实现的条件。网络信息极其丰富,少数人的力量难以进行全面的判断、收集、整理,并且网络上拥有大量的隐蔽网络资源,与可见资源相比,隐蔽网络资源无法通过普通搜索引擎获取,但其内容更丰富、专业性更强、更具有学术价值,信息开发者需要利用多种渠道进行收集。教学科研人员和各类信息用户,既是信息的利用者,也是信息的挖掘者和发现者,学科资源建设者应转变观念,积极寻求学科专家的合作,鼓励科研人员和各类用户根据网站确立的标准推荐新资源和权威资源,并对其体验过的信息渠道进行客观、公正的评价,对各种信息从学科专家的角度予以分类,以利于今后的检索和同行间的信息交流。

5.2 提供个性化服务功能

Cress等[25]提出,通过建立标签云,可以捕获社区的集体智慧。标签云在一定程度上能客观地反映标签的协同过滤结果。标引频率高的标签通常字体、颜色较突出,以示区别。系统根据用户的标签统计,掌握学科信息导航中资源的访问量及访问的频率,能及时把握用户的兴趣点,从而开展个性化推荐等服务。推荐系统的功能是针对每个用户的偏好,智能地从海量待推荐资源中筛选出少量推荐资源提供给用户。推荐系统往往是根据用户的信息浏览历史、评价和检索等日常信息,通过智能推荐算法,预测用户的偏好和需求,从而向用户精准地推荐信息。可将用户共同需要和感兴趣的信息分类在门户网站上进行发布,以便于用户查找和集中浏览。

5.3 采用协同过滤机制

通过对大量标签的聚类和内容分析,可以划分用户群体、资源群体,从而实现协同过滤。由于网络的开放性和无组织性,导致网络信息增长迅速,良莠不齐,信息污染严重。在学科信息导航服务中,用户挑选自己喜爱的网站,用标签标注后组合在一起,无形中成为网络资源的过滤者。用户通过Folksonomy中的某一标签进行搜索,可以看到其他用户在这一标签下的资源列表,这些用户有的是某一特定主题领域的专家或该领域的关注者,他们拥有很好的资源鉴别能力,协同过滤机制如图4所示。

图4 协同过滤机制

Folksonomy为图书馆学科信息导航服务提供了一个新模式和新思路,即在较低成本的情况下,通过互联网和相关的技术把大批的学科信息资源建设者与用户以自愿的方式聚集在一起进行合作。尽管这种方式还处于形成和发展过程中,目前还不能完全认识与预测其最终的应用前景,但这种新的学科信息资源建设与服务模式蕴涵着全新的价值和巨大的能量,将对传统信息建设与服务产生深远的影响[26]。

但目前Folksonomy应用于学科信息导航还存在一些问题,如词汇之间缺乏层次性,用户的分众分类标注缺乏同义词的归类标准,用户参与度低等,这些问题在今后实际应用中还有待深入探索和解决。

6 结语

通过对国外Folksonomy在Ontology、Library2.0、Web语义检索、学科信息导航4个主要领域应用研究进行归纳和梳理,得出以下结论:

(1)在Ontology研究领域

以Tag为基础的Folksonomy凭借其开放自由、非等级、以用户为中心的优势,被广泛地应用到本体融合、本体评价、本体映射等方面。特别是将标签本体引入社交网络,不仅使Folksonomy资源得到了充分利用,还开辟了“Folksonomy与Ontology融合研究的新途径”[27]。从“Folksonomy”到“Folksonomy与Ontology融合”,促使网络资源沿着“信息→信息分类→信息整合”不断向前递进,从无序到有序不断深入。同时,“Folksonomy与Ontology融合”也使实现真正意义上的信息有序化、信息充分利用成为可能,有助于突破网络信息组织研究领域的瓶颈。

(2)在Library2.0研究领域

Folksonomy改变了传统网络信息资源的组织方式,变革了图书馆的各项服务内容。用户可以根据个人兴趣爱好,为资源添加标签,以方便个人检索,极大地提高了检索效率和查全率。Folksonomy将用户参与的理念化为现实,Library2.0在满足信息需求的同时也满足了用户交流的需求。

(3)在Web语义检索研究领域

Folksonomy不但适用于特定领域的检索,也可以用于不限定领域的检索任务,还能够利用用户的个性化信息进行检索,优化检索结果。

(4)在学科信息导航服务研究领域

利用Folksonomy在协同过滤机制中的应用,根据标签分类对学科信息导航的指引作用[28],针对用户关注的资源、热点及学科,Folksonomy发挥自身特点,促进学科网络信息资源的建设、开发、利用。

事实上,Folksonomy在以上4个领域的应用并非绝对孤立,而是相互交叉、相互融通的。Folksonomy与本体的融合,实现了本体的形式化、结构化、语义丰富、语义准确等,解决了Folksonomy存在的非形式化、非结构化、语义稀疏、语义模糊等问题。在Library2.0中引入标签本体,可以大大地增强书目检索和标注的规范性。Web语义检索是从已有的资源中查找所需的资源,这部分资源恰好来自Library2.0中用户根据兴趣爱好标注的内容或者检索目录中自动生成的内容。Web语义检索结果有助于学科信息的分类,完善学科信息导航。

通过对2003-2012年国外Folksonomy相关研究成果的分析,可以看出,Ontology、Library2.0、Web语义检索、学科信息导航一直是Web2.0时代的主要议题和研究热点。关于本体的研究不再是孤立的建模,而是与具体领域结合,研究范围更加广阔。Library2.0在传统网络资源的基础上,注重用户协作,借助Folksonomy创建Web语义检索,但Web语义检索中仍存在检索准确率不高、检索效果有待优化等问题,对于Web语义检索的分析加工将成为未来研究中更为重要的热点方向之一;剖析Folksonomy与Ontology间的异同,将两者恰到好处地融合,增强分众分类语义,有待深入研究;Folksonomy在学科信息导航中的应用,由于检索平台和软件系统各不相同,分众分类缺少规范化的标准,使得资源整合困难,检索结果不全面,这将成为后续工作中重点研究、解决的问题;利用本体实现大众标注系统间的语义检索,通过限定标签的语义范围实现跨系统间的语义检索,成为未来研究的主要趋势。

随着Folksonomy应用研究的不断深入,理论的不断完善,其发展前沿和研究热点也会有所改变。尤其互联网更新速度快,各种技术的应用都会顺应计算机时代发展的潮流而演变和完善。在今后的研究中,仍然需要不断地跟踪和把握国际学术界的发展前沿和研究热点,以期为国内相关领域的研究提供借鉴[29]。

收稿日期:2013-05-09

收修改稿日期:2013-07-11

标签:;  ;  ;  

国外民间经济应用研究的前沿进展与热点分析_语义分析论文
下载Doc文档

猜你喜欢