基于民间分类学与本体融合的开放访问用户服务体系结构研究_开放存取论文

开放存取用户服务体系框架研究——基于Folksonomy与本体融合的视域,本文主要内容关键词为:视域论文,本体论文,服务体系论文,框架论文,用户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 研究背景与相关工作

进入21世纪以来,随着计算机网络在人们学习、工作、生活中应用的不断拓展和深化,开放存取(Open Access)作为互联网时代数字图书馆知识获取与共享的重要途径异军突起。从2002年《布达佩斯开放存取先导计划》(Budapest Open Access Initiative,BOAI)[1]发布以来,全球性的开放存取运动至今已走过10年的历程。10年中图书情报学界对开放存取相关问题的研究热情持续高涨,部分组织与机构的开放存取资源建设也初见成效。然而,从数字图书馆“三代范式”的演进可以看出,随着资源建设的不断完善,用户服务将逐渐成为开放存取下一阶段的主要研究内容和发展方向。

尽管开放存取概念的提出原本就是基于为用户提供更好的知识服务的思想,但是早期开放存取方面的研究成果却多集中于“从模式探索到资源建设”的研究路径。这一时期,研究者们对开放存取仓储与期刊[2-3]、预印本与自存档[4-5]、金色路径与绿色路径[6-7]等问题在学术界展开了充分的讨论。当然,开放存取独特的发展模式蕴含着不同于传统文献资源的独有的资源特色,由此导致的围绕开放存取资源的质量分析[8-9]、引用分析[10-12]等问题的研究也纷纷涌现。近年来,随着开放存取相关研究的不断深入,研究的方向也在“从资源建设到用户服务”发生着悄然转向,关于开放存取用户服务的相关研究成果陆续展露。2007年,英国学者Nicholas[13]等人基于用户对开放存取资源使用的数据和开放存取期刊的用户使用情况进行了研究,通过对用户身份、引荐链接、组织关系、地理位置等用户特征的分析,发现开放存取资源面向搜索引擎的开放能够极大地提高用户对资源的利用效率。次年,在多伦多召开的第12届电子出版国际会议上,芬兰学者Hedlund[14]针对开放存取中用户的预期和态度问题,基于社会组织理论和数字化交流实践,在整合了组织理论、信息科学、信息系统等领域知识的基础上,提出了“用户接受和用户行为”(User Acceptance and User Behavior)模型。其后,关于开放存取资源用户界面的相关研究也陆续展开。Vrana[15]基于开放存取期刊、预印本、技术报告等不同资源的内容多样性与质量差异性,提出用户界面是成功使用开放存取资源的关键之一,并通过对排名前20位的开放存取资源库的研究提出,大型资源库的界面往往能够帮助用户的日常访问,并就此建议应该通过改善用户界面吸引用户更多更有效地利用开放存取资源。Mojtahedi[16]则在2012年进一步指出,支持快速访问原文的友好用户界面不但能够鼓励用户踊跃提交自己的原创作品,并且可以提高开放存取期刊的影响因子。

国内学术界专门针对开放存取用户相关问题的研究相对较少,仅有的部分文献从特定用户对开放存取的认同态度[17-18]及影响因素[19-20]等视角展开研究。而由于开放存取资源具有更新速度快、缺少统一的审稿标准、不受受控词表约束等特征,使得面向开放存取用户服务的针对性研究鲜有问津。鉴于此,本文在对基于本体的用户服务理念和基于Folksonomy的用户服务思想进行对比分析的基础上,采用本体与Folksonomy融合的视域,尝试构建了开放存取用户服务体系框架模型,并对框架模型的主要核心环节进行了阐述。最后从语义性、动态性、多样性三个方面对基于本体与Folksonomy融合的开放存取用户服务体系框架进行了讨论。

2 本体与Folksonomy对用户服务的支持及各自的瓶颈

近年来,无论是搜索引擎还是分面目录,对用户依托网络获取信息行为的服务与支持在本质上已经摆脱了早期基于字符串匹配或层级分类的原初模式。通过对近年出版的文献成果的梳理可以知道,关于用户服务的研究主要集中在本体和Folksonomy两个方面。

2.1 本体对用户服务的支持与瓶颈

本体(Ontology)被引入信息科学领域是从20世纪80年代开始的,最初在信息科学领域中本体的相关研究主要集中于客观知识的共享与复用。近年来,随着本体在数字图书馆领域中的相关研究不断深入,基于本体构建用户模型[21]逐渐成为用户服务研究的主流。

本体对于用户服务的支持主要体现在语义描述与推理层面。早期基于关键词的用户模型缺少语义支持,概念间关系相对松散独立,主要借助字符串匹配的方式实现用户服务。基于本体的用户服务能够通过概念、属性、关联、公理等元素为用户知识需求赋予语义信息,从而形成更具个性化特征的用户本体。随着本体工程领域的研究成果不断丰富,用户本体的构建在技术上已经得以解决。同时,最近关于跨本体映射[22]。的研究成果表明,在个性化用户本体与领域知识本体之间建立跨越异质本体的语义映射关系,也已经在实验室条件下实现。由此,用户的知识需求可以通过用户本体带着语义信息被投射到领域知识本体上,不但能够更好地满足用户知识需求还能够基于本体推理实现知识推送。

然而,基于本体的用户服务也面临着一些瓶颈,其中一个较大的问题就是用户兴趣更新对本体的影响。由于本体构建的初衷包含着知识的共享与复用,因此生成的本体必然要具有相对的稳定性。同时,完全自动化的本体构建尚处于研究阶段,因此对于半自动化的本体构建而言,无论是基于Web挖掘或是词频统计的方法,都是一件比较繁重的工作。而另一方面,用户的需求不会是一成不变的,因此要求用户本体必须处于动态更新状态。特别是在开放存取资源中往往不会严格使用传统的受控词表,这不但增加了用户本体构建的难度,同时也使得基于本体的用户服务体系在面对互联网上的海量用户时,其现有的本体构建思想难以应对用户兴趣更新和需求变化的实际问题。如何兼顾用户本体的稳定性与动态性,成为制约基于本体的用户服务的瓶颈。

2.2 Folksonomy对用户服务的支持与瓶颈

Folksonomy诞生至今尚不足10年,目前在国内学术界还没有一个权威的汉译,本文倾向于“社群分类法”[23]这一译法。尽管Folksonomy远不如本体严谨,但是凭借其对用户兴趣的体现和对社群意识的反映,迅速地风靡了整个互联网。特别是对于部分省略了严苛的审稿机制和受控词表约束的开放存取资源而言,Folksonomy似乎更加适合。Connotea、CiteULike、BibSonomy、LibraryThing等一些著名的开放存取资源网站纷纷采用这一模式为用户提供服务。

由于Folksonomy采用了用户标注资源的方式,在用户需求与知识资源之间建立了天然的纽带,因此其标签能够直接反映用户对知识的需求偏好。同时,基于统计学的标签“上浮”原理使得其标签云能够体现社群的群体意识,并且会随时间的推移而实时更新。因此,从用户服务的角度看,针对开放存取资源使用Folksonomy知识组织模式提供用户服务,具有其他模式所不具备的优势。特别是近年来,关于Folksonomy层级体系构建[24]以及垃圾标签过滤[25]的研究,在很大程度上解决了Folksonomy不支持层级检索的弱点且提高了基于用户标签进行检索的效果,从而使得这一模式更加趋于完善。

当然,Folksonomy也并非是没有瑕疵的。Folksono-my基于用户标注行为产生的用户标签在语义清晰度、词汇可控性等方面明显弱于本体或叙词表等由权威专家制定的知识组织体系。因此,一些学者开始着手将Folksonomy与本体进行结合,构建标签本体[26]。但是这部分研究多是单方面地利用领域知识本体对用户使用的标签加以限定,试图通过规范的选词来约束用户的标注行为。尽管这样做的结果能够使得Folksonomy更加严谨,但同时也扼杀了用户的创造性与积极性。如果用户标签失去了生命力,那么Folksonomy这朵植根于用户需求与知识资源之间的奇葩也就会随之凋谢了。因此,基于Folksonomy的用户服务也在一定程度上陷入了一种两难的境地。

3 基于Folksonomy与本体融合的开放存取用户服务体系框架

通过上文的对比分析可以看出,在用户服务领域,特别是在开放存取的用户服务领域,基于本体与基于Folksonomy的两种思想各具利弊。如果说基于本体的用户服务理念侧重于从本体论的角度描述和揭示知识的内在结构与关系,那么基于Folksonomy的用户服务思想则从认识论的层面诠释出用户认知与知识概念的关联关系。由此,课题组在前期研究成果的基础上,综合当前开放存取、本体工程以及Folksonomy领域的国内外研究成果,基于本体与Folksonomy融合的视域,充分发挥二者各自的优越性,尝试构建开放存取用户服务体系框架。

笔者认为,基于本体与Folksonomy融合的开放存取用户服务体系框架应该包括以下6个核心环节:(1)具备一个较为规范的多本体协同系统;(2)建立系统内各个领域本体之间的映射关系;(3)选择一种适合的将标签云投射到领域知识本体的方法;(4)建立一套本体及其映射关系更新与改进的运行机制;(5)提供一种基于领域知识本体的用户标引辅助环境;(6)构建一个与本体和用户标签互联的用户导航界面。

在以往的研究中,凡是基于本体的用户服务多是通过构建一个庞大的领域本体来满足用户的需求。这样做一则耗时费力,二则越是庞大滞重的本体在面对用户兴趣更新时越会牵一发而动全身,与模块化系统设计思想相悖。此处环节(1)中采用多本体协同系统取代单一本体,系统中包含若干小型的领域本体。其优势在于本体的更新可以在某一小型本体局部环境内完成,不涉及其他小型本体,从而在满足用户兴趣变化的同时提高了本体更新的工作效率。这一环节的工作可以直接选用成熟的小规模开源本体,充分体现本体的共享与复用,因为本体规模越小被复用的可能性就越大。环节(2)的目的在于将多本体协同系统中原本相互独立的各个小型领域本体通过本体映射建立起本体联盟,进而在联盟内部的各个小型本体间实现原本在单一本体内进行的本体操作。在课题组的前期研究中,已经基于形式概念分析(Formal Concept Analysis,FCA)[27]的思想将领域本体解析成相应的概念格,进而通过“对象-属性相似度(Object-Attribute Similarity,OAS)”[22]法建立起跨异构本体的“本体→概念格→映射←概念格←本体”映射模型。以往涉及Folksonomy和本体的研究中,总是试图通过用户标签构建用户本体,这使得一些研究总是处于循环往复的本体构建阶段,本体复用性低。环节(3)则提出将标签云“直接投射”到领域本体,而不是重新创建本体。当然这种所谓的“直接投射”只是相对于以往构建用户本体的方法而言,事实上将标签云投射到领域本体还需要将体现社群用户主观意识的标签进行形式化处理,而目前最理想的工具还是形式概念分析(FCA),毕竟通过形式概念分析(FCA)可以实现用户标签的形式化、层级化与关联化。关于这部分的研究,课题组在前期研究中已经基于形式概念分析(FCA)动态构建了标签云的“形式层级”[24],为从“标签(三元组)到本体(五元组)”的用户兴趣的形式化和语义化提供了可行路径。环节(4)中与以往研究不同的是,不但根据标签云变迁(用户兴趣变化)对相应的领域本体进行更新,还需要基于环节(2)中的方法修改本体间的映射关系。此处需要明确的是,本体的更新不仅仅是新概念的产生,更主要的在于概念间关系的迁移。至于环节(5),本文不建议采用以往文献中具有强制性的约束机制,因为一旦基于本体强制约束用户的标注行为,就意味着仅仅是标签云会被更新,而用户标签将不再更新,循规蹈矩的用户标注行为只能使Folksonomy走向死亡。由于环节(3)与环节(4)在将用户兴趣形式化的同时,也为反映用户兴趣变迁提供了保障,因此在环节(5)中只是将本体用于非强制性的辅助用户标引。最后的环节(6)是基于上述环节(1)~(5)的后台运行结果为用户提供的知识导航界面,其作用相当于窥探知识宝库的一个窗口,随着用户兴趣的变迁,从该窗口中窥得的知识资源也不尽相同。其整体框架如图1所示。

4 关于开放存取用户服务体系框架的讨论

互联网环境下的开放存取在运作模式、资源特征等方面都与一般的数字图书馆有着很大的不同,正是因为如此,使得开放存取在用户服务方面也必然与一般的数字图书馆存在着较大的差异。本文将着重从语义性、动态性和多样性三个方面进行探讨。

首先,开放存取用户服务体系必须是一个富含语义性的框架体系。开放存取资源大都放弃了严谨的受控词表的制约,转而采用作者提供的关键词或由用户附加的标注。由此导致关键词和用户标签在使用中存在很大的自由度,其语义信息相对模糊且存在歧义性,难以满足用户的检索需求。因此,从语义层面而言,当前主流的思想就是采用基于本体的用户服务理念,借助领域本体富含的语义信息,锚定用户所需的知识资源。而近年来国际学术界本体工程领域的研究成果表明,庞大迟滞的单一本体正逐渐被基于本体映射的多本体协同系统所取代[28],特别是针对开放存取宽泛的领域视野而言,更是难以建立涵盖全部知识概念的单一本体。因此,开放存取用户服务体系在借助领域本体增强其语义性的同时,构筑多本体协同系统(本体库)是解决这一问题的有效途径。

其次,开放存取用户服务体系必须是一个颇具动态性的框架体系。开放存取以整个互联网用户(区别于一般数字图书馆的授权用户)为受众,用户知识需求多样、变化频繁。同时,知识组织体系的相关研究成果表明,“线形→树形→盒状→链式→网状”[29]的知识组织体系演进路径是一个不断“柔化”的过程,任何一成不变的、僵化的形式都难以适应互联网环境下用户需求变迁的需要。解决这一问题的一个可行方案就是Folksonomy模式,由于其标签直接来自于用户本身,并且基于统计学原理生成标签云,使其成为当下最能反映用户兴趣和社群意识的理想模式。根据Folksonomy中的用户标签(包括标签云和关联标签)改进和更新领域本体,在保障了开放存取用户服务体系的语义性的同时,满足了海量用户不断变化的知识诉求。并且在节省了大规模数据挖掘所消耗资源的情况下,使得开放存取用户服务体系处于一个持续的动态更新状态。

最后,开放存取用户服务体系必须是一个兼具多样性的框架体系。开放存取资源包括研究论文、技术报告、会议综述、演示文档等诸多类型;开放存取的用户则包括学生、教师、科研人员、各类专业人士,甚至普通网民等。这其中不同的用户往往会选择不同的途径获取知识资源,包括搜索引擎、新闻组、RBS、RSS、Blog等。如此纷繁复杂的资源、用户、途径混杂在一起,任何单一的方式方法都难以提供一种适合的用户服务。因此,只有通过本体与Folksonomy融合的方式,兼顾本体论与认识论的思想,为开放存取构建一个富含语义信息、知识关联信息、用户认知信息等综合信息空间的服务体系框架,才能保障对富资源、众用户、多途径的网络环境下的开放存取的用户服务的支持。

5 结语

对开放存取用户服务体系框架的研究,只是开放存取用户服务相关研究的初步探索。互联网环境下开放存取用户服务所面对的实际情况往往要比理论条件下的环境更加复杂多变,更大规模的实证性的相关研究还有待在未来的工作中继续努力。

标签:;  ;  ;  

基于民间分类学与本体融合的开放访问用户服务体系结构研究_开放存取论文
下载Doc文档

猜你喜欢