社会信息检索研究综述_社会网络理论论文

社会化信息搜寻研究综述,本文主要内容关键词为:信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       从理论的高度理解、认识用户的信息搜寻行为可以有效推动信息系统的完善与发展,而信息系统的演化与发展又会引起用户信息搜寻行为的变化,需要对新环境下的用户信息搜寻行为进行重新认识。因此,用户信息搜寻行为一直是情报学领域关注和研究的热点之一。

       近年来,随着互联网技术的迅猛发展,社交平台、社会化媒体、社会化标注系统等新兴的网络平台不断涌现,互联网的应用模式逐渐从传统的“人—机”交互模式转变为“社会化”交互模式。人们借助这些社会化信息系统进行交互,享受交友、通信、协作、共享和发布内容等多种服务,社会化信息系统对用户的信息搜寻行为产生显著影响,用户通过社会化信息搜寻方式满足信息需求的行为变得越来越普遍,社会化信息搜寻开始引起学术界的关注。社会化信息搜寻不是社会化与信息搜寻的简单叠加。实现社会化信息搜寻必然要改变信息搜寻的模式和策略,传统的信息搜寻理论与方法必然会有所继承与发展。作为一种新的信息获取模式,它将面临诸多急需解决的新问题。

       1 社会化信息搜寻研究现状

       1.1 基础理论层面

       社会化信息搜寻这一概念是互联网应用发展到一定阶段的产物,是社会化与信息搜寻的有机结合。建立社会化信息搜寻方面的基础理论是学者们急需解决的问题。目前社会化信息搜寻基础理论层面的研究成果主要涉及概念辨析、影响因素分析、模型构建等方面。

       1)社会化信息搜寻的定义。英国情报学家Wilson将信息搜寻行为定义为“个体为了满足一定的目标需求而进行的查寻信息的活动”[1]。作为新近发展起来的信息搜寻模式,人们对社会化信息搜寻的认识还处于探索阶段,还没有给出一个被普遍认可的定义,现有的多个定义从不同的角度透视社会化信息搜寻的本质,均有一定的合理性,但是在内涵和外延方面存在明显的差异。

       广义的社会化信息搜寻被定义为包含社会交互的信息搜寻。例如,Evans(2010)认为任何包含社会交互的信息搜寻都是社会化信息搜寻,社会交互与协作的目的是为了促进信息搜寻和意义建构[2];Croft(2010)认为社会化信息搜寻是指存在互动行为的信息搜索,不论这些互动行为是显性或是隐含,同步或是异步,本地或是远程[3]。传统的信息搜寻重点关注基于信息检索平台的人机交互,广义的社会化信息搜寻则强调信息搜寻过程中社会化交互的重要性。Chi(2009)所指的社会化信息搜寻外延更广,将利用社会化资源的信息搜寻也纳入这一范畴[4]。

       狭义的社会化信息搜寻也称社会化搜索(Social Search),其概念出现于2004年前后。随着社会化信息系统的逐渐普及,人们开始借助这类系统获取最新、最准的信息,对信息的筛选与判断不再仅仅依赖于主题,有时也会参照在线社会网络中好友的意见和情感。在这种背景下,社会化搜索应运而生。起初社会化搜索被定位于利用社会网络平台找人[5],目前一般认为社会化搜索是指利用在线社会网络、社会化媒体、社会化标注系统等社会化信息系统,将搜索引擎技术与用户的社会关系图(Social Graph)结合起来,以达到提高搜索质量与相关度的目的[6-7]。狭义的社会化信息搜寻更多地强调信息搜寻技术,是适应信息搜寻新需求的产物。

       在英文文献中,一般使用“Social Information Seeking”表示社会化信息搜寻,侧重从用户的角度透视通过社会化交互方式获取信息的行为,使用“Social Search”表示社会化搜索,侧重从系统角度研究改善信息搜索效果的算法或技术。部分学者使用“Social Search”术语描述用户的社会化信息搜寻行为,如Evans、Chi等人。另外,社会化信息搜寻不同于协作式信息检索(Collaborative Information Retrieval),后者是指在信息检索代理之间通过共享和交流信息等方式进行协作,共同完成信息检索,而不是人与人之间的合作搜寻。

       2)社会化信息搜寻的相关模型。建立社会化信息搜寻的相关模型有助于认识社会化信息搜寻的本质与规律,但是这方面的成果不多。

       2002年,Ramirez等探讨在以计算机为媒介的交流系统中用户搜寻社会化信息的策略以及影响用户进行策略选择的因素,并把这些因素纳入一个社会化信息搜寻的概念模型之中[8]。该模型描述了行为影响因素、行为、行为结果之间的相互关系。模型将社会化信息搜寻行为的影响因素分为5类,即:技术相关的因素,包括技术功效;信息相关的因素,包括数量、质量;目标相关的因素,包括目标类型、持续时间;情境相关的因素,包括时间、可用性目标(Target Availability);交流者相关的因素,包括历史或背景、偏好、技能等。模型将用户社会化信息搜寻行为限定为信息搜寻策略选择行为,其中策略类型被细分4种,即互动型、主动型、提取(Extractive)型、被动型,单个或多个策略被细分为两种,即顺序型、同时型。模型将社会化信息搜寻的结果分为3类,即:反馈,包括信息数量的反馈、信息质量的反馈;体验,包括策略制定的努力程度(Effort of Enacting)、策略的效率或效益;评估,包括获取信息与信息需求的匹配程度、信息不确定性的程度。

       2006年,Kirsch等将社交网络纳入信息检索的领域模型,模型如图1所示[9]。该模型强调社交网络中其他成员感兴趣的或者生成的内容对检索结果的参考价值,比较概括,可操作性不强。

      

       图1 Kitsch的社会化信息检索领域模型

       2010年,Evans等整合意义建构和信息搜寻行为方面的模型,给出一个规范性社会化模型(Canonical Social Model)[2],用于描述搜索任务之前、期间、之后3个阶段的用户活动。该模型提示个体搜索者在搜索过程中何处的显性和隐性共享信息可能有价值,对研究新的社会信息搜寻技术具有一定的指导意义。

       1.2 检索技术层面

       信息检索涉及3个方面,即信息资源、用户需求以及信息资源与用户需求的匹配,对这3个方面的社会化改造形成社会化信息检索。也就是说,信息检索工具如果在内容来源、资源标注、需求表达或相关性判断与结果排序等方面体现了社会性,那么它就是社会化信息检索工具。利用社会化信息检索工具进行信息搜寻的行为也是社会化信息搜寻行为。目前检索技术层面的社会化信息搜寻研究主要涉及利用社会化信息的用户配置文件(Profile)修正技术、查询扩展技术、检索结果排序技术等方面。

       1)基于社会化标注的信息搜寻技术。标注(Tagging)是指用户对互联网上的内容以关键词或标签的形式进行标记和分类的过程,其标注产生的信息有利于互联网信息资源的组织、过滤及搜寻。

       标签数量在一定程度上反映了一个页面的流行程度。部分学者利用这一特性优化检索结果排序算法。例如,Bao等(2007)构建Social Sim Rank算法计算标注信息与Web查询之间的相似度,用于寻找标签之间的潜在语义关系,构建Social Page Rank算法,基于社会化标注信息估计Web页面的流行程度,从用户的角度来描述页面的质量,衡量页面的静态排名[10]。Jiang等(2012)定义用户标签反馈分值这一概念,并以该概念为基础设计一个基于标签反馈的网页排序算法[11]。

       标注信息体现了标签创建者的兴趣偏好。部分学者利用这一特性完善用户配置文件,进而达到优化个性化信息检索系统的目的。例如,Wang等(2010)尝试从社会化书签系统、博客等社会化信息系统中提取用户兴趣,为每个用户建立并维护用户配置文件,用向量的形式表示用户兴趣,向量的每个元素对应一个词以及用户对该词的兴趣度,检索系统基于页面与用户兴趣向量的匹配程度计算页面的兴趣度值[12]。Zhou等(2012)提出一种基于用户配置文件的个性化查询扩展迭代算法[13],该算法所用的用户配置文件由网页搜索系统通过挖掘用户标注过的资源以及用户对资源的注释信息(社会化资源)而生成。

       利用标签信息构建起来的资源关系网络具有小世界现象,部分学者利用这一特性构建有效的资源发现算法。例如,Amitay等(2009)利用社会化书签系统包含的文档、人员和标签之间的关系信息,结合微博平台包含的用户社会关系网络信息,提出一种基于面搜索(Faceted Search)的方法,即返回每一个搜索的所有相关项目,包括文档、人员和标签等,并允许所有的项目都被用来作为搜索项[14]。Benna等(2012)提出一种基于协作式社会化标注的社会网络构建方法,网络节点是用户、标签作者簇、文档,边是用户与用户、用户与标签作者簇、标签作者簇与文档之间的链接,然后提出利用该关系网络进行查询扩展、资源发现、资源排序的方法[15]。Rawashdeh等(2011)利用社会化标签,提出一种可以提高检索的准确度与覆盖范围的个性化搜索方法[16]。该方法首先确定资源之间和标签之间的相似性,其次建立用户—标签关系模型和标签—资源关系模型,检索系统根据特定用户给定的查询,将标签无缝地映射到资源,从而帮助用户找到最有吸引力的媒体内容。

       2)基于社会化媒体的信息搜寻技术。社会化媒体是指允许人们撰写、分享、评价、讨论、相互沟通的网站,也被称为社交媒体。通过社会化媒体形成的反映人与人之间社会关系的网络被称为在线社交网络,或在线社会网络。

       部分学者利用社交网络的结构特征设计搜索新算法和排序新算法。例如,Kirsch等(2006)给出一种基于社会网络的检索结果排序技术[9],其方法是:首先从论文数据中抽取作者合作信息,生成基于合作关系的社会网络,并利用PageRank算法计算每个网络节点的分值,然后再用网络节点的分值计算文档的分值,最后利用文档的分值与文档—查询相关度的乘积对检索结果进行排序。Dalal(2007)提出基于一个用户对其他用户或群体的绝对或相对信任度以及该用户和其他用户或群体的配置文件修改该用户偏好向量的方法[17]。Cannel等(2009)探讨利用用户在社会网络中的人际关系对搜索结果重新排序[18]。他们分别以用户之间的熟悉程度、用户之间的相似程度、用户之间的熟悉程度和相似程度为基础构建3种社会网络,然后基于社会网络,针对特定用户,定义一个计算查询与文档、人物、标签、群组等实体相关程度的公式。Haynes等(2009)在传统的搜索方法中引入对社会距离的度量来改善搜索结果的排序效果[19]。Kashyap等(2012)推出基于社会网络的社会化搜索系统SonetRank[20]。该系统以类似团体内用户的相关反馈为参考依据为特定用户返回个性化的网页搜索结果。Khodae等(2012)探讨利用用户生成数据、用户行为数据以及用户在Web上形成的社会关系来提高网页搜索的效率[21]。他们基于用户之间的关系、每个用户的重要性、用户对网页文件的操作行为等参数提出一个新的社会化相关性排序方法,并与常规的文本相关性排序方法进行组合,以提高信息搜寻的效果。算法中的查询包括两部分,一部分是显性的文本部分,用关键词序列反映用户需求;一部分是隐性的社会化部分,对应提交查询的用户以及他所处的社会网络。作者定义了4种相关度,即用户相关度、文本相关度、社会相关度、社会—文本相关度,其中社会—文本相关度是文本相关度与社会相关度的加权之和。用户行为揭示了文档与用户之间的关系,在社会化媒体上,这类行为包括发信息、转发信息,等等。作者定义用户之间的相关度(User Relatedness)、用户的重要度(User Weight),并利用用户之间的相关度、用户的重要度、社会关系中具有相同行为的用户信息定义查询与文档之间的相关度的计算公式,以此来实现文本排序以及社会化信息搜寻。

       利用社会网络可以找到关键性的人物,从而可以由人找到信息,高效地完成信息搜寻任务。Guo Liang等(2012)提出一种混合式的社会化信息搜寻模式,系统在收到用户的查询之后,返回经过排序的、可能会给出正确答案的回答者列表[22]。文中给出主题相关排名算法、社会关系排名算法两种新算法来计算搜索结果的排序,主题分类标签被定义来控制这两种算法计算结果的权重。Horowitz等(2012)实现了一个社会化搜索引擎,即Aardvark。用户使用Aardvark时可通过即时消息、电子邮件、网络输入、短信或语音等方式提问,然后Aardvark利用提问用户的扩展社会网络找到最有可能回答这个问题的人[23]。确定用户的本次排名的主要因素是主题专业知识(用户与查询的相关概率),用户与用户之间连通性(这个分值由提问者和回答者彼此对联络和相似性的感知而产生,其作用是量化提问者和回答者所感受到亲情和信任程度,并在互动过程中满足彼此对会话行为的期望)和可用性(综合是否在线、是否活跃、是否能够正确回答等因素选择可以优先推荐的回答者)。

       部分研究者寻找检测社团结构的方法,并利用社团属性来改善搜索结果。例如,Briggs等(2007)提出一种分布式协作网页搜索模型CWS,以协作的方式,利用社团搜索者形成的对搜索结果的推荐来补充搜索引擎返回的结果[24]。

       1.3 用户行为层面

       用户行为层面的社会化信息搜寻研究主要涉及用户信息搜寻时采用的社会化策略,社会化信息搜寻行为的影响因素,用户通过社交平台进行信息搜寻时的策略以及行为特点,用户信息行为模式,等等。

       Evans等(2010)分析了用户在线信息搜寻时采用的社会化策略,认为在线社交工具之间、在线社交工具与现有的搜索工具可以更好地集成[25];Farzan(2010)研究了人际信任水平对社会化信息搜寻的影响[26],Zhang Pengyi(2012)研究了信息搜索者通过微博提问的方式进行信息搜寻的行为,研究结果表明信息搜索者的社会资本及其与信息提供者的关系对利用微博进行信息搜寻的返回结果有明显的影响[27];Gray等人(2013)探讨了社会资本、问题类型、关系亲近对Facebook用户提问以及回答问题的行为的影响[28];Onuoha等(2013)探讨了通过社交网络平台进行信息收集的策略[29],Karsenty(2013)探讨了用户选择Facebook作为信息搜寻工具的原因以及何种因素使得用户信任通过Facebook搜寻到的信息[30],Forte等人(2014)探讨了青少年在使用社交平台提问与回答问题时所具有的行为特点[31]。

       Muralidharan等(2012)采用眼动跟踪和采访的混合实验方法研究网页中的社会化标注(Social Annotation)信息对信息搜索者的影响[32],发现:在某些情况下,在搜索结果网页上显示的社会化标注信息对搜索者没有产生作用。搜索者会忽视来自陌生人或具有不确定专业知识的、不太熟识的朋友的信息。搜索者希望能够搜索到来自懂行的朋友的观点或评论,或者来自具有相同爱好的朋友留下的是否感兴趣的信号,或者朋友们共同感兴趣的其他主题。导致搜索者忽视社会化标注信息的主要原因是搜索者在处理搜索页面时所表现出来的特殊关注模式:搜索者首先关注标题和URL地址,然后转而关注能够搜索到一个好结果的信息片段和注释,并点击链接。另外,自上而下的阅读习惯、信息片段中嵌入的朋友照片太小以及用户面向任务的心态等因素,也会使得现有搜索结果网页上的社会化标注信息被搜索者忽视。

       国内学者王知津[33]、李贺[34]、马海群[35]、陆伟[36]、韩毅[37]等从认知的角度对信息查询、信息检索进行了探讨,构建了一些认知模型;邓小昭[38]、丁韧[39]等对互联网环境下的用户信息行为进行了大量的研究内容涉及信息用户的交互行为,但是没有提及或深入探讨交互行为的社会性。

       2 社会化信息搜寻研究存在的问题

       从上节的分析可以看出,社会化信息搜寻领域的研究已经取得了丰硕的成果,但是还存在一些不足:

       1)检索技术层面的研究比较活跃,对社会化信息搜寻基础理论的研究比较缺乏。现有的定义都强调信息搜寻时社会化交互的重要性,但是内涵与外延存在明显差异,部分学者将社会化信息搜寻混同于社会化(或协作式)信息检索、社会化搜索、社会化信息导航。现有成果对社会化信息搜寻的研究框架、社会化媒体或社会关系网络影响信息搜寻的作用机制以及用户社会化信息搜寻的行为模型等诸多方面的研究均不明晰。

       2)对社会化信息搜寻行为的研究视角不够全面,缺乏基于认知视角的研究。行为模式属于宏观结构,认知机制属于微观结构,构建用户交互行为所涉及的认知过程与认知结构构建相应的模型是探讨从微观到宏观的联系所必需的环节。先前的用户行为研究主要沿用传统网络环境下用户行为研究的方法体系,对用户行为数据进行分析,从中获取用户的行为模式与人群特征,缺乏基于认知视角的研究,导致人们对信息搜寻过程中存在的社会化交互认知机制认识不足。认知范式为新兴的社会化信息搜寻行为研究提供了新的视角。与基于数据挖掘、统计实证等主流方法的用户信息行为研究形成互补,相关成果既可以为信息检索系统中新出现的社会化交互行为提供更加全面、科学的解释,也可以为开发与设计更加完善的社会化信息检索系统提供理论依据。通过对用户社会化信息搜寻认知模型的研究,可以形成一套比较系统的理论与方法,用于分析社会化信息搜寻者的认知结构与认知过程、影响用户社会化交互策略选择的认知因素等,从而丰富情报学领域的理论成果。

       3 社会化信息搜寻研究急需解决的问题——认知模型构建

       从认知视角探讨社会化信息搜寻行为是全面认识这类行为必须开展的工作,以社会化网络环境中信息搜寻者的认知结构与认知过程作为研究对象具有重要的现实意义。笔者认为社会化信息搜寻认知模型研究需要解决的问题至少包括以下4个方面。

       1)社会化信息搜寻基础问题分析。包括社会化信息搜寻的产生背景、概念、组成要素、特征、类型,社会化信息搜寻行为的社会性在问题定义、需求表达、信息搜寻、信息利用等阶段的具体体现,用户、检索工具、信息资源、社交工具四者之间的关系,社会化交互策略的类型与对应行为等基础性问题的分析、阐述。

       2)基于认知视角的社会化信息搜寻行为影响因素及其机理研究。从用户与用户以外的信息(技术)环境、组织环境、社会环境等方面分析信息搜寻活动中影响用户社会化交互策略选择的因素,从中筛出认知因素;给出基于认知视角的社会化信息搜寻行为影响因素假设模型,分析各认知因素对用户社会化交互策略选择的影响;运用结构方程等方法构建基于认知视角的社会化信息搜寻行为影响因素模型,并探讨各认知因素之间的关系以及它们对社会化信息搜寻行为的作用机理。基于认知视角的社会化信息搜寻行为影响因素模型的构建涉及基于认知视角的社会化信息搜寻行为影响因素的筛选,涉及数学工具的选择与使用,难度较大。

       3)社会化信息搜寻认知模型的构建。以基于认知视角的社会化信息搜寻行为影响因素模型为指导,以Dervin的意义建构理论、Wilson的信息行为模型、Kuhlthau的信息检索过程理论[40]等信息行为理论为依据,结合认知心理学、社会科学、计算机科学等相关领域的理论和方法,提出社会化信息搜寻认知模型,包括社会化信息搜寻的认知过程模型与认知结构模型,并对其组成要素进行深度分析。在社会化信息搜寻认知模型中,用户社会化交互策略形成规则和改变规则既是构成社会化信息搜寻认知模型的关键性要素,也是构建社会化信息搜寻认知模型必须解决的关键性问题。

       4)社会化信息搜寻认知模型的验证与应用研究。设置具体的信息搜寻任务以及相应的量表,让参加实验的个体在社会化环境里完成信息搜寻任务,并完成调查问卷,利用调查数据对构建的社会化信息搜寻认知模型进行验证,有针对性地提出改进信息检索服务平台的建议。

       上述4个方面是关系密切的整体,可以基于以下流程开展社会化信息搜寻的相关研究工作:以认知心理学理论、社会关系理论与信息行为理论为基础,通过对互联网用户的社会化信息搜寻行为进行心理学、认知学、社会学、行为学解读,阐述社会化信息搜寻行为的内涵、特征、影响因素等内容,初步完成对社会化信息搜寻行为基础性问题的分析与阐述;基于认知视角从若干影响因素中筛出部分因素,提出基于认知视角的社会化信息搜寻行为影响因素假设模型;通过专家访谈的方式设计和完善社会化信息搜寻行为影响因素调查问卷;通过问卷调查、在线调查等方法,收集社会化信息搜寻行为影响因素分析数据,并运用结构方程等方法构建基于认知视角的社会化信息搜寻行为影响因素模型;以社会化信息搜寻行为影响因素模型为指导,以现有的信息行为理论为参考,构建社会化信息搜寻认知模型;开展社会化信息搜寻认知模型的验证与应用研究。

       4 结束语

       随着社会化信息系统的发展,用户获得信息的渠道和方式变得更加多元,信息搜寻的对象不仅仅包括传统的信息内容,同时也包括用户自己生成的内容、其他用户、用户和用户之间的关系等信息,用户搜寻信息的过程不仅可以独立完成,也可以在他人的帮助之下完成。相对于基于传统信息系统的信息搜寻,用户通过社会化信息系统来获取信息变得更加个性化、更加有效。社会化信息搜寻拥有庞大的潜在用户群体。通过对社会化信息搜寻的内涵与外延、社会化信息搜寻基础理论、社会化信息搜寻认知模型等相关理论与实践问题的探索,可以解决社会化信息搜寻研究中的瓶颈问题,对社会化信息搜寻理论研究具有借鉴作用,对社会化信息搜寻的应用研究具有指导意义。社会化信息搜寻是信息检索发展到一定阶段的产物,随着社会化信息系统的逐步普及,社会化信息搜寻必将成为一个新的研究热点。

       收稿日期:2014-09-24

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

社会信息检索研究综述_社会网络理论论文
下载Doc文档

猜你喜欢