社会化搜索研究进展综述_社会化平台论文

社会化搜索研究进展综述,本文主要内容关键词为:研究进展论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      修回日期:2014-08-11 本文起止页码:5-13

      在大规模协同计算环境当中,如何帮助用户快速、高效地搜索到所需信息或知识,成为业界与学界共同关心的一个重要话题。一方面,为了在竞争激烈的搜索市场中抢占一席之地,搜索引擎公司纷纷对自身技术加以改进,以提供更优质、便利的搜索服务;另一方面,用户也不再满足机械单一的旧式搜索体验,仅仅依靠算法的排序和结果的罗列,而是期望通过彼此的沟通与协作,利用在线社会网络(Online Social Networks,OSN)关系得到智能化的搜索结果。为此,一个基于Web 2.0框架的新型搜索模式——社会化搜索(social search)应运而生,并逐渐深入到人们日常网络活动当中。特别是大数据(big data)、云计算(cloud computing)时代的来临,社会化搜索的作用日渐突出,并引起国内外相关学者的密切关注。本研究通过对相关研究文献的搜集与梳理,首先从动因(why)、用户(who)、目标(what)、形式(how)4个维度对社会化搜索的概念进行深度剖析;然后整理行为、技术、应用、资源4个视角下社会化搜索的研究内容和主题;最后指出当前社会化搜索研究的几点不足之处,并对社会化搜索的发展趋势进行展望。文章对社会化搜索概念与相关研究进展的综述,将克服以往研究思路模糊的障碍,丰富社会化搜索的理论体系与研究内涵,并对今后的研究思路与方向产生启示。并在一定程度上对社会化搜索的研究思路产生帮助。

      1 文献来源

      截至2014年4月22日,笔者通过在国内外(包括我国港澳台地区)学术网站的大量检索,经过人工排查、去重,共获取了262篇与“社会化搜索”主题相关,即题目或关键词中含有“社会化(社会、社交)搜索(检索、查询、搜寻、查找)”、“social search & seek & retrieve)”的学术性全文文献(即具有摘要、关键词等且能够获取全文),其载体包括期刊论文(主要来自于Elsevier、Emerald、SAGE、Routledge、CNKI等数据库)、会议论文(由IEEE、ACM、Springer等出版)、学位论文(主要来自ProQuest、CNKI、台湾各大高校硕博士论文系统)、专著和报告5种类型,文献年代分布情况如图1所示。

      

      图1 社会化搜索文献年代分布

      在这262篇文献当中,中文文献共58篇(其中包括期刊论文25篇、会议论文2篇、学位论文31篇),英文文献共204篇(其中包括期刊论文41篇、会议论文145篇、学位论文12篇、专著4部、报告2篇)。

      从图1可以看出,社会化搜索文献生成数量基本呈现一种快速上升的趋势。Web 2.0环境下社会化媒体、在线问答社区、社会化搜索引擎以及社会化标注系统如雨后春笋般涌现,促使信息查询与搜索的社会性特征日益突出,在信息技术、信息系统、信息管理、信息行为等领域具有良好研究基础的诸多学者,正在积极投入社会化搜索相关领域的研究当中。有理由相信,社会化搜索研究的上升态势仍将保持下去。

      2 社会化搜索的概念

      现有文献当中,较早对社会化搜索展开比较全面研究的是J.Freyne和B.Smyth[1]2004年在荷兰埃因霍温举办的第3届自适应媒体与自适应互联网系统国际会议(the 3rd International Conference on Adaptive Hypermedia and Adaptive Web-Based Systems)上发表的一篇题为An experiment in social search的文章,文中对social search一词进行了定义。此后,不少学者对社会化搜索的概念做出多方位的解释,一些代表性观点如表1所示。

      

      总的来说,社会化搜索是Web 2.0环境中群体协作(mass collaboration)思想的集中体现。所谓群体协作[8],是指在互联网环境下,分散、独立、不同背景的参与者,受到特定组织或个人的开放式召集,依靠共同的兴趣和认知自愿地组成网络团队,以网络平台,尤其是社会化软件为工具,显性或隐性地通过自组织方式协作完成高质量、高复杂性的团队作品。社会化搜索特别强调用户的参与互动,希望借助OSNs的力量,从Wikipedia、博客、播客、SNS(Social Networking Services,社会网络服务)、IM(Instant Messenger,即时通讯)等多种社会化媒体(social media)及传统的Web页面中共同来筛选、整理搜索结果。为此,笔者认为,社会化搜索是指Web 2.0网络中的用户彼此之间相互联系,通过社会化交互、协作对搜索过程进行主动控制,最终获取所需知识或信息的一种Web搜索行为。总而言之,社会化搜索重视用户的群体协作在信息搜索中发挥的能动作用,从而达到搜索结果的高质量与高相关性。

      在信息行为研究当中,T.W.Malone、R.Laubacher、C.Dellarocas[9]从员工(who)、目标(what)、诱因(why)、结构/过程(how)4个角度研究了群体智慧中大众行为的模式和特征;S.Kjellberg[10]从目的(why)、形式(how)、内容(what)与环境(who & where)4个方面对科学博客用于学术交流进行了研究;赵宇翔、范哲、朱庆华[11]从用户生成内容(User-Generated Content,UGC)中用户的类型与角色(who)、内容的类型与属性(what)、动因(why)、模式(how)4个维度深入剖析了UGC的概念。参考这些学者的研究思路和方法,笔者将基于宏观与微观两个层面,从社会化搜索彼此紧密联系、相互作用的4个维度——动因(why)、用户(who)、目标(what)、形式(how)来对其概念进行全方位的解析。

      2.1 社会化搜索动因

      B.M.Evans和E.H.Chi[12]通过调查,认为社会化搜索的驱动因素来自外部(如上司、客户等的特殊信息请求)或用户自发(寻找与个人或工作有关的信息)两个方面。笔者认为,对社会化搜索动机的产生原因,主要可以从外部环境(宏观)与用户自身(微观)两个角度来考察。M.S.Scale[5]从外部宏观的角度,将社会化搜索产生的动因归纳为4个方面:①大众能够广泛便捷地访问互联网;②新兴的信息服务方式为用户成为“准图书馆馆员”(quasi-librarian)提供了机会,他们也可以描述和标记数字信息资源;③SNS的发展允许用户与个体或公共信息自由地实现在线交互;④新兴的商业服务模式致力于在线挖掘用户的个人信息。Yang Jiang等[13]则通过对分布在美国、英国、中国和印度4个国家、扮演相似工作角色的933个用户的调查,研究了不同国家人们固有的文化特征,比如认知模式(cognitive patterns)和社会取向(social orientation)等对用户参与社会化搜索提问与应答的动机的影响。微软剑桥研究院(Microsoft Research Cambridge)的M.Raza[14]2011年在一份名为A new level of social search:Discovering the user's opinion before he can make one的报告中,介绍微软一项名为OpinionSquare的社会化搜索服务时,从内部微观的角度考察了用户参与社会化搜索的4个动因:乐趣性(enjoyment)、好奇心(curiosity)、利他主义(altruism)、竞争性(competition)。

      2.2 社会化搜索用户

      从宏观层面,社会化搜索用户大体可以分成专家用户和群体用户两种类型。黄来磊[15]、张晶[16]从专家智慧(专家信任)和集群智慧(群体判断)两种角度解释了社会化搜索的内涵,专家智慧主要关注OSNs中的搜索策略和社会化搜索模型,集群智慧则旨在通过OSNs的特征来重新整理搜索结果。Su Chunke和N.Contractor[17]在研究咨询人员群体的信息搜寻行为时发现,以人为信息搜索源时与以往的经验和专家的可得性正相关,以数据库为信息搜索源时与数据库能够返回的信息多少有关,当用户能够找到相关知识的专家时,更倾向于采用社会化搜索的方法搜索信息。B.M.Evans和E.H.Chi[2,12,18]依据社会化搜索请求产生的两个来源——外部与自发,将社会化搜索的用户分为外部驱动型(externally-motivated searcher)与自发驱动型(self-motivated searcher)两种类型。

      从微观层面,社会化搜索的用户根据信息需求的不同,分别在社区中扮演不同的角色,他们参与社会化搜索的动因、形式与目标可能不尽相同。A.T.I.Mansill和J.L.D.I.Esteva[19]认为,群体用户(或者用户的代理)一般扮演3种角色:①提问者(questioner)——为了满足获取信息的需求向他人提出问题的人;②中介(mediator)——可以帮助提问者解决问题,但不能直接回答,而是通过查询路径(转向其他用户提问,并与原提问者或其他中介保持沟通)或提供推荐为提问者寻求答案的人;③答问者(answerer)——向提问者或中介直接提供答案的人。T.Russell-Rose、T.Tate[4]提出一个由3层同心圆(内圈、社交圈、外圈)组成的社会化协作搜索用户模式框架:内圈构成社会化搜索的核心,它由一个或多个承担共享工作任务(即个人或组织的共享目标)的用户组成,内圈中参与协作的用户可能会围绕共同的兴趣爱好、工作角色或地点与一些外部群体发生联系,这就组成内圈外围的社交圈,他们时不时会寻求社交圈来提供搜索帮助;无论是内圈或者社交圈,都体现出个体之间一种显性的、有意的协作形式,而社交圈外围形成的外圈则属于隐性的、无意的协作范围,这种情况特别体现在陌生人之间发生的交互中。

      2.3 社会化搜索目标

      在社会化搜索与传统Web搜索两种模式下,一些学者比较了其资源查找目的的不同之处,从宏观的角度分析了社会化搜索的目标。D.Horowitz和S.Kamvar[20]认为传统搜索引擎的目的是查找能够满足用户需求的文档或资源,而社会化搜索是为了查找能够满足用户需求的人。M.McDonnell、A.Shiri[3]和M.S.Scale[5]提到,社会化搜索是一种利用OSNs关系对人或信息的在线搜索方式。可见,人们发起社会化搜索活动,无非是为了寻找两种资源:找人或找一般性的信息。寻找人的社会化搜索,沈阳、李舒晨、田晨耕[21]称之为“社会性人物搜索”,李鹏、韩毅[22]视其为“社会合作信息查寻与检索”的典型代表,国内俗称“人肉搜索”(Human Flesh Search,HFS),指利用人工参与来提纯搜索引擎返回信息的一种机制,其本质是依据网络多媒体素材获得少量的人物信息特征,不断调整搜索策略迭代搜索,最终获得搜索对象的全部真实人物信息的复杂检索过程。人肉搜索涉及法律与伦理道德的诸多问题,一度引起社会学、法学、传播学领域学者的广泛关注。本质上来说,“人肉搜索”活动产生的初始动机虽是“找人”,而实质是通过搜索人身上所承载的信息或知识,最终形成对人体貌、性格、行为等特征的描述。

      另一些学者则从微观的角度,选择通过分析社会化搜索的内在机理对社会化搜索的目标进行了理论或实证研究。J.Teevan、D.Ramage和M.R.MorriS[23]认为,传统搜索引擎建立了信息与信息之间的关系,OSNs建立了人与人之间的关系,而社会化搜索则是要将信息与人关联起来,重建一种人与信息之间的映射。赵中宁[24]认为社会化搜索能够解决传统Web搜索在“用户自创造内容”方面难于辨别的问题,为用户提供查找企业信息、评论企业产品或服务、结交朋友、参与论坛讨论、组织线下活动等一系列服务。

      2.4 社会化搜索形式

      从简单的书签共享或用描述性标签标注的内容,到结合人类智慧和计算机算法产生的更多复杂方法,较之传统Web搜索渠道单一的方式,通过各功能的高度聚合,社会化搜索具备了各种各样的形式。从实现路径与模式这个宏观的角度考察,黎江和谭宗颖[25]讨论了社会化搜索3条可能的实现途径:社区化搜索、社会化搜索引擎和个性化搜索。社区化搜索致力于在各类社区之间及其与搜索引擎之间建立丰富的联系,互相配合成为全方位、多层次传播信息的“大网”,实现搜索方式的多样化;社会化搜索引擎的本质是使搜索成为一种新的社区形式,体现搜索结果的民主化;个性化搜索则以定制和学习为主要特征,实现搜索过程的自主化。程时端、郭亮和王文东[7]将基于集群智慧的社会化搜索分为基于标签的社会化搜索、基于社会网络结构的搜索、社会化推荐和个性化搜索4种形式。唐晓波等[26]认为社会化媒体主要包括基于本体、基于社会网络、基于主题模型3种检索方法。

      社会化搜索本身是一个动态、变化的过程,为此,很难对社会化搜索进行过程划分,找到其不同阶段的分界线。B.M.Evans和E.H.Chi[2,12]从搜索前、搜索中与搜索后3个阶段讨论了社会化搜索的规范模型,而用户在不同的阶段,利用不同的社会化搜索工具时其行为表现存在较大的差异。A.T.I.Mansilla和J.L.D.I.Esteva[19,27]在E.H.Chi[8]将社会化搜索分为社会化反馈系统(social feedback systems)和社会化应答系统(social answering systems)两种形式的基础上,提出了Asknext:一种通过使用社会化网络来连接代理,实现知识交换自动化的协议,同时,进一步将社会化反馈系统划分为搜索引擎(search engines)和推荐系统(recommender systems),社会化应答系统划分为问答(Q & A)与社会化网络(social networks)。

      如果从平台与工具这个微观的角度来看,目前社会化搜索主要依赖于以下4种形式:①Socialmention、Volunia、Wajam及谷歌的social searcher等专业社会化搜索引擎;②Facebook、Twitter、MySpace、人人网、微信、MSN等多样社会化媒体;③WeCenter、知乎、百度知道、新浪爱问知识人、天涯问答等在线问答社区;④DeliciouS、Flickr、CiteULike等社会化标注系统(social bookmarking system)。M.S.Scale[5]通过参与观察、个人体验与实验研究了Facebook作为一种社会化搜索引擎的益处和不足。J.Teevan、D.Ramage和M.R.MorriS[23]通过分析查询日志,对比了传统Web搜索与Twitter中社会化搜索的主要区别:Twitter搜索不仅实时性强,而且信息多与人相关,主要被用来监控内容,而Web搜索常用于开发和获取一个主题;Twitter搜索结果包含很多社会内容和事件信息,而Web搜索结果更多的是基本的事实和导航内容。黄俊杰[28]介绍了一种基于IM的答案搜索系统(IM Finder),此系统可以通过IM中的联系人构成的OSNs,帮助搜索问题答案的询问者及时、精确地搜索到具有足够知识的联系人来回答问题。当使用者在线搜索问题时,会利用其他使用者成功得到回答者的经验,从而达到较高的搜索精确度。Peng Jing、Zeng Daniel Dajun和Huang Zan[29]依据Delicious、Furl、Simpy、Citeulike,Connotea等社会化标注系统中用户-条目-标签(user-item-tag)三元共存结构,提出了一个主题导向模型(subject-centered model)来获取协作标签(collaborative tagging)中的“群体智慧”(wisdom of the crowd),用于社会化搜索过程。

      3 社会化搜索的研究进展

      2004年,Startup Eurekster公司首次向市场推出其社会化搜索业务。此后,一些大型互联网公司,包括Jeteye Technologies公司和Kaboodle公司基于这个理念以不同的技术加入到社会化搜索的行列中来。目前,国内外一些搜索引擎及社会化媒体公司也在社会化搜索服务方面进行了有益的尝试,如Google的Google Plus和Facebook的Graph Search服务,国内则有谷姐、知乎、云云搜索、科研人搜索、bbmao(已倒闭)等。除了产业界对社会化搜索理念与技术的不断推动,学术界对社会化搜索的研究大量集中在计算机与信息科学领域,主要是针对搜索引擎和系统进行算法设计与改良研究等。近几年,社会化搜索问题也成为国外信息管理、信息系统学科领域众多学者青睐的对象,他们对社会化搜索用户行为、模式、过程、机制等问题做出了有益的探索。在国内,图书情报学领域的一些学者,借鉴其他学科的理论与方法,亦积极投身于社会化搜索相关研究之中。本研究分别从技术、行为、应用与资源的视角出发,对搜集到的文献进行全面剖析,以揭示当前社会化搜索的研究进展。

      3.1 技术视角

      从文献数量分布来看,技术视角的社会化搜索研究主要包括社会化搜索引擎的研究与社会化搜索算法的研究两个方面,它们占了社会化搜索研究文献的半壁江山。

      首先,伴随社会化搜索理念与技术的并进,除了传统搜索引擎,如Google等朝着社会化趋势发展以外,国外还诞生了许多专业化的搜索引擎,它们各具特质、形式多样,但都具有共同的宗旨:在Web 2.0环境下,为用户提供个性化的搜索体验和服务。HeyStaks是爱尔兰的一个社会化搜索引擎,它根据用户的兴趣爱好,利用搜索推荐技术将“协作”添加到Google、Bing和Yahoo等主流搜索引擎当中,向用户推荐来自Twitter和OSNs的搜索结果。B.Smyth等[30]介绍了HeyStaks的系统结构和运行原理;K.McNally等[31]将“声誉”融入HeyStaks社会化搜索结果推荐过程当中,以此来提高搜索的相关性;B.Smyth、M.Coyle和P.Briggs[32]之后又提出了一个HeyStaks的部署更新,并讨论了对HeyStaks推荐系统质量的评估以及一些市场经验教训。M.R.Bouadjenek、H.Hacid和M.Bouzeghoub[33]介绍了以社会化信息和个性化服务为核心技术的LAICOS社会化搜索引擎:一方面,社会化环境中的文档作为一个层级,被添加到传统用于索引的文本内容当中,以此来提供个性化的社会化文档表示(personalized social document representations);另一方面,社会化环境中的用户利用个性化的社会化搜索延伸框架(Personalized Social Query Expansion Framework,PSQE)来完成查询过程的扩展。值得一提的是,2014年4月11日,笔者通过访问LAICOS的首页(http://laicos.com),发现该网站正在主打一款名为Fuse的移动应用程序(app),Fuse的口号是:“You're one social person,Get one social app”(你是一个社会化的人,值得拥有一款社会化应用软件);“Fuse brings together all your favorite social networks in one beautiful experience”(Fuse汇集了您所有最喜爱的社会化网络并将带将给您精彩的体验)。不难看出,伴随着移动互联网的迅速发展,除了搜索引擎本身具有的个性化、集成化、语义化特征,社会化搜索工具正在向移动化的趋势迈进。

      其次,OSNs用户的大量增长,导致社会化搜索机制的复杂化和专业化,为此,很难找到一种具有较强普适性的社会化搜索算法,而且很难找到一种可以适用于任何社会化网络的搜索算法,学者们大多热衷于搜索结果排名的算法设计,来帮助用户方便快捷地获取所需信息。A.T.I.Mansilla和J.L.D.I.Esteva[34]提出了可以用于社会化搜索协议(如Asknext,Sixearch)的一种Question Waves算法,通过本地信息来做出决策获得搜索答案排名。D.Sharma等[35]根据一些直观的概念,如亲密度(proximity)、相似度(similarity)及交互作用(interaction)提出了一种自适应社会化搜索算法,根据用户的关联程度来排列在特定社会化网络中的搜索结果。Jiang Zongli、Li Jingsheng[36]设计了一种基于社会化标签(social tagging)信任度的搜索排名算法。Guo Liang等[37]针对搜索结果列表,提出了两种排名算法:主题相关排名(Topic Relevance Rank,TRR)用以评估用户对主题的专业程度;社会关系排名(Social Relation Rank,SRR)抓取用户之间的社会关系强度,其中,这两种算法的权重是通过主题分类标签来定义的。事实上,在OSNs产生的海量数据当中获取较为精确的搜索结果,需要考虑的因素不仅仅是这些,一些文献[34-37]当中提出的诸多社会化搜索结果排名算法均存在改进的空间。搜索引擎机制与搜索算法的优化与改进,需要相关研究学者的不懈投入与努力:只有更好,没有最好——这对社会化搜索的良好发展永远都是至关重要的。

      3.2 行为视角

      在社会化搜索中,不少学者利用社会统计调查方法,继承了传统信息行为研究当中的一些理论和方法,针对不同的社会化搜索用户群体,对其使用行为进行了研究。B.M.Evans、S.Kairam和P.Pirolli[38-39]利用认知任务分析(cognitive task analysis)技术以及发声训练(talk-aloud protocol)与视频捕捉(video capture)技术,让8名用户执行与美国能源政策相关的感知搜索任务,一种情况下只限制使用社会化资源(利用OSNs向朋友等其他用户提问);另一种情况下只可使用Web信息资源,通过这种对比实验组的方式来研究用户从事社会化搜索活动的认知影响因素,得到用户信息采集的3种社会化策略:定向和直接提问(targeted & directed asking)、网络和公开提问(network & public asking)、直接搜索(searching)。A.Forte等[40]利用访谈和焦点小组的方式,从认知、隐私、参与角色、工具使用等多重角度调查了158名美国高中生在线问答的使用行为,并将以往对成年人的相关研究结论与之进行对比。袁红[41]从社会化媒体、用户信息搜索行为和用户的社会化搜索3个方面对社会化媒体环境下的用户信息搜索行为研究进行了梳理,认为用户社会化搜索意愿及其对搜索行为的影响、社会化搜索行为影响因素及其机理、动态持续的社会化搜索行为研究、社会化搜索效率评价及搜索结果的改进是今后社会化媒体环境下用户信息搜索行为研究4个值得关注的领域。李枫林、罗芳晴和郭宁宁[42]通过设计一个良构问题(well-structured problems)问卷(2012年诺贝尔物理学奖获得者及获奖理由)和一个非良构问题(ill-structured problems)问卷(规划国庆七天长假旅游计划),对这两种不同任务情境下用户搜索方式的选择策略进行了探讨,比较了用户利用社会化搜索与传统Web搜索两种方式所带来的信息收益和认知收益的差异,以及信息分享意愿的差异。当前的Web搜索倾向依赖于显式人性化推荐(explicit human recommendations)技术,即显式反馈(explicit feedback),事实上,隐式反馈(implicit feedback)也有很大的潜力。L.Luca、B.Stephen和D.Pierpaolo[43]依据P.Pirolli和S.Card[44]1995年提出的信息觅食理论(information foraging theory),通过对100名在校大学生浏览专题网站行为的观察,证实了显式反馈和隐式反馈之间存在很大的关联性,为此,考虑相同的搜索目标,社会化搜索比Google的Page-Rank算法更有效。

      3.3 应用视角

      对社会化搜索概念的理解,可以是一种行为或活动,也可以是一种工具或方法,比如,社会化搜索引擎就是最重要的体现。对社会化搜索的研究,除了行为层面上的解释及技术层面的跟进,关键还要落实到社会化搜索在人们社会生活各个领域的应用当中,而目前对此方面的单独研究相对较少,一些成果融合在社会化搜索行为与技术研究当中。社会标注系统与大众分类法将社会化搜索与传统搜索引擎明显区分开来,R.Barsky和A.Cho[45]讨论了包括Google Custom Search、Delicious、YouTube及Flickr在内的社会化搜索工具在卫生信息职业当中的应用。C.W.Cho等[46]对台湾科学教育馆(National Taiwan Science Education Center)网站进行研究调查,证明社会化标签可以有效提高用户搜索博物馆资源的效率。何海地[47]提出了一些利用社会化搜索实现图书馆服务创新的思考,认为实现图书馆个性化检索与推荐服务,以自身力量难以建立专门的网络社区,应该在现有的OSNs上寻找突破点,比如,利用国内的新浪微博、腾讯微信的社会化搜索功能来了解读者对图书馆服务的直观意见。Xiang Zheng、U.Gretzel[48]通过设计实验,模拟一个旅行者结合9个美国旅游景点的名称,利用一组预定义的关键词,借助搜索引擎来完成旅行规划。实验结果显示,搜索引擎在很大程度上将用户直接导向社会化媒体网站,表明社会化媒体在旅游信息搜索中的重要性日益上升。

      3.4 资源视角

      依据前面提到的社会化搜索目标可知,社会化搜索总体来说包括信息与人两种资源类型,而“人”的资源,归根结底依旧是人所承载的信息资源。一些学者们利用定性分析或实证研究的方法,从信息资源收益与成本的关系、资源与目标间的信息传递现象、资源之间的相互链接等多个研究角度,考察了社会化搜索方方面面的问题。社会化搜索会给人们带来可观的信息收益与认知收益,而E.H.Chi、P.Pirolli和S.K.Lam[49]的研究表明:丰富的社会化信息资源(如电子邮件、即时消息、新闻组和论坛、Wiki、博客、社会化标签等)在为用户进行信息搜索带来收益的同时,也产生了一定的干扰成本。H.Inaltekin、M.Chiang和H.V.Poor[50]利用小世界网络(small-world network)研究了社会化搜索当中资源与目标之间消息延迟传递的现象,通过考虑不同网络域中的图形,如矩形、圆形和球形的构造,分析了社会化搜索平均延迟的解决措施。研究表明,用户更倾向于通过他们的短程接触进行相互沟通,当资源和目标之间的分离比较小时,社会化搜索的平均延迟呈直线上升趋势。用户在资源之间创建底层链接(如超链接)时,往往不能避免跨界(cross-boundary,即用户与资源分别来自不同国家,或者说资源描述语言非用户的母语)现象,R.Vuorikari和R.Koper[51]整合学习资源门户网站与社会化标注系统,构建了基于用户行动的社会化搜索生态阶段模型。为此提出两种假设:①与传统基于文本的搜索相比,社会信息检索(Social Information Retrieval,SIR)策略可以帮助用户更有效地获取更多的资源;②社区浏览(community browsing)可以比文本搜索获取更多的跨界信息资源。

      4 思考与展望

      4.1 当前社会化搜索的缺憾

      4.1.1 研究视角:重技术,偏理论,轻应用 从262篇研究文献的主题构成与类型分布上来看,当前最多的仍旧是技术层面上对社会化搜索引擎及相关算法的研究,如对社会化搜索引擎工具的改进[30-33]和对社会化搜索算法的优化[34-37],这些文章大量发表在IEEE、ACM、Springer等出版的会议论文集中;其余多是理论层面上对社会化搜索概念、机理、模式等问题的探讨[1-7、12、14-16、18-27],这些文献在一定程度上奠定了社会化搜索研究的基础。而真正缺乏的却是社会化搜索在商务、传媒、教育、医疗等公共服务领域实际应用的研究[45-48]。特别是在突发事件与网络舆情当中,对社会化搜索行为的规范与控制,以及用户信息素养的培育等现实问题应该引起学者们的注意。

      4.1.2 研究基点:忽略协作的本质 笔者认为,社会化搜索价值之本身,就是通过群体协作的方式来实现信息搜索目标的精确定位与资源的高效利用,特别是以此来解决搜索中遇到的“偏题”、“怪题”。从社会化搜索研究的立足点来考察,很大程度上延续了单个用户完成信息搜索过程的思路,而忽略了其中泛在的合作现象,偏离了社会化搜索群体协作的核心思想。

      4.1.3 研究方法:不够系统、新颖、丰富 传统意义上对用户参与信息搜索的动因、意愿等特征的统计调查及定性分析,依然能够揭示社会化搜索行为研究的一些重要问题,而在参与社会化搜索的方式与途径等方面,用户在行为上表现出很大的不同之处,但现有研究仍然沿用传统Web环境下信息检索行为研究的方法体系,如系统开发、算法设计、问卷调研/统计、访谈与咨询、案例研究及定性分析等,根据社会化搜索环境(OSNs)、平台(社会化媒体、社会化标注系统)及工具(社会化搜索引擎)的特征,笔者认为,可以引入协同理论(synergy theory)、自组织理论(self-organization theory)、社会认知理论(social cognitive theory)等,采用社会网络分析(social network analysis)、社会计算实验(social computing experiment)等方法,对社会化搜索的用户参与动机、形成机制以及实现模式、途径与策略等问题展开综合研究。

      4.2 社会化搜索的发展趋势

      4.2.1 集成化 面对激烈的竞争市场,为了吸引更多的用户参与,绝大多数社会化媒体都不会止步于已有的产品与服务,而是纷纷借鉴、融合其他社会化交互功能,一些企业还将商务作用纳入其中,如腾讯的微博、微信、QQ空间以及人人网等平台;此外,专业的社会化搜索引擎,如HeyStaks等可以将Google、Bing、Yahoo等多种Web搜索引擎的结果推荐给用户,这些都是社会化搜索集成化趋势的体现。

      4.2.2 移动化 社会化搜索的发展并不局限于PC,随着移动互联网的蓬勃发展和移动用户的猛增,基于手机等移动终端的社会化搜索服务已经出现,比如,近几年兴起的基于位置的服务(Location Based Services,LBS)及各种移动平台的应用,本身已带有社会化色彩,移动社会化搜索(mobile social search)必将成为社会化搜索今后重点开拓的一个领域。

      4.2.3 语义化 信息搜索中,用户习惯使用自然语言,而Web搜索引擎对此的处理能力是非常有限的。社会化搜索的目标是查找符合用户需要的信息,因此对自然语言处理提出更高的要求,若能有效地分析和处理自然语言,将语义检索技术和OSNs有效结合,无疑能够更好地精准把握用户的信息搜索需求,提供个性化的社会化搜索服务。

      4.2.4 标准化 虽然社会化搜索强调针对不同用户提供不同的个性化搜索服务,而用户并非专业人员,对搜索结果的评价自然处于主观地位,这就需要制定一个较为客观、统一且具有层次化的评价标准,以便于用户更为便捷地选择合适的社会化搜索工具和平台。

标签:;  ;  

社会化搜索研究进展综述_社会化平台论文
下载Doc文档

猜你喜欢