信息聚合服务的发展与演进研究_rss论文

信息聚合服务的发展与演变研究,本文主要内容关键词为:信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着Web2.0的广泛应用,在网络上由若干互动关系集结而形成的“社会网络”改变着用户的信息需求和行为模式。开放、共享和聚合已成为网络发展的一大趋势。网络信息资源的海量增长和用户贡献内容的不断扩充,给用户带来资源选择多样化和自主化的同时,也带来选择迷航的问题,因此,如何将离散分布、异构无序的“信息碎片”动态关联并聚合起来,有效提供服务并促进知识共享,成为当前国内外关注的研究领域。

基于RSS的信息聚合服务发展到一定阶段,已经被更多更新的社会化信息聚合服务所取代。这些新兴的社会化信息聚合服务能够改善过多信息给人们带来的困扰。当互联网上的信息量越来越大,搜索引擎这种基于内容本身呈现信息的方式再怎么改良,也无法避免冗余的信息。而社会化聚合跟搜索引擎比起来虽然还不成熟,不过通过对信息背后的人的筛选来帮助过滤信息,提供了一种能够解决信息过载问题的可能。社会化聚合相关的在线服务正经历着飞快的变革,2007年最成功的Web2.0网站Twitter配合内容输出服务TwitterFeed,成为最原始却非常有效的信息流聚合方式,这种聚合在很大程度上代替了RSS阅读器的功能。而作为美国第二大社交网络Facebook,其推出的NewsFeed一方面把Feed这个概念推向了大众,另一方面也让社会化聚合的应用在很大程度上得到了普及。

1 信息聚合服务的理论与应用发展分析

信息聚合就是通过客户端软件或网络应用程序将诸如新闻头条、博客、播客等网络信息聚合到单一地点以方便用户浏览。Web2.0环境下信息海量增长,尤其是用户自产生内容的发展,用户每天在各种微博、SNS创造着庞大数量的内容,既多又杂。此外,政府组织和个人正把越来越多的数据信息放到网络上,如美国和英国的政府公开数据计划,Best Buy的店铺信息和Facebook等。另外,随着越来越多现实中的物体通过物联网技术和互联网连接,互联网即将迎来一次数据信息的大爆炸。如何过滤并重组这些数据信息使之最终变成个人化的信息,将是这些海量信息存在的价值所在[1]。对于信息消费用户来说,他们的时间和精力有限,需要借助各种信息聚合服务才能进行信息消费,如通过Google Reader或Mobile RSS for iPad去订阅门户、杂志网站的信息,统一在某一个聚合平台上进行消费。整个互联网正从通信的互联网、信息的互联网转型成为一个应用的、服务的、商务的互联网。围绕信息聚合服务,国内外在理论和实践上都取得了一系列成果。

1.1 基于RSS的信息聚合服务发展

Web1.0时代,基于门户网站的信息消费模式,控制着信息的集散,也控制着人们信息消费的广度与深度。Web2.0时代,以RSS为代表的信息聚合平台可以集成多家信息来源,自动浏览和监视这些来源网站的内容,将最新内容及时传送给用户。RSS等技术的进一步普及和优化,削弱了门户网站的信息集散能力。

1.1.1 国外基于RSS的信息聚合服务理论与应用发展

基于RSS/Atom的信息聚合服务有效地解决了网络信息资源的有序组织、有效传播的问题。21世纪以来,信息聚合服务已引起了国际和地区性组织的关注,面向科研和教育不同应用环境的信息聚合服务,已成为集中研究的课题。国外目前对信息聚合服务的研究主要集中在聚合标准、信息聚合对互联网发展的影响、聚合技术在各领域的应用等几个方面。

英国剑桥大学联合利华分子信息学中心、伦敦皇家学院化学系以及荷兰Nijmegen大学分析化学实验室研究人员研究了如何将RSS1.0规范与CM化学标记语言(Chemical Marked Language)结合起来,用以实现一种基于元数据的提示服务(a metadata based alerting service)。他们称这种融合的元数据格式为“CMLRSS”,它可以用来实现分子最新信息的呈现[2]。

Celikbas.zeki的《RSS是什么以及如何服务图书馆》一文掀起了RSS在图书馆中应用的大潮,将RSS 技术引入图书情报学科[3]。据有关统计显示,美国全国有230个学术图书馆使用RSS。根据图书馆服务人数的不同,2010年为超过50万人服务的美国图书馆89%都使用RSS,而2008年只有66%,如图1所示[4]。

图1 2008-2010年美国图书馆使用RSS的比例

此外,目前很多网站都提供RSS,除了博客站点,大多数媒体网站、企业站点、世界级的门户都提供基于RSS的服务,一些大的网站如BBC、CNET、CNN、Yahoo、微软等网站信息都是将RSS作为信息传播的媒介,许多科技网站也采用这种做法来发布最新消息,如今日物理杂志、美国物理研究所等。

根据Feed Burner的报告,信息聚合的发展历程是用户、技术与服务三者间互动模型的建立与变化过程。围绕信息聚合,各方已经形成了一个包含内容生产——增值服务——内容消费的服务链。在服务链上游,博客撰写者和科研机构、公司企业等不断进行内容生产;而内容消费者通过订阅内容生产者提供的Feed获取信息,从而实现用户之间互动联系。信息聚合的商机带动了中游服务机构的兴起,而中游服务环节的增值服务也极大地改变了信息消费者的阅读体验,丰富了服务链的内涵,强化了服务链的存在意义。

总体而言,国外在信息聚合服务的研究上主要侧重于信息聚合框架与模型构建,与此同时,探讨了技术方案,通过实证研究从不同层面推进了信息聚合服务的实现。

1.2 国内基于RSS的信息聚合服务的理论与实践进展

信息聚合服务的理论与应用问题也引起了我国的关注,国内学者围绕“信息聚合服务系统设计”、“信息聚合策略”、“RSS应用”等问题展开研究。其中,2009年,戴明陆分析了RSS技术在学术领域的应用现状,提出基于RSS的信息服务系统设计与实现框架[5];针对科技信息聚合服务系统设计和技术推进问题,张会娥等开发出基于RSS的科技信息聚合系统,为图书情报机构的情报研究人员、学科馆员及时了解和跟踪当前最新科技进展提供了帮助[6]。

在信息聚合服务的应用研究中,2008年,田昊通过对比中美两国图书馆RSS技术应用的情况,指出了国内图书馆在RSS推广、集成管理系统升级、信息服务拓展等方面应注意的问题[7]。季颖斐等分析了信息聚合模式与以往模式的异同,并探讨了RSS技术在高校图书馆工作中应用前景[8];刘策介绍了《华尔街日报》信息聚合服务的成功实践,针对我国新闻网站现状,提出利用RSS技术推动其自身发展的方案[9];吕建峰结合实例对RSS在体育信息聚合服务中的应用进行了探讨[10]。姜恩波认为信息聚合服务有在线阅读服务与客户端服务方式并存,中心化服务与分布式信息获取并存两种模式[11]。

图书情报界对信息聚合服务的理解主要集中在图书馆对专业学术网站、学术研究型博客、学术性网络文摘站点等利用RSS发布信息资源的网站进行搜集、整理、过滤、分类、利用,以RSS方式通过各种聚合工具,实现学术资源的聚合浏览。在图书馆信息门户提供专题信息服务,帮助广大师生和科研人员有效地跟踪相关学科的最新发展动态。通过调研发现,开展信息聚合服务的有厦门大学的图林网志聚合系统、上海大学的新闻聚合系统、电子科技大学的图林聚合系统。可以说,基于RSS的信息聚合服务在广度和深度上不断发展。

2 从信息聚合服务到社会化信息聚合服务的演变

社会网络环境下,聚合的用户对象由原来适用于某一用户群,甚至全体用户向完全根据个体用户的偏好来聚合信息的方向发展,因此更具有个性化。与此同时,信息聚合社会化发展,包括Blog、RSS、Wiki、Tag、Social Bookmark、SNS等在内的Web2.0的应用元素越来越丰富。但目前提供Web2.0服务的网站大多只提供Web2.0中某一类服务,如单独提供Blog、RSS或者SNS等,随着Web2.0应用的不断深入,基于Web2.0的信息服务将以上应用元素整合为一体的趋势越来越明显。随着互联网和社会软件的发展,学者们认为信息聚合不仅依赖于文本聚类,同时受社会情境和用户环境影响,因此社会化信息聚合研究逐渐受到关注。Richard Hall探讨了由个体学习者、学生团体、学生与教师、学术社区、实践社区所组成的虚拟学习环境,提出了用户广泛参与的、社会网络技术支持的信息聚合空间模型[12]。Sigvat Eide,Terje Kristensen通过知识地图、学习地图和学生地图,构建了一种网络学术社区的动态内容聚合模型[13]。德国汉诺威L3S研究中心的Fabian Abel,Ivana Marenzi等研究了基于社群的信息聚合策略[14]。

2.1 社会化信息聚合服务的发展动因

从聚合信息到聚合收发信息的用户,将信息高效聚合在一起是社会化信息聚合的结果,其目的是将关注社会化媒体的信息源与用户聚合起来。通过聚合,使得信息收发者不再孤立。充分发挥群体影响力的作用,以社会化媒体来会友,彼此间的关注增加了用户的成就感,使用户更容易坚持发送信息、接受反馈。在Web2.0环境下,用户信息消费模式表现为内容生产——社会化网络筛选——平台输出,在这一过程中,社会化信息聚合服务是关键,其产生的原因表现在以下几个方面。

2.1.1 信息消费的社会化

Web2.0环境下,信息消费既是信息获取与利用的过程,同时也是一种与他人互动、社会化聚合过程。信息消费中的群体互动是社会化发展的具体体现。信息消费的社会化聚合一方面意味着个人信息消费行为能够与他人的行为集合,形成强大的社会效应;另一方面,作为个体的网民,其信息消费行为往往不是基于个体的自主判断与选择,而是在社会氛围作用下的复杂过程。可以说,信息消费社会化意味着个体与社会之间非常密切与频繁的一种双向互动。

网络特别是Web2.0技术可以将个体能量聚合起来,产生强大的社会冲击波。这种能量聚集不仅作用于网络信息生产与消费,更是作用于网络社会与现实社会这些更宏大的系统,它们将影响到社会生态的变化,也会对社会文化的形成与发展产生不可忽视的作用。

2.1.2 搜索引擎的社会化聚合发展

互联网正经历从“个体”到“群体”的过渡,即将进入一个“人人时代”。长期以来,搜索引擎把页面信息通过算法、链接提供给用户,这种人和页面的弱连接越来越不适应社会化网络的发展。当前,搜索正在超越信息、超越页面、超越网站,实现人和应用、人和服务的连接性,通过人和应用服务的强连接来提升搜索引擎价值。具体而言,搜索引擎社会化聚合发展表现在搜索实现应用、服务的聚合。这种变化表现在从链接变成连接,用户所聚合生产出的信息不再是单一的、模式化的标准答案,感情和喜好掺杂进了他们的选择和活动中,网络和人的关系更亲密。因而,实现人与人之间网络的聚合,进而发展到人、信息、应用服务之间的关系网络,这是搜索引擎社会化聚合发展的关键所在。基于这种聚合理念,Facebook开发出Like功能,现在全世界有超过35万个网站安装了这种功能。如果你喜欢它们所提供的内容,你可以点一下Like,你所推荐的信息会即时储存在Facebook上[15]。

2.1.3 信息聚合服务的社会化发展

Web1.0时代,信息聚合服务依托各种互联网门户和搜索引擎汇集信息;Web2.0时代,信息聚合服务利用用户关系汇聚信息。在社交网络中,用户行为具有社会群体化的趋势,不仅希望将所喜好的信息聚合,更希望将志趣相投的用户联系起来,增强沟通和交流,聚合形成群体。当前,信息聚合服务使信息获取和利用变得高效、快捷和准确,成为当前重要的信息传播渠道和主流信息服务模式之一。但由于其不能有效地进行信息内容的质量控制,忽视了信息内容和用户之间的关系,也抑制了用户沟通、分享和情感需求。可以说,单纯的信息聚合服务已不能很好地满足用户的社会化需求。用户聚合形成的群体所产生的巨大影响力不仅是信息通过“群体关系”以快速乃至几何级数传播,加速知识信息的分享和创造,而且也满足了用户的情感认知需求。这意味着,在信息聚合服务组织上,应充分利用用户的群体交互关系,使之向开放化、社会化、协调化方向发展[16]。正是这种需求的变化,推动了社会化信息聚合服务的产生。

从信息聚合服务到社会化信息聚合服务的发展,这种变革源于Twitter和Facebook服务。Twitter的信息流聚合方式在很大程度上代替了RSS阅读器的功能。而Facebook让社会化聚合应用逐渐普及。社会化信息聚合服务通过对信息背后的人的筛选来过滤信息,提供了一种解决信息过载问题的可能。

2.2 社会化信息聚合服务的应用现状

2003年以来,互联网上出现了较多的社会化信息聚合媒体。目前,Twitter、FriendFeed、Google Reader已成为众多用户分享信息的主要渠道,但是在信息海量增长的情况下,信息过载成为一个较严重的问题。用户已经有了太多信息的聚合和分享渠道,而信息的过滤与筛选成为一个更加有价值的服务。基于Twitter和Google Reader的社会化挖掘功能,可以发现大家关注的热门信息,也让用户通过较少阅读时间获取更多有价值的信息。通过调研当前热门的社会化信息聚合服务网站,可以看到社会化信息聚合服务的基本功能和特征,如表1所示。

由表1可知,虽然社会化信息聚合服务在一定程度降低了信息生产成本,放大了信息供应量,但也存在信息源过少、分类管理以及商业模式的问题。目前,社会化聚合服务的核心还是内容的聚合和推荐,对信息共享背后的用户关联的挖掘不尽理想[17]。因此,聚合服务避免信息过载的关键还在于信息的过滤,过滤技术的成熟度将最终决定真实有效数据的整合度。本质上来说,一个具有以偏好为基础的推荐功能的过滤系统是社会化网络的未来[18]。

3 研究的不足与推进

尽管信息聚合服务实现了对相对离散、异构信息的整合开发和利用,但在发展中由于其固有的瓶颈,正在向基于用户关系的社会化信息聚合服务方向推进。

3.1 信息聚合服务研究的不足

目前的信息聚合服务更多的是依靠机器聚合推荐,其存在着固有的缺陷:(1)用户只能被动接受,不能主动控制聚合的具体内容,且订阅的信息不方便分类管理和维护。(2)根据用户个人喜好设置的信息聚合服务的准确性差,导致大量不相关信息的出现。(3)不能有效进行内容的质量控制。如聚合自己以及好友各种社会化服务的FriendFeed虽然能够在第一时间提高用户的信息获取效率,但当订阅源到达一定基数时,其机器聚合推荐方法无法对内容进行有效处理和筛选,再次出现信息爆炸,加重用户的负担。(4)用户订阅的信息只能供自己使用,无法实现团队之间的分享和协同合作,容易形成“信息孤岛”,且难以进行应用集成的扩展。

虽然国内在信息聚合服务技术、平台建设、聚合服务研究中不断发展,然而社会网络环境下的信息聚合服务研究尚缺乏系统性和普遍意义的成果,以用户群体交互需求为导向的信息聚合服务组织理论尚未形成,对群体交互行为机制和信息聚合服务组织模式缺乏可资利用的成果。未能揭示信息聚合服务的整体运行机制,当前研究成果大多偏重于应用信息聚合技术解决信息内容提供与服务组织问题,未能针对用户交互关系展开系统性的研究。

3.2 信息聚合服务的推进

3.2.1 用户群体交互机制及其对信息聚合服务的影响

SNS将沿着社会化关系(人与人之间的交流与分享),到社会化的机能和集群(社会化网络犹如操作系统,越来越契合用户的体验,提供个性化和精准的内容),再到社会化的智能商务(社会化的产品与服务)的道路发展[19]。我国目前的信息聚合服务在运行上仍然存在信息过载和用户社会化需求无法得到满足的问题。当网络逐渐成熟和用户对技术的新鲜感降低后,用户对服务的期望由“技术”逐渐转向“认知”。Web2.0的互联网本质上也是社会化的互联网,所要实现的便是服务的亲和力、可操作性、用户体验以及可用性,让用户获取信息的同时,建构自己的社会群体关系网络,所产生的社会化群体作用对信息聚合服务的拓展具有深远地影响。因此,信息聚合服务中应关注用户群体交互作用及机制、社会化群体交互作用对信息聚合服务的影响及其基于群体交互的信息聚合服务方式。

3.2.2 基于用户群体交互的信息聚合服务模式

信息聚合服务必将从信息聚合走向信息背后用户的聚合,利用用户群体交互的作用为用户更好的过滤推荐信息,通过群体的交流机制改善用户的服务体验,改善服务的质量。因此,信息聚合服务研究应从群体交互网络关系和价值实现出发,进行信息聚合服务的架构,按群体交互关系和机制,着重于信息聚合服务组织模式、技术实现模式和业务拓展模式的确立和优化。

3.2.3 信息聚合服务平台构建与服务推进

在Web2.0环境下,用户自发地或引导性地聚合在一起形成群体,不断辐射形成一张可伸缩的有机网络。基于群体交互的信息聚合服务是群体网络不断发展的结果,其服务平台的构成要素包括:活动(群体交互)、资源(信息与知识)和活动主体(用户)。平台构建和基于平台的服务推进研究内容包括:信息聚合服务平台建设中的技术规划;信息聚合服务平台模型及其应用;面向用户社会化发展的平台服务推进。

标签:;  ;  ;  ;  ;  

信息聚合服务的发展与演进研究_rss论文
下载Doc文档

猜你喜欢