博客信息自组织模式研究,本文主要内容关键词为:模式论文,组织论文,博客论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
所谓博客,简单而言就是个人以时间顺序所做的一种在线记录,可以用来发表观点、抒发情感、获取反馈、结交朋友甚至舆论监督等。从本质上讲,它是一种以个人为中心的交流方式,有可能开启互联网的个人时代、草根时代。目前,博客已经是Web2.0最普及的一项应用。据调查,截至2008年12月底,在我国2.98亿网民中,拥有博客的网民比例达到54.3%,用户规模为1.62亿人[1]。从目前情况看,博客信息组织模式可以概括为自组织与他组织相结合的混合模式。博客的信息自组织模式体现了Web2.0环境下信息组织的特点,其中一些方式方法还在一定程度上代表了网络信息组织的发展趋势。本文专门探讨其自组织模式。
1 博客信息空间的新特性
1.1 信息来源具有草根性和分散性
在博客信息空间中,普通网络用户能够直接通过博客为网络提供信息内容,从而成为网络信息的创建者,即信源。用户单纯的“上网”行为,转变为更积极更主动的“织网”。这就降低了向社会提供信息的门槛,打破了集中式的信息发布和传播方式,颠覆了Web1.0环境下一般由正式的商业性公司或公共机构充当信源的传统信息创建模式,信源开始具有了草根性和分散性。
1.2 信息内容及用户信息需求都呈现出浓厚的生活化、个人化色彩
从技术功能上讲,这一特点并非是博客所必然具有的。但从博客的发展实践来看,至少在包括当前在内的相当长时间内,大部分博客内容主要是博客作者对自身生活状况的记录,博客浏览者的浏览兴趣也主要在此。根据CNNIC2007年的一项调查,47%的博客内容主要为心灵独白或心情记录,41%为个人生活记叙,31%为兴趣爱好,20%为情感关系;博客浏览者常浏览的博客内容类别,排名与数据则均与上述内容基本吻合;关于浏览者浏览博客的原因,消遣、娱乐的因素以43%居榜首[2]。
1.3 交互功能被着重强调,用户将具有获取者、提供者、组织者的多重身份
博客强调用户的参与,任何人在博客信息空间中都享有自主创建、组织、整理、传播信息的权利,可以根据自己的喜好设置阅览的内容、设置首页的页面风格、与他人进行在线交流、对他人作品进行评论等。信道两端的信源和信宿也因此经常互换位置,每个用户既是信息的提供者,也是信息的获取者,甚至还是组织者。
1.4 信息形式大量呈现为“微内容”
“微内容(microcontent)”是Web2.0的一个关键词,也大量反映在博客信息空间中。它可以是用户所创建的任何信息数据:一则日志、一条评论、一幅图片、收藏的书签、喜好的音乐列表,新的朋友等等[3]。正是信源的草根化和突出的互动性为博客信息空间造就了大量微内容。
1.5 微观的个性化与宏观的社会性相统一
博客个体的个性化与博客整体的社会性是一个问题的两个方面。个性化实质上是社会性在微观上的特殊反映。由于创作自主性及交互性强,博客信息空间中的信息大都具有个性鲜明的特点。每个接受服务的用户都是自己博客的构建者和参与者,因此,构建出来的博客必然是个性突出、各具特色。同时,博客本身也是一种个人展示与交往平台,具有社会性软件的性质,它关注社会资本,寻求的是一种双向整合:一方面将互联网整合到我们日常生活中,另一方面,将日常生活整合到互联网中。它构建的是社会网络,这个社会网络包括弱链接、中链接和强链接,是个人性和社会性的统一。
博客信息空间的诸多新特性对信息组织必将产生深远的影响。认识清楚这些影响可能还需假以时日,当前可简单归纳为如下几点:(1)信息组织的方式将走向更具个性化色彩的自组织模式,用户将在很大程度上担当起信息组织主体的角色,并将根据自己的智力判断揭示信息之间的联系,或者说,用户智慧尤其是群体智慧正式成为信息组织系统的有机组成部分;(2)信息组织关注的对象将从Web1.0环境下单纯的“信息”向“信息与人(用户)的关系”迁移,信息组织将服务于社会交往的目的,助力用户以网络交互、交流的形式实现自身的人的社会性本质的充分生长、展开;(3)信息组织的过程将不仅仅是一种单纯的序化,或者不再是一种大一统的序化,还将更多地包含对信息价值的评估环节,更加强调价值的个性化、多元化,强调“秩序”的主观性、相对性;(4)信息组织的方法与新技术的结合将更加紧密,个性化推荐技术、机制将越来越重要。综上,需求决定功能,而功能依靠结构产生,由此,不难理解信息自组织模式是博客信息空间理想的信息组织模式。
2 博客信息自组织的主要方式
2.1 大众标注
博客用户可以通过大众标注方式揭示并与他人共享信息。大众标注的主要形式是使用标签(Tag)来标识博客的内容。标签是博客自组织信息的一种技术,因其灵活、开放、有趣、方便而广受用户喜爱,而且信息量越大这种方式越显得简洁、有效。目前很多博客网站都提供这种功能。所谓标签,就是用来描述信息内容的分类标识,一般一个标签就是一个自然语言词汇。总的说来,标签是一种新型分类系统,每个标签由用户自主创建,自由选择自己认为能概括信息内容的词汇作为标识语,不必遵从某一分类体系。如果结合ping机制(博客应用中一种让用户在博客上发布新内容时能够向另外一个信息系统发出更新通告的技术),标签技术就可以在第三方专用服务系统的支持下,实现跨系统间的信息分类聚合,使不同系统中的同一标签下的信息建立起双向关联。目前,网络上也出现了不少专门的标签搜索引擎。
标签的特点可以概括为:(1)自发性。每个标签可由用户自由创建和修改,都有一定的含义,是用户自己对信息的概括。这里进一步指出标签与关键词的区别,即关键词主要是基于原文内容的一种重点词汇的提取办法,而标签更灵活,不完全依赖于原文字。标签的出现,使得博客用户的角色从信息生产者和使用者进一步向信息组织者延伸,用户不仅可以生产和利用信息,还可以组织自己或别人生产的信息。(2)共享性。在大多数支持标签的网站上,用户可以访问任意同一标签标注的所有信息。换个角度而言,被标注的信息实际上是从不同角度对该标签的一种认识、一种描述。(3)服务于沟通的桥梁性。标签标注的信息,背后关联的是博客作者,由此,通过同一标签还可以带来志同道合的网络用户之间的联系与沟通,也就强化了博客的社会性。(4)动态自适应性。越受欢迎的信息总是被越多的用户用标签标注,使用频率越高的标签对信息内容的概括相对越准确。因此,从理论上讲,最受欢迎的信息和最能概括信息的标签渐渐地将脱颖而出,被更多的用户发现,从而满足公众的需要。
伴随着标签等信息自组织技术的出现,大众标注(folksonomy)诞生了。在Web2.0应用环境下,大众标注逐渐成为一种不容忽视的新型网络信息分类组织方法。大众标注就是用户自己使用标签对自建或他人创建的网络信息进行标注,以供自己或他人进行检索的一种网络信息组织方法。不同的博客网站在大众标注的实现上有些细微的差异,但允许用户自行使用标签或是给用户推荐标签,让用户标注感兴趣的网络信息内容则是大众标注的基本原理。用户是大众标注方法的核心。用户有没有参与信息组织是大众标注与传统网络信息组织方法的一个重要区分标志。大众标注突出的特点还体现在它不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。并且这种分类是平面化的,没有等级层次的划分,虽然它相对不够严谨,缺乏准确度,但是在博客中,这种平面延伸的分类方法却在无形之中成为方便、灵活、不受条件限制的沟通渠道。用户参与及其分类的自主性,保证了大众标注的低成本,直接促进了其在博客信息空间乃至整个网络上的迅速发展。当然,大众标注的不足也很明显。它分类的模糊、不精确和随意,限制了其使用范围。大众标注的组织对象目前基本上是非学术的、面向生活的、公众的,大都局限在博客等Web2.0应用站点的组织和管理上。另外,对垃圾标签和标签的合理使用目前还缺乏行之有效的解决方法。
标注自由度高是大众标注最具变革性的信息自组织特性。但这既是优点,也恰恰是造成其不足之处的内在根源。大众标注的发展目前处在从不受任何限制到向有一定限制的过渡之中,如何保持控制的适度是研究者们思索的问题。另外,大众标注与语义网、本体的结合研究,也逐渐受到人们的关注。
2.2 内容聚合
博客用户可以通过内容聚合方式动态聚集相关主题的信息。内容聚合是博客站点之间共享信息内容的一种简易方式,是基于XML规范的应用。其主要技术标准包括RSS2.0(Really Simple Syndication,真正简单聚合)系列、RSS1.0(RDF Site Summary,RDF站点摘要)系列、Atom和SSE(Simple Sharing Extension,简单共享扩展)等。现在,人们一般已习惯性地用RSS作为内容聚合的代名词,下文也遵循了这种用法。RSS分离了信息内容与展示,大大降低了信息合并、分析、展现的成本和难度,从理论上讲,那些任何可以拆分成离散元素的内容都可以通过RSS来整合。RSS聚合的信息一般是以信息摘要的形式呈现,包括标题、作者、来源、更新时间等,用户可以直接通过超链接进一步浏览到信息详细的内容。用户使用RSS的第一步就是需要一个RSS阅读器。RSS阅读器目前从应用形势来看主要有两类,即客户端形式和使用Ajax(Asynchronous JavaScfipt+XML,异步JavaScript与XML,俗译“阿贾克斯”)等技术开发的在线RSS阅读器。现在网络上还出现了许多RSS搜索和目录服务[4]。
内容聚合这种自组织方式的主要特点有:(1)实现了信息的个性化定制。信息获取者通过RSS或Atom,就不必直接去某个具体的博客站点或博客查找信息,而可以通过有选择地定制、订阅,将不同站点或博客的相关主题内容自组织在一起,享受一站式服务,并将与主题无关的内容拒之门外,有效节省了用户筛选、获取信息的时间成本;而对于信息创建者而言,RSS成为发布自己博客的渠道,使得自己的博客易于被计算机程序理解、摘要,并推送到对其感兴趣的用户。(2)体现了信息自组织的社会性。首先,博客大量采用RSS或Atom标准来对博客内容进行聚合,每个用户既是被动的信息获取者又是主动的信息提炼者,为形成一个个潜在的、具有相关主题的内容社区提供了信息组织手段,群体智慧在这里被集中,得到了交流和共享;其次,通过RSS订阅、重组和输出,大量用户间达成了间接协作,相似点越多的用户之间越容易达成这种社会化协作,这一过程让聚合的内容不断地被打破重组,构成了持续优化和改进的内容组织形式;最后,RSS订阅信息可以呈现出现实社会中的关注热点,而越是热点的RSS订阅越会吸引更多用户的订阅。(3)实现了信息自组织的实时性。RSS提供的信息是动态的,一般按照信息发布时间进行排序,保证了博客观点的最新汇聚,形成了真正意义上的实时Web。因为动态生成的不仅是网页,还包括超链接。(4)适用于追踪特定主题信息。从RSS的功能不难理解,RSS适合于对某个特定内容的持续关注。
2.3 引用通告
博客用户可以通过引用通告方式推送并聚集关于同一主题的讨论信息。引用通告是一种很重要的博客信息自组织手段,通俗地讲,它是一种在根据他人博客的内容做出了评论或者进一步论述之后,通知这个原始内容的作者,告诉他“我根据你的内容写了点东西”的技术手段。换个角度而言,它可以让博客知道有哪些人看到自己的博客文章之后写了与之相关的评论。更具体地说,当某人阅读了某个网站的文章,想对此写下自己的感想,这时利用网站准备的讨论功能进行投稿是很常见的做法,但这样只是把自己的评论意见写下来向别人的网站投稿,而你自己手里却什么也没留下;引用通告则与之有很大的区别,可以把评论写到自己的博客上,然后向刊载原始文章的服务器发送该网页的URL地址及博客的标题、部分正文和网站名称等。这一过程被称为“发送Track Back Ping”。通过这种办法,在原始博客处就留下了评论者的URL地址、标题等部分信息。别人也可以向原始博客发送Track Back Ping,所以在原始博客中就将所有的评论都集中记录了下来。这样,人们就可以在一个地方看到许多来自不同地方的针对某一个主题的讨论,博客之间也就通过引用通告根据相关主题,而互相连接起来了。这种对双向超链接的自主掌握,让讨论产生的信息在传播的过程中留下了路径痕迹,不仅方便了查找信息或知识的产生线索,还扩大了信息的影响[5]。
2.4 内容挖掘
博客用户可以通过digg(挖掘,即链接、评论)评论和推介信息。随着博客的发展,如何在海量信息中筛选出真正有价值的内容,如何让自己的博客被更多的人所发现、阅读,这些都成为问题,由此,就出现了“掘客(digger)”的概念。其实,掘客就是对文章投票及发表评论的网络用户,掘客站点则是一个文章投票评论站点。掘客可以随意在掘客网站提交文章,由阅读者来判断文章价值,收藏文章的人越多,说明该文章越受关注,也就是说,如果用户觉得文章不错,就可以digg一下,当digg计数达到一定程度后,该文章就会出现在首页或其他页面上。首页的文章由掘客们投票产生,这是digg的核心。因此,对于博客作者,掘客站点是一个推广的平台,把自己的文章推荐到掘客站点上,让更多的人浏览,并参与评论,既宣传了自己的博客,也让自己的观点让更多的人看到[6]。可见,digg使博客掌握了一种自主、简单的信息评价和推介手段。
3 结论
综上,所谓博客信息自组织,就是博客用户及用户群体以自身的智慧自主地、动态地、交互地揭示、关联、聚合、重组、评价信息。当然,Web2.0形态尚在不断变化发展之中,博客应用也在持续进化,其自组织模式仍需进一步完善,但在网络信息组织领域,一般而言,创新性实践总走在理论的前头,这一现象提示我们保持对互联网新技术新应用的敏感。传统信息组织方法与自组织之间能否互补、如何互补,值得我们进一步思考。
收稿日期:2009-05-07