Web2.0环境下的网络信息组织,本文主要内容关键词为:组织论文,环境论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 网络信息组织及其发展
网络信息组织是指利用一定的科学规则和方法,通过对网络信息特征的表征和有序化,实现无序信息流向有序信息流的转化,从而保证用户对信息的有效获取和利用。随着互联网技术的迅速发展和普及应用,网络信息已成为全球最大的信息资源库,且还在以惊人的速度增长,因而,网络信息资源的组织一直是相关领域的研究热点,其研究成果不断推动着网络信息组织方式的改变。时至今日,网络信息组织方式大致经历了三个发展阶段:
第一阶段,互联网处于发展初期,网上信息还不充足,以门户网站为代表的信息组织方式将足量的信息聚合在一起,满足了用户对内容的需求。这时候的网络信息主要是以静态HTML形式存在的,用户无法对其进行交互。
第二阶段,互联网的核心应用,这时期互联网的内容逐渐丰富,信息由稀缺变为过度,用户选择信息的成本日益增加,围绕搜索的SFO(Search-Find-Obtain)成为互联网的核心应用。同时,为了便于信息的发布、组织与用户的交互,就用动态HTML也就是通过各种CGI程序来发布。动态网页的出现带来了互联网信息组织方法的一次革命。但这一阶段与第一阶段都有一个共同点:信息存储在服务器上集中提供给使用者,不同用户的信息使用模式主要取决于所提供的信息,缺乏创造性和真正的信息个性化,这两个阶段的互联网被称为Web1.0。[1]
第三阶段,这一时期,进入了Web2.0时代。由于用户对信息的需求进一步提升,用户已经不满足于仅充当信息的接受者,他们需要有主动发布信息的渠道,成为信息的创建者,用户原创信息(UGC)成为互联网的重要信息来源,信息的创建和组织也因此被密切的联系起来,[2]以Blog、RSS、Wiki和Tag等服务为代表的原创、分众、互动信息组织方式满足了用户的需求,这就是Web2.0时代。
相对于“以浏览器为窗口,享受网站提供的各项应用服务”的Web1.0来说,在Web2.0环境下,基于 RSS/ATOM/RDF/FOAF等的XML数据不再和页面、网站混粘在一起,它们被独立了出来,并能够实现同步、聚合和迁移,通过对XML数据的处理,这些内容能自由组合,能被各种应用程序(不论是Web程序还是桌面程序)呈现和处理。[3]因此,Web2.0时代的信息组织方式较之Web1.0时代有了很大的发展。
2 Web2.0的信息组织技术
Web2.0是相对于Web1.0的新一代互联网的总称,是各种技术与相关的产品与服务的集成,其相关技术主要有:Ajax、P2P、开放的Web应用API、Blog、 RSS、Wiki和Tag等。尤其是Ajax,它的出现改变了传统的Web应用和编程模式,可以在不刷新整个页面的情况下动态地改变页面的数值,实现动态显示与交互、数据交换及处理。这样,使网络页面的使用像桌面程序一样,从而提高了数据传输效率,增强了用户体验。
在Web2.0的相关技术中,其直接应用于信息组织的主要技术是:Blog、RSS、Wiki和Tag等,它们都为网络用户提供了创建、组织、发布、更新和共享信息的开放式的技术平台,同时它们在管理信息方面又呈现各自不同的特色(见表1)。
表1 Blog、RSS、Wiki和Tag在信息管理方面的比较
总之,Blog、RSS、Wiki和Tag在管理网络信息资源方面具有各自不同的特征,但易用性、开放性、共享性、创新性、个性化和社会化是它们追求的共同目标。因而,Web2.0为用户提供了一个全新的信息服务平台。
3 Web2.0环境下网络信息的特征
Web2.0作为将互联网用户从信息接受者转变成为信息创建者、组织者和传播者,从受众转向主体,从单个个体转向社团的新型互联网服务模式与理念,在其环境下信息呈现出如下几个方面的特征。
3.1 信息创建——草根性、分散性和互动性
在Web2.0的信息系统中,大量的用户为网络提供信息内容,用户不仅是信息的消费者,同时也是信息的生产者,即信源。传统的信源一般是正式的公共机构或公司,如电台、电视、新闻报纸出版机构、门户网站等,Web2.0的应用降低了向社会提供信息的门槛,打破了集中式的信息发布和传播方式,信源开始具有草根性,同时信息的分布从物理上来说较之前更加分散,它可以分布在世界上任何一个网络可及的角落。由于信源信息的草根性和分散性,信息组织变得日益重要。[8]
Web2.0是一个读与写并存的互联网。一边是写,写的人活跃在各种各样的“节点”上,使用各种工具向互联网上传递着数字化的内容;一边是读,读的人活跃在各种各样的“主页”上,这里的“主页”已经不能简单的称呼为某个网站的主页,而是互联网上N个活动的节点的主页,一个“主页”上的内容,可能来自几十个节点,“主页”的编写者同节点的所有者一样,也在使用各种各样的工具,从节点读取内容,“主页”的编写者不仅创造内容,同时也收集和整理内容。由于网络是可读写的,用户的信息反馈可以随时进行,信息源同时也可以随时更新信息,也就是说网页与用户之间的互动关系由传统的“Push”模式演变成双向交流的“Two-Way Communication”的模式。[9]因而Web2.0采用一种鼓励用户的参与和贡献的架构,改变了以往那种“只读”的属性,将网站变成可读写的服务,用户信息需求的参与互动性就更加明显。
3.2 信息构成——微内容
微内容是Web2.0的一个关键词,它指的是对一些至少拥有一个唯一的编号的、在网络上至少拥有一个唯一的地址的以及那些只含有极少中心概念(而这些中心概念的数量通常为1个)的元数据和数据的有限的汇集。[10]微内容包括个人所形成的任何数据:比如一则网志、一个评论、一幅图片、收藏的书签、喜好的音乐列表、想要做的事情、想结交的朋友等等,Blog就是微内容的代表之一。Web2.0强调用户参与的特性引来微内容的大量出现,每一个个性网络用户每天都生产众多的微内容,也消费着同样多的微内容。虽然传统互联网模式也产生微内容,比如论坛的发言和回复等,但这些内容相对于外界是封闭的,无从谈起重新组织和利用,微内容的重用性是指可以通过一定的标准(如XML)来结构化这些微内容,并通过开放的接口(如开放的API)来提供工具无关性的调用。微内容的普及会带来网络内容的去中心化,而同时,网络上的内容变成一个整体,一个生态系统,不是仅仅一个孤岛。[11]
3.3 信息活动——以用户为中心
Web2.0的信息活动是围绕用户开展的,它是以用户为核心的互联网。用户在互联网上参与内容创造,而不是作为被动的客体,他们贡献内容,传播内容,而且提供了这些内容之间的链接关系和浏览路径,从而更好地变革互联网的内容组织和信息传播,创造关联性和社会性。在Web2.0中,“人”的作用被提高到了前所未有的高度。Web2.0鼓励用户用最方便的办法(Blog)发布内容,通过用户自发的相互链接,给这些看似凌乱的内容提供索引。由此,互联网逐渐从以关键字为核心的信息的组织和阅读方式,过渡到以用户个人的portal(SNS)或者个人的思想脉络(Blog)为线索的阅读方式。[12]与此同时,互联网内容的生产不再仅仅局限于各大门户网站,每个人都可以参加信息内容的创建,也就是说在Web2.0环境下,人人既是信息的阅读者,同时也是信息的发布者、组织者、传播者、修改者。当然,个人并非是孤立的,而是彼此相连的。
3.4 信息用户的社会性
Web2.0强调用户参与,并且以人为中心,人就必然会产生社会性的需求,信息用户希望自己被周围亲近的朋友们关注,期望把自己所知道的或自己拥有的与别人共享和交流,也就是说,用户希望能够自由的借助内容媒介,创建起一个个的社群,发生各种社会性的(网络)行为。Web2.0的社会性的特点正好满足了用户的这一需求。
Web2.0将“六度分隔”理论应用于信息传播,并通过“社会性软件”的方式实现,社会性软件的核心思想其实是一种聚合产生的效应,它把人们更多地吸引到网络上来,人们会花更多的时间加入到网络社会中去,通过软件的支持建立更加互信和紧密的社会关联,产生一个可信任的网络,避免了互联网的虚拟性,使信息与人的联系更加可靠,更切合于实际。
4 Web2.0环境下的网络信息组织方式
4.1 分众分类
Web2.0环境下的信息分类采用的是分众分类。分众分类(Folksonomy)是Thom as Vander Wal创造的新词,目前关于分众分类这一概念的定义还没有完全一致的意见,现今网络上普遍采用的一种定义是:分众分类是“群众”自发性定义的平面非等级标签分类,[13]是一种使用用户自由选择的关键词(即Tag)对网站进行协作分类的方式,它反应的是整个社群的群体意识倾向和知识背景,具有不同成员结构的社群对同一网络内容就可能形成不同的元数据标签。基于这种关键字的分类,可以凸显出社群成员关心的热点信息,形成一个特别适合本社群成员特点的信息分类体系。分类的原理是向社群参与者提供一种协同构建与共享各自网络资源标签的开放式平台,通过用户自己制定分类标准和提交资源标签来实现。[14]分众分类与传统网络信息分类方法最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。[15]这种分众分类的管理模式可以适应同一用户对各类资源的不同需要,也可以适应不同用户对同一资源的不同需要。
在Web2.0中,分众分类的实现工具是Tag。Tag的自发性使得用户可以根据自己的兴趣和需要随意地对资源进行不同的分类管理,使互联网从以关键字为核心的组织方式和阅读方式过渡到以个人的思想脉络为线索的组织方式和阅读方式。Tag从形式上看是细化的碎片,但是在信息的人际传播过程中,却由于其社会化效应表现出连续性和共性。它使互联网信息变得更为有序,更贴近互联网用户的个人感受及情感体验。它不是机械分类的排序,而是更富有人性化的秩序。因此,Tag不仅仅是一次信息分类方法的改变,同时也代表了网络传播行为和传播方式的革命性进步。[16]
4.2 信息自组织
耗散结构理论认为,自组织系统的产生有4个前提,即系统的开放性、诸要素远离平衡、要素间非线性相干及存在涨落。[17]网络信息自组织是指网络中的信息由于用户与用户之间、用户与网络其他要素之间的交互性、相关性、协同性或默契性而形成特定结构和功能的过程。也就是指信息网络无需外界指令而能自行组织信息,自我走向有序化的过程。它是根据信息网络自身运动的变化规律和特定条件而自发形成的。[18]
传统的网络信息组织方式是具有现有分类体系的他组织,在相对固定的模式下来填充相应的信息,新产生的信息多作为对原有体系的补充,整个体系结构具有相当的稳定性,群体性的烙印在传统网络信息组织中非常明显。而在Web2.0环境下的Internet是一个复杂的自组织的信息系统。首先,它是一个开放的系统信息系统,任何人都可以在网络上发布信息,使信息组织和流通从他组织或被组织向自由、从下而上的信息生产方式转变,系统时刻与外界交换能量与信息;其次,信息在空间分布上是不均匀的;第三,它具有海量分散的信息及一个非线性的信息结构;第四,信息在时间运动中是单向的,信息的扩散与散布在本质上都是不可逆的;第五,信息一直处于动态发展变化之中。[19]
在Web2.0中,从个人网站到博客,从在线大英百科全书到维基百科站点,从门户式的标题目录到个性化的标签,无不体现着信息自组织的特征和功能。用户能根据自身使用网络信息的习惯和偏好性需求来选择性地实现信息的单项主动传递,并利用现有的信息定制工具,明确信息与自身价值判断体系的耦合来实现信息的获取。[20]另外,Web2.0通过某个主题把用户联系起来,用户之间通过开放式的信息沟通方式分享、互动,建立一定的人际关系,依据某些共享的规则协作推动互联网从无序变为有序。如Wiki的写作者在其技术的帮助之下会构成一个社群,每一个维客都有自己关注的经常参与浏览、编辑的数个话题、条目,围绕这些话题条目的变化,在维客中就形成了一个个小的社群。同页面的内容一样,Wiki中整个超文本的组织结构也是可以修改、演化的,系统内多个内容重复的页面可以被汇聚于其中的某个,相应的链接结构也随之改变,[21]这就使得这个庞大而杂乱的项目有章可循。
总之,在Web2.0环境下,以自组织为中心,个人与个人之间,个人创造的内容与内容之间,以及个人汇聚的群体与群体之间,都是以不同的自组织方式架构起来的。以自组织的方式让人、群体、内容和应用等充分“动”起来,力量得到了最大程度爆发。[22]
4.3 垃圾信息过滤
Web2.0的互动性、社会性和用户的自主性带来网络内容的极大冗余和垃圾的产生,例如某个Blog上出现的文章会被其他用户转载到很多的地方,而这些重复的内容只要用户不干预,则会随着网络而存在。对网络内容的整理和组织的需求,促使一些以网络内容过滤或者组织服务为核心的网络公司的出现,如 RSS。RSS服务及时将信息加以过滤和筛选(RSS阅读器软件可以完全屏蔽掉所有用户没有订阅的内容以及弹出广告、垃圾邮件等令人困扰的噪音内容),在专项化的基础上进行整合传播,RSS技术独具的个性化“聚合”特性,可以为受众提供多来源信息的“一站式”服务,这种新颖的资讯传播方式提高了受众的信息利用效率,也减少了“信息爆炸”带给受众的茫然。[23]
4.4 知识组织
知识组织是指对事物的本质及事物间的关系进行揭示的有序结构,即知识的序化。通俗地说,知识组织是对知识客体所进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法,[24]它包括了主观知识 (隐性知识)的组织和客观知识(显性知识)的组织两个方面。
Web2.0环境下的知识组织主要体现在:(1) Web2.0通过改善知识组织环境、加强信息用户之间的互动性来提高知识组织水平。(2)Web2.0信息传播以微内容为基础,对知识的内涵进行认真细致的分解,以便消除由于知识的默会性和产生梯度引起的障碍。(3)Web2.0建立了一个大众信息传播平台,着眼于用户个体的特点,并以用户需求为导向,将个体交流的信息内容进行整合,如:知识的分类使用Tag技术,它以最松散的方式给用户提供了最细致的分类方式;Wiki运用集体的智慧对知识进行整合和创新;SNS激发了用户的自我操作和相互交流能力;开放的Web应用API环境,使用户的创作力得到最大的激发。这些对于实现从隐性知识到显性知识的转化有莫大的好处。
5 Web2.0环境下信息组织的未来发展方向
Web2.0的出现给我们带来了全新的网络体验,但同时也要看到Web2.0作为一个新生的事物,对互联网带来很多新的问题,例如大量的垃圾信息的产生,用户隐私受到威胁,个人发布的信息内容真实性,过度的自由及自组织造成Web2.0的低效化等等。因而,未来的信息组织还需要在下面几个方面进一步拓展。
(1)信息的深层挖掘。由于Web2.0的用户水平参差不齐,在Web2.0引起全民的草根狂热之际势必会产生过量的无价值的垃圾信息,同时,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,信息组织不光要把信息整理得有序化,还应该重视信息的深层挖掘,对信息内容价值进行判断和衡量,按价值量的高低对不同信息作不同处理,从而提炼出对用户最有价值的信息。如国外有一些网站,只要你把Blog的网址输入,就可以估测出某个Blog的价值。通过判断Blog评论的质量和数量以及相关性、订阅的数量、流量等数据,能够对其价值作出大致的判断。
(2)信息的深度互联。Web2.0因其强有力的技术支持,为数以百万甚至数以千万的信息孤岛提供强大的互联工具,但并没有完全解决各种不同信息源之间的深度互联问题。以Blog为例,Blog虽然有搜索的功能,但范围一般局限于该Blog的服务器上的网页,各个Blog之间没有形成真正的网络和关联,未来的互联网Web2.0应该提供更为先进的技术,使得全文检索服务可以轻松的嵌入到各种应用中,通过关键词将各种内容之间实现更丰富的关联,从而为用户提供全方位、快速准确的信息服务。
(3)Web2.0和语义网的结合。语义网(Semantic Web)和Web2.0是Web发展的两个不同技术走向。语义网的目的在于发展一种语义描述框架,通过这种语义描述框架将信息描述成一种机器可以理解的格式,当信息被组织成及其可理解后,人们就可以通过计算机软件和网络系统来处理信息,并将各种信息整合起来,组成一个结构严谨的知识库。Web2.0与语义网的结合,让机器自动识别和过滤信息,这对Web2.0的信息环境显得尤为重要。
收稿日期:2007-06-07