网络世界的信息组织_人与人之间的联系论文

网络世界的信息组织_人与人之间的联系论文

网络世界的信息组织,本文主要内容关键词为:组织论文,世界论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

知识的利用问题是情报学产生的深层原因,情报学一直以来所追求的目标就是:解决知识问题,使人类正在增多的知识得到更为充分的利用,因此情报学可以看做是解决人类知识困境的学科[1]。网络时代我们面临怎样的知识困境呢?网络信息爆炸,各种新信息媒体或新信息形式层出不穷,网络信息技术所带来的直接后果是信息的来源和产生、描述和揭示、整理和加工、控制和重组、存储和提取的系列过程和方法发生了根本的改变,很多学者认为如何帮助用户在网络世界中发现知识、获取知识和利用知识成为今天图书馆学情报学研究的核心内容[2]。

网络世界众多的信息问题中信息组织是核心问题,信息组织可以解决社会信息资源的有效控制与管理、有效开发与利用问题,在网络世界中发现知识、获取知识和利用知识都与信息组织直接相关。因为信息组织问题在网络世界中有如此的社会价值和社会需求,它已经成为极具活力的学科领域,吸引了软件生产、数据库设计与研制、人工智能、超媒体、数据仓库、可视化研究、办公自动化、计算机科学、知识工程学、现代语言学、认知心理学等等很多学科和学科领域的关注,有学者认为这使信息组织有了社会化的特点[3]。图书馆学情报学如何对网络信息组织问题提供解决的理论、方法和工具,成为影响学科未来发展的重要问题之一。

1 网络世界信息组织的挑战和目标

1.1 信息组织环境的变化

信息组织使图书情报领域的理论和实践面临着有史以来最严重的挑战,这主要是因为信息组织所面临的环境在今天发生了很多的变化,信息来源,信息组织的主体,信息组织的对象,信息组织的工具、技术和方法,信息组织的结果呈现,甚至信息组织的目的——没有一样保持不变的。

(1)信息来源的改变。在过去,社会主要的信息来源是传统的学术出版系统和报纸电视构成的大众媒体,今天,网络资源极大丰富、使用方便,并且能够超越时空快速传递,Google、百度等搜索引擎提供了强大的获取信息能力,层出不穷的新类型的信息引起了大众的兴趣,加上数据库生产商能够提供相对高值的信息,网络很快成为人们获取信息的首选渠道,就是图书馆自身也很快成为通过网络传递信息和服务的机构之一。网络世界主要的信息来源是由政府、商业企业、研究机构、教育机构、社会组织等形成的各种社会团体以及网络上每个普通的社会成员;信息内容从高质量的权威研究信息到数字化的图书报纸,从社会时事到小道消息,从学习资源到娱乐游戏应有尽有。

(2)信息组织主体的改变。由于信息提供的社会化特点,信息组织的主体自然也由图书信息专业人员变为网络世界中提供信息的社会团体和普通的民众,因为他们需要以某种方式发布信息,也需要对自己的网站或数据库中的信息加以管理和提供用户利用。而互联网团体如W3C、大品牌信息技术公司如Google、图书馆组成的联盟如OCLC等,共同形成了信息组织技术和信息内容规范的制订者和推动者。

(3)信息组织的对象和信息组织结果呈现方式的改变。信息组织的对象变为多种多样格式和形式的数字化的信息,信息组织的结果需要呈现给普通的利用者,因此需要大众化、易于理解,还需要实时、可交互、可视化等。

(4)信息组织的工具、技术和方法的改变。因特网信息主要以一个个网站形式出现,各种不同的网站内容生成工具和技术丰富多彩且不断创新,网站本身也在不断产生新的类型,政府网站、教育机构网站、学术团体网站、商业企业网站、社会机构网站、新闻网站、娱乐网站、行业网站、博客网站、视频图片分享网站、社会网络网站、其他Web2.0网站等等层出不穷,网站组织采用的编程和查询语言、接口技术、链接方式、支持工具和信息组织方法也因此产生令人炫目的变化。

可见,信息组织活动已经渗透到社会的各个行业、各个领域,由于业务工作的需要,各行业、各领域都有不断加工处理本领域各类专门信息、开展信息存取服务的业务工作,信息组织的方法和技能也即将成为他们的业务技能中重要的一种。

1.2 信息组织的目标

传统的信息组织是指采用一定的方式将大量的、分散的、杂乱的信息经过组织、整序、优化、存贮,形成一个便于有效利用系统的过程。这种信息组织的目标是建立一个科学的管理体系,让信息有序,让每一份信息能够在这个体系中有明确的位置,便于用户查找和利用。传统世界里有图书馆和信息专家们一直的辛勤劳动,完成社会赋予他们组织和管理信息的使命。当人们需要信息的时候,他们会依赖图书馆去获得所要的,同时图书馆员们在图书馆这个公益性、服务性的信息环境中愿意帮助需要信息的人。

在网络世界里追求建立一个科学管理体系的目标,应该说这是图书馆员和信息专家的理想。信息社会最终要形成的一个泛在的知识环境和全球化的数字图书馆目标,可以说相当于这样一个科学的管理体系。然而,在传统世界里,生成的信息会集中在图书馆和信息中心加以管理,尽管生产的信息数量庞大,但是有全球的图书馆员协作共享,通过联合编目的方式按照他们制订的全球性的文献管理规范,成功地管理着纸质媒介的信息。而在网络世界里,生成的信息无处不在、数量更多、种类繁杂,虽集中于网络上但即使通过搜索引擎也只能找到其中的一部分,图书馆员和信息专家目前还没有能力建立从前那样的信息管理体系。这是因为:(1)信息的产生源很多,不需要中间环节就可以在网上生成;(2)图书馆和信息中心无法拥有和获取全部的网络资源;(3)他们还没有掌握统一的实用的网络信息的管理标准,无法再像从前一样提供人们精确的信息和完善的信息服务。此外,网络世界的信息组织除了考虑信息管理的科学有序外,还要承载更多的内涵,比如用户的参与和交互、大众的可接受性和喜爱程度等。

实际上,因为网络世界信息来源、信息组织的主体、对象、工具、方法和技术都发生了变化,网络世界的信息组织已经不是图书馆员和信息专家的专门领域,图书馆、搜索引擎公司、数据库商以及作为网站拥有者的政府、商业企业、社会团体和个人都在组织和管理着他们手中大量的数字信息,同时他们中的一些人也试图对分散在网络上的其他人的信息进行各种组织和管理的尝试,他们当中的多数人信息组织的专业知识相对而言是匮乏的。但是从另一方面看,人们对信息和知识的需求和利用的本质是不变的。因此,笔者认为建立网络世界信息组织的一个科学、有序的管理体系仍然是人们追求的理想,但是因为这个目标实现的复杂性程度,可能会有新的角色、新的模式、新的行业来共同实现这样的信息管理目标,其中图书馆学情报学的信息组织知识将被继承。图书馆学情报学需要用发展的视角分析基于网络技术的信息组织特点,建立网络世界信息组织的理论、方法和技术规范。有学者提出要用大图书馆学的思维来组织信息[4],将因特网看作是一个大的图书馆,其中包括形形色色的虚拟图书馆、大大小小的数字图书馆、数不清的信息数据库,用图书馆的分门别类、井然有序、规范统一的思路来对互联网信息进行资源整合、组织和管理。也许这是图书馆学情报学的信息组织这个专长在未来得到社会广泛认可和全面发展机会。

从信息组织的目标看,尽管人们一直在努力,但要建立如同纸质媒体信息组织体系那样理想的网络信息组织体系,条件还不成熟,所以应该说目前网络世界信息组织的目标是建立一个良好的信息环境,让用户能够在其中方便地获取信息[5],而这方面的尝试在网络世界中可谓丰富多彩。

2 网络世界中的信息关系

形成良好信息环境的重要因素之一是网络信息组织和信息结构,而信息组织和形成信息结构的关键是深入理解网络世界的信息关系,处理好人与信息之间的联系。

2.1 信息组织的关键是深入理解人与信息的关系

信息组织问题过去只是图书馆员和信息专家们的问题,由于网络世界对信息组织的上述影响,这个过去只是少数人的专长变成了很多人的需要,这是信息组织走出我们的专业领域成为大众化知识的原因。

信息组织的目的是为了人的使用,信息只有与人联系起来才有存在的价值。所以,无论信息以什么样的形式出现,信息组织的关键就是深入分析信息与人可能产生的各种关联,实质上是对各种信息关系的分析,这种关系包括人与信息、信息与信息、人与人之间的关系。把握了关系,根据对关系的理解来建立信息组织的模式,信息才能被有效地利用。同时信息的重组和提取的核心是信息的表达和信息元素之间关系的再现和信息关系按照需求的重新组合。

(1)人与信息的关系即人与信息可能的联系方式

人有信息需求、要获取信息、使用信息;人需要哪些信息,如何获取信息、怎样使用信息是分析的入口。比如人需要的信息有已知项目的需求和已知领域的需求,获取已知项目信息是通过外部特征的信息检索,获取已知领域的需求通过主题或者学科门类。人们通过周围人、图书馆、出版社、大众媒体、互联网等多种方式获取信息。针对人们信息的需要,我们对用户可能需要的信息特征加以描述,对信息的主题加以确定,对信息所属的学科门类加以划分;在渠道方面我们通过建立非正式交流渠道、通过图书馆收集管理信息,通过出版社、大众媒体、互联网组织和提供人们需要的信息。网络世界里,人获取信息主要有三种方式,即浏览、搜索、询问。对于浏览的方式我们提供分类浏览的信息结构和专门的门户网站综合集成的信息;对于搜索的方式我们提供的搜索框和专门的搜索引擎网站;对于询问的方式我们提供实时咨询、用户自助和专家帮助。这些任务可以说都建立在对人与信息关联的重复理解基础上。

(2)信息与信息的关系有形式上的关联和内容上的关联

形式上的关联就是相同类型的信息之间的关联,内容上的关联就是相同属性的信息之间的关联,这种关联体现在信息组织上表现为信息之间的排列和组合形式。图书馆学情报学对信息的排列组合形式有很多的研究成果,比如由信息构建创始人沃尔曼提出的LATCH方法,即按照位置、字母顺序、时间顺序、类别和层次组织信息的方式[6];Louis Rosenfeld和Peter Morville提出的网站信息的精确组织方式和模糊组织方式,精确的方式包含地理位置、时间顺序、字母顺序组织方式,模糊方式包含按主题、面向任务、特定观众、隐喻驱动和综合性组织方式[7];国内学者孟广均提出的语法、语义、语用方法,即按照信息的形式特征如字顺、代码、重量等,内容特征如分类和主题,效用特征如权重值、特色、重要程度等组织信息的方法。此外,信息所反映的概念还体现了信息之间的相关关系、等同关系、包含关系、应用关系等。

(3)人与人的关系在此指人与人之间通过信息建立的关联,这种关联还可以扩展到群体与群体之间的关联

人与人的关联有多种反映,过去在纸质媒体时代我们所研究的非正式交流过程可以说是研究人与人信息联系的一种理论,这种关联如果反映在文献上,表现为文献之间的相互引用关系;而在网络时代,人们应用小世界理论、六度分隔等理论来探讨人与人之间的信息联系,在Web2.0理念被网络普遍接受的今天,Web2.0网站通过用户在现实世界中的关系网络和他们对内容的筛选过滤来形成人与人以及信息与信息之间的关系,通过软件系统的方式将人的共同兴趣爱好、共同的看法等天然的联系加以强化,将个人对信息的认识加以分享并按照众人认识的统计特征加以显示(如Tagging)或者按照众人的认识对信息加以区分(如Folksonomy)。这种做法解决了现实环境和过去网络环境所没能有效揭示的信息关系,因而受到了很多人的推崇。Web2.0时代因此还带来了一个新的研究领域,即社会媒体(social media)的研究。所谓社会媒体是指人们用来共享内容、判断、经验、观点和媒体的在线的技术或实践。社会媒体有很广泛的应用,维基百科、Facebook网站、YouTube网站、博客、flickr网站等都是具有社会媒体性质的网站。据Alexa网站的数据分析,全球10个顶级网站中的5个都是社会媒体性质的网站[8]。社会媒体的实质是通过技术手段来满足人与人分享信息的要求,其信息组织的方式也由人与人之间可能联系的方式再结合网络的特点、技术的支持程度来形成。社会媒体反映了人与人共享信息的特性,这是网络世界的一个重大特征,社会媒体的研究也有望成为新的网络研究热点。

上述三种关系往往不是孤立存在的,从上面的分析可以看到,它们彼此之间的界限也不是绝对的,而且人与人、信息与信息以及两者之间在现实中存在错综复杂的交叉、组合的联系。以分众分类(Folksonomy)为例,分众分类是网络信息用户自发为某类信息定义一组标签进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法[9]。Folksonomy有三个组成部分,即资源、标签和用户,通过它实际上可以形成三个可供连接和查询的网络——用户网络(人与人)、资源网络(信息与信息)和标签网络(人与信息),三个网络之间彼此相互作用。

从网络世界信息组织的发展过程看,学术界对信息组织研究一贯比较强调反映信息与信息之间的关系,这方面有不少有价值的成果。比如有学者对信息与信息之间的关系总结了记录知识单元间关系的目录关系,反映文本结构、引用关系和超链接关系的文本内外关系,词表中的主题关系以及相关关系[10]等。但笔者认为,网络世界的信息组织除了强调信息与信息之间关系的揭示之外,还比较强调信息与人的关系,强调人如何与信息交互,交互过程中的感受,强调人与人彼此的关联,继而强调用户中心的理论,按照用户的需要组织和整合信息。

2.2 对信息关系的理解和揭示往往带来信息组织的创新

(1)对人与信息间关系的重新发现会带来信息组织的创新

从信息组织方式的发展过程来看,信息组织的每一种创新都出现在对人与信息间的多种关系进行重新发现并通过某种媒介把这种关系作为一种线索提供给用户的情况下。比如引文索引是通过被引文献把引用它的文献和引用它的所有人链接起来,通过索引形式提供给用户,开创了信息组织和检索的新领域,同时由于引文关系能够某种程度上反映科学文献的价值,引文索引还在世界范围内被采纳成为科学评价的工具之一;Tagging是通过人所提供的标签把网络资源关联起来,通过网站提供给用户;分面分类是把事物不同方面的情况关联起来,通过分类号和网络呈现方式提供给用户。

在网络世界中,通过深入分析信息之间的关系而带来网络信息服务创新和应用的实例很多,典型的例子有政府网站。以新加坡政府网站为例,1999年新加坡政府门户网站为公民组织政府的信息服务时,采用了“从摇篮到坟墓”的分析逻辑,将每个人从出生到死亡的整个生命过程中可能需要与政府打交道的事情都列举出来,然后进行细分归类,将政府信息和服务划分为商业、国防、教育等14个模块,政府门户网站的电子公民中心就按照这14个模块组织公民所需要的信息和服务[11]。

(2)对信息多维关系、多重属性的全面揭示是网站信息组织的优势

网络世界里由于虚拟技术改变了资源存取的物理限制,数字资源的超链接方式可以将同一份信息进行多种角度的排列组合,这提供了在同一站点时空内以多种方式整合网络信息的可能性,对信息之间的多维关系进行全面揭示可以帮助用户从多个角度接入信息,满足了用户多种需求,极大地方便了用户,在提高了信息被利用的可能性和利用效率的同时,也提升了网站本身的可用性。

以美国政府网站为例,美国联邦政府门户网站[12]可以说是对信息多种关系全面揭示的典范,全站点就是一个由多种信息关系组合和关联起来的一个完整的、精细化组织的信息集合体。该网站的信息组织特点表现在:①网站首先以面向用户、按用户类型划分信息为主要的信息组织基调,将信息划分为四个频道即公民入口、企业和非营利机构入口、政府雇员入口和美国来访者入口,体现了网站信息组织的用户中心思想。②网站对每一个频道的用户以及每一种类型的用户都只是提供按照他们与电子政府交互所需要的主题来组织信息,而不是不管对谁都提供同样主题的政府信息,体现了政府信息组织的个性化、精细化、全面性的特点。比如对于美国公民提供普遍性的主题服务包括健康和营养、国防和国际、工作和教育、公共安全和法律等等。而对于公民的下一级类目——作为父母的美国公民,提供了两种信息组织形式:一是父母关注的一般主题,专门提供儿童保育、儿童赡养、父母关注的教育问题、父母关注的健康问题、父母关注的安全和犯罪预防、青少年雇用等主题;一是不同年龄阶段和不同类型的父母的特别主题,提供未来的父母、领养父母、婴儿和学龄前儿童父母、小童父母、青少年父母、年轻的成年人父母、养育第三代的祖父母等主题。③网站尽可能提供全面的信息组织模式,作为政府信息的辅助查询入口,比如网站全站点提供按政府部门类别即行政部门、立法部门、司法部门,按政府级别即联邦政府机构、州政府机构、地方政府机构,按政府部门名称的字母顺序组织信息和服务。④全站点的索引页面将网站全部的信息都组织整合在一起,提供全面精确的信息查询入口。该网站的站点索引含有网站所有页的名称索引、政府机构和部门名称索引、公民所需要的信息主题索引、访问者分类索引、在线服务名称索引,这是精确到网站每一页的信息组织形式,网站所有的信息、主要的查询入口都通过这个索引得到了体现。

(3)对网络资源的文本对象和实体对象的语义控制必然要求对他们之间关系的揭示

精确的信息组织和获取需要通过词汇的语义关系建立知识体系,在文本对象和实体的描述阶段建立一定的推理机制,在检索阶段便可以形成知识元素之间的关系链接。因此在文本和实体描述时要反映事物的特征和关联,要注重知识元素之间的关联,使用“对象-属性-联系”便成为网络信息组织中对象描述的基本方法,这种情形表现在元数据和机读目录都增加了关系元素或字段,资源描述框架RDF中也使用“主词-谓词-宾词”的形式来表示一个资源对象、一个陈述和若干个地址或联系[13]。

3 网络世界如何发现和组织信息

我们从资源构成的三个层面,即内容层面、网站层面和网络层面来分析。

3.1 内容层面信息的组织和发现

网络内容的信息获取目前主要依靠信息浏览和搜索引擎,用户可能浏览的信息数量有限,而搜索引擎带来的问题是信息量大、相关程度参差不齐、检索的精确度不高。搜索引擎信息组织模式的前期处理成本低、用户获取成本低,但是获取信息的后期处理上用户所花费的时间成本高。对此问题,网络世界已经着手解决,理论和实践工作者们提出了用知识本体、元数据、置标语言,提高信息内容形式化程度;用分类法和主题词表,自动标引和自动分类,提高信息的语义控制水平等方式,来保证网络信息内容有更完善的形式和更严密、规范的语义关系[14]。然而,如何将这些理论和技术推向实用、前期处理由谁进行、如何控制处理成本、用怎样的模式来保证网络上广泛产生内容的形式化和语义控制水平等都仍然是需要探索的问题。此外,在Web2.0网站,微内容成为重要的概念。所谓微内容(microcontent)是指用户所生成的任何数据,比如一则网志、评论、图片、收藏的书签、喜好的音乐列表、想做的事情、想去的地方、新的朋友等[15]。Web2.0产品和服务可以看做是服务于用户个体的微内容的收集、创建、发布、管理、分享、合作、维护的平台。微内容信息的发现和组织以聚合内容(RSS)、共享标签(Tagging)、分众分类(Folksonomy)、社会网络(SNS)为基本特征,通过借助用户的贡献、社会大众的力量来实现资源的共享。

3.2 网站层面信息的组织和发现

网站层面的信息组织和发现主要依赖信息构建和界面信息资源整合来实现。

在网站层面有效地发现和组织信息需要用信息构建的理论和方法来加以指导。信息构建作为组织信息和设计信息环境、信息空间和信息体系结构,以满足需求者的信息需求的一门艺术和科学,在万维网网站的信息规划和设计方面作用显著。信息构建讲求信息表达的科学性和艺术性的结合,讲究将信息内容以清晰、美观、易用的方式提交给用户,提倡为用户提供优化的信息结构。通过信息构建的实施,从对信息处理结果看,可达到信息的清晰化和可理解的目标;从用户的使用效果看,可达到网站信息的有用性、可用性强和使用者具有良好的用户体验的目标[16]。因此,信息构建可以帮助我们在网站层面形成良好的信息环境,帮助用户利用信息。

此外,还可以通过在界面层面对信息进行面向用户、个性化、智能化和专题式等多方式的整合达到组织和发现信息的目的。上文中我们分析美国联邦政府门户网站时提及的多维度信息关系的揭示就是网站界面层面的信息资源整合和信息构建的最佳实践。网站层面的信息发现和获取是以内容层面的标记、元数据、本体等信息组织技术为基础的。

3.3 网络层面信息的组织和发现

因特网由一个个网站组成,无论一个个网站对自己的信息如何进行优化和组织,对于用户而言,要获得能够解决他们问题的足够多的相关信息,网络信息资源仍然是分散的,无法得到有效的利用。因此全网络信息的组织和发现需要对众多的网站、分散的信息按照用户的需要进行重组和聚合,需要按照一定的资源选择和评价标准、规范的资源描述和组织体系,对网络信息进行集成管理和控制,实现信息的精确有效的提取。主题网关、学科信息门户、行业门户、虚拟图书馆、数字图书馆等等都是解决这个问题的手段。我们主要以主题网关为例来说明它的信息组织机理。

主题网关是支持系统化资源发现的因特网服务,通过因特网提供对资源(文献、对象、网站或服务)的链接。该服务建立在资源描述的基础上,可以通过主题结构浏览访问资源[17]。学科信息门户致力于将特定学科领域的信息资源、工具与服务集成到一个整体中,为用户提供一个方便的信息检索和服务入口。两者虽然提法不同,但它们与学科导航、虚拟图书馆等做法类似,主要的目的是通过主题或者学科的方式聚合网络上高质量的信息,帮助用户准确、快速定位网络信息资源。目前各式各样的主题网关很多,主题或者学科的分布范围很广,单就图书情报领域而言美国、英国比较著名的主题网关就有:英国的图书馆公告板网络化知识库(BUBL LINK)、图书馆学情报学中高质量的因特网资源(PICKS)和Sheffield大学的信息科学导航等;美国加州伯克利大学图书馆的LII、西北大学图书馆的Library Information Resources on the Internet、印第安纳大学图书馆的The WWW Virtual Library Resources、匹兹堡大学信息科学学院的导航和西雅图太平洋大学的Library Subject Oriented Resource;中国有上海图书馆、北京大学图书馆、清华大学图书馆、武汉大学信息资源中心、台湾地区的中山大学图书馆的“网际网路资源”等[18]。主题网关主要由人员来严格筛选网络信息资源,通过对资源比较详尽的元数据描述支持资源的发现和组织,通过提供主题浏览和检索提供资源,提供的内容是高质量的、清晰直接的具体内容页。主题网关通过筛选资源、规范描述、分类浏览的方法对网络资源进行质量控制,并且为了弥补资源量的不足有些主题网关还开始了合作与协作,因此这种信息的组织和处理方式比搜索引擎更能提供针对性的高质量的网络资源。

4 结论

网络世界的信息组织精彩纷呈,充满了创新和挑战,这个领域也是图书馆学情报学专业知识走向社会化的一个独特的领域,只要看看网络世界到底有多少人需要信息,到底有多少人在享受信息组织的益处或者抱怨信息组织的毛病,到底有多少人在从事实际的信息组织工作,就能够想象得到社会多么需要可靠的信息组织方法了。信息组织的问题很多,本文想要说明的主要是两个问题:网络世界的信息组织需要深刻分析信息关系,基于信息关系来组织信息才能够应对网络信息管理的需要而有所创新和发展;网络世界发现、组织和获取信息可以从内容、网站、网络三个层面考虑,优化三个层面的信息组织便有望形成更加良好的信息环境,方便用户利用信息。

标签:;  ;  ;  ;  

网络世界的信息组织_人与人之间的联系论文
下载Doc文档

猜你喜欢