复杂网络理论的情报学应用研究,本文主要内容关键词为:情报学论文,理论论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 复杂网络的概念
2000年,当代最富有影响的思想家之一——史蒂芬·霍金(Stephen Hawking)指出:“我相信,下一个世纪将是复杂性科学的世纪。(I think the next century will be the century of complexity)”[1]。复杂性科学及其复杂性研究,在世纪之交引起了国内外的普遍关注。复杂网络研究是复杂性科学研究的一个重要部分。研究表明,从生物体中的大脑结构到各种新陈代谢网络,从 Internet到WWW,从大型电力网络到全球交通网络、从科研合作网络到各种政治、经济、社会关系网络,现实世界中许许多多的网络都是具有小世界现象或无尺度等特征的复杂网络[2]。复杂网络的研究引起了不同学科的广泛重视,成为当前富有挑战性的重要前沿课题。
从统计物理学的角度来看,网络是一个包含了大量个体以及个体之间相互作用的系统,是把某种现象或某类关系抽象为个体(顶点)以及个体之间相互作用(边)而形成的用来描述这一现象或关系的图。人们很早就思考过网络结构的问题,但受到当时的科学发展和技术的影响,一直以为网络的结构是规则的或随机的,直到1998年和1999年小世界网络模型和无尺度网络的提出[3][4],人们才又重新思考网络结构问题,而人类计算能力的提高、科技的发展也为人们研究这一问题提供了有力的支持。
钱学森给出了复杂网络的一个较严格的定义:具有自组织、自相似、吸引子、小世界、无标度(无尺度)中部分或全部性质的网络称为复杂网络[5]。周涛认为复杂网络大致包含以下几层含义:首先,它是大量真实复杂系统的拓扑抽象;其次,它至少在感觉上比规则网络和随机网络复杂,因为我们可以很容易地生成规则网络;但就目前而言,还没有一种能够生成完全符合真实网络统计特征的简单方法;最后,由于复杂网络是大量复杂系统得以存在的拓扑基础,因此对它的研究被认为有助于理解“复杂系统之所以复杂”这一至关重要的问题[6]。
复杂网络最重要的是小世界效应(small-world effect)和无尺度特性(scale-free property)。小世界特征说明了规模很大的网络的任意两个节点之间存在最短路径;无尺度特征揭示了真实网络的结构符合幂律分布的事实。复杂网络因此有别与人们已经熟悉的规则网络和随机网络。
从1998年开始,复杂网络理论受到西方发达国家的广泛关注;国内则晚一些,基本上是从2002年以后才有这方面的研究论文出现。现在关于复杂网络的理论研究主要由一些数学家和物理学家在进行,他们主要考虑建模问题、网络性质、如何提出合适的说明网络性质的概念、如何进行推理论证等。而应用方面的研究就广泛得多了,就连语言学、足球、恐怖组织研究都与复杂网络产生了联系。因为,复杂网络的研究,除了本身的理论拓展外,也为其他学科提供了一种进行科学研究的新视角、新方法。它的应用研究已经在其他许多学科中得到了积极的应用。
2 复杂网络应用于情报学研究的基础
把复杂网络的理论和方法引入情报学研究,主要是基于以下两方面的考虑:一是情报学具有多学科交叉融合的学科属性;二是复杂网络理论的研究方法和概念及模型越来越多地被应用于其他学科的研究之中。
2.1 情报学的学科特点
情报学是一门边缘性、交叉性、综合性较强的学科,在它成长壮大的过程中,不断吸收其它学科的理论和方法,拓展丰富自己的研究领域和内容,与其他学科的不断交叉融合使情报学呈现出多学科化特征、多方位的发展趋势。情报学自形成以来,多学科的方法和技术已经成为情报学研究的重要来源,引入的理论方法有:老三论(信息论、控制论、系统论)、新三论(耗散结构理论、协同论、突变论)、管理科学、行为科学、领导科学、图书馆学、运筹学、数学、统计学、电子技术、计算机技术、缩微技术、网络技术、声像技术。这些理论、方法、技术有些已与情报学相互渗透,结合成为有机整体;有的还正在消化、吸收,处于不断完善之中,使情报学的研究欣欣向荣并形成了较为完整的学科群。
2.2 复杂网络理论的特点
复杂网络理论本身的研究已成为统计物理学中的热点,而它的应用研究更是在许多学科中正在进行着,并取得了不同的成果。这说明复杂网络的研究方法和成果可以有更广阔的应用空间。在已经进行的研究中,有些研究课题与情报学相关,如科研合作网研究、论文被引用研究。只是这些研究都是从物理学角度进行的,而这些研究内容也属于情报学领域的内容,目前还没有情报学家从情报学的角度来进行研究,对它的情报学意义进行解释。情报学本身的学科特点,加上复杂网络的广泛应用及其在情报学领域的初步尝试,这些因素共同作用,决定了复杂网络理论将在情报学的发展中继续发挥作用。
3 复杂网络理论在情报学中的应用
虽然复杂网络的研究时间很短,但纵观情报学的研究内容,已经有些研究涉及到这方面的内容。最早的应用是在竞争情报领域中关于人际网络的研究,随后更多的研究则集中于Internet、www和科研合作网络的研究。
3.1 科研合作方面
为了研究某一学术领域的发展变化,某一个新的思想在此领域内的产生、传播,研究人员构造了一个科学家之间通过文献相互联系影响的网络。以科学家为节点、两个科学家共同完成一篇论文为一条边,或以论著为节点、一次引用为一条边。研究发现,它们具有高聚集性和幂律分布的重要特征。
2001年美国Santa Fe研究院的Newman发表了他对美国一些常用数据库的统计结果。他选取了如下这些数据库:Los Alamos电子出版论文-预印本、Medline生物医学研究论文、斯坦福公共信息检索系统 (SPIRES)、高能物理论文、网络计算机科学技术参考库(NCSTRL)等。他计算了从10,000-2,000,000的结点(论文),结果发现它们符合小世界现象和无尺度特征[7][8]。
武汉大学数字与统计学院的刘杰、陆君安在他们的论文《一个小型科研合作复杂网络及其分析》中,对 1998年1月至2004年6月间发表于《物理学报》和《Chinese Physics》上混沌科学方面的科学研究论文作者合作研究所形成的小型网络进行了初步研究[9],在大的连通组群内显示出小世界性和幂律。
3.2 Internet方面
Internet在域级和路由器级可得到两个不同的拓扑,经验结果显示无论哪一种拓扑度分布都服从幂律。如果把WWW的网页作为节点,把html网页之间通过URL的超链接当作链路,可以得到一个WWW的信息网络,广泛研究WWW的结果显示度分布遵从幂律。
梁战平指出,小世界现象是情报学的8个前沿领域之一。他叙述了小世界现象的由来并给予评论说:“‘小世界现象’对于情报工作者如何快捷、准确获取网上信息提供新思路[10]”。目前急需深入研究小世界现象究竟会对情报学会产生哪些影响。
我国学者的研究涉及利用Internet的复杂网络特征——小世界性来改善网络信息传播和网络安全管理。司徒俊峰根据W-S的小世界网络模型,认为 Internet是一个小世界网络,具有集团化、聚类的特征,作者在分析Internet网络特征后,提出了如何运用小世界原理来改善Internet的信息交流过程及网络关键结点的建设和保护等[11]。
3.3 信息检索方面
文献12是国家自然科学基金资助项目成果。该论文在万方数据生物医学期刊(1062种,150万篇)作者在合作研究中形成的复杂网络的基础上,将检索结果可视化,应用在文献检索的结果展示上,为用户呈现合作网络的结构,将数据库中大量隐藏的合作关系展示给用户,同时还可以对图中任意节点进行交互式访问,为复杂网络及可视化在文献检索的增值服务做出了有意义的探索[12]。
3.4 竞争情报中的人际网络方面
在竞争情报研究中,人际网络对竞争情报的获取极其重要。已有多位学者提出了情报活动中的人际关系网络问题。文献13指出:在实际工作中,人们获取情报时,注意力大多集中在情报的物理载体上,而甚少关注情报的活的载体——人脑。但是,一些新的科学假设、技术发明的原始冲动、经验、诀窍和方法,往往又是存储在人脑这个活的载体中。某一重要数据和最新情况,倘若你不掌握,你的朋友或者朋友的朋友或许知道。这就是人际网络问题。普赖斯科特在给中国的《竞争情报丛书》所写的序言中,更是将人际网络及其运行机制,作为提升西方竞争情报实践的四项经验之一。人际网络是一种非常抽象、非常模糊的社会现象,始终处于变化、发展之中。如何将其以直观的形式(如网络模糊图、邻接矩阵等)表现出来,如何借鉴其他学科领域的成功经验,对竞争情报活动中的人际网络进行优化管理,是当前情报工作的当务之急。国家社科基金项目2005年度课题就有竞争情报活动中人际网络问题研究,探讨在社会运转和经济活动中,如何利用口耳相传的零次情报,构建和利用人际网络来提升企业竞争能力。对相关问题的研究会成为今后若干年内情报学研究的一个热点。
3.5 知识扩散方面
文献14运用小世界网络模型模拟了知识在社会网络中扩散的过程,研究发现知识扩散中存在“小世界”现象,即知识在小世界网络中扩散后的平均知识水平最高,且知识差异最低。
关于国内外在复杂网络领域做出的重要成果很多,需要情报学专业研究者加以全面深入的研究和借鉴,有大量的工作需要完成。
4 复杂网络的研究方法在情报学研究中的应用
复杂网络的研究,为我们提供了一种研究问题的新视角、新方法、新工具。首先,在研究方法上,创造了一系列更好地理解拓扑结构与功能关系的分析方法;其次,它提出了一系列指导复杂网络研究的概念、命题、基本原理及其相关的理论,使对于复杂网络的研究面目一新,并把这些理论、概念应用于其他领域的研究,使我们认识到网络不仅是一种客观存在,也是一种观察事物、分析事物的方法。复杂网络独特的研究视角是从整体角度来关注网络结构对其功能的影响。
从情报学研究历史来看,情报学的研究方法有许多都是从其他自然科学和社会科学中移植过来的。情报学特有的文献计量方法,也是借用、移植数学和统计学方法的基础上加以创新、完善而形成的一种新型的研究方法,创新主要体现在布拉德福确立的特殊的统计方法——等级分布法。
网络分析的方法已经应用于竞争情报的人际网络研究。除此之外,还可以运用于情报学其他领域,因为在情报学领域存在着这样一些网络:词与词之间的语义联系,计算机之间的网络联接,网页之间的超链接,科研文章之间的引用关系以及科学家之间的合作关系,计算机病毒在Internet网络或邮件网络上的传播等等。虽然每一个网络都有其自身的特殊性质,有其紧密联系在一起的独特现象,有其自身的演化机制,但是都可以使用网络分析的方法,例如关于顶点度值、介数的分析方法以及大量不同网络中存在的相同的统计特征。把网络分析的方法移植到情报学当中来,它既可以作为单一的研究方法存在,也可以和其他情报学方法结合。
复杂网络的研究方法被用来解释复杂系统之所以复杂,实质上它是一种系统的方法。它也符合系统科学方法的三个明显的特点:整体性、综合性和最优化。有学者认为[15]:未来情报学研究中,系统科学方法会成为带头方法。从这一点来说,网络分析的方法是情报学研究新的生长点。
基于以上分析,笔者提出把网络分析方法应用于情报学研究,这与其研究内容和发展趋势都是相符的。
5 复杂网络的研究成果在情报学研究中的应用
在情报学领域存在许多网络,它们都构成某种复杂网络,可以利用复杂网络的共同特性——小世界、无尺度性和高集团度等性质,在复杂网络研究的旗帜下进行研究。除前面介绍的应用领域,笔者认为如下几个情报学领域的一些问题可以应用复杂网络的方法和理论进行进一步研究。
5.1 科研合作网络研究的情报学意义
在已经进行的复杂网络的研究中,科学家之间的合作研究是和情报学关系最密切的内容之一。科学家已经得出结论,科研合作网络具有小世界性和无尺度的特性,但还没有说明这些复杂网络的概念有何情报学意义。在科研合作网中,如何利用复杂网络的相关原理判断学者的影响力?其他一些性能指标有何情报学意义?需要定义哪些新的性能指标?这些都有待于深入的研究。
5.2 复杂网络与信息传播
复杂网络具有小世界现象和无尺度两个明显的特征,我们可以运用这两个工具来研究这样的网络结构对信息传播有哪些影响。
信息传播会形成一个复杂网络。从复杂网络的角度来研究如何构建最优的信息传播网络,保持网络的稳定性,促进信息传播和转化;是否可以利用小世界.特性来加速信息交流等等。研究在小世界网络中的信息交流有何特点,如何加速或减缓交流等。
网络上的信息传播也同样适用。对于网络上信息的交流、我们更关注如何提高网络效率,提高信息流的速度,信息如何能够更快、更准确的传播。从Internet的物理结构也就是基础设施来看,因为信息在网络的传播依赖于网络的路径,Internet的路径的大小影响着信息在互联网上的传播。改变它的拓扑结构也就是使平均路径变短,这样可以加快信息传播,减少传播过程中信息的损耗与失真。
研究表明:在赛博空间的信息传播,也就是网络用户之间的相互访问基本上也呈现出复杂网络的统计特点。信息能够在此类复杂网络中得到迅速传播,这一点与疾病、笑话、时尚等具有类似特征的元素流行有共同之处。在传播的过程中,活跃个体造成的“长程连接”是信息迅速传播的关键所在。可以考虑从物理和虚拟空间来改善信息的传播,根据人们的需要加速或抑制其传播。
5.3 复杂网络与信息资源配置
社会中的各种信息机构也构成一个复杂网络,信息机构间地理关系和位置联系又是怎样影响信息配置的?怎样构建适合的网络更有利于信息共享?这些问题都与复杂网络研究有联系。
信息资源共享一直是图书情报界和信息管理界关注的重大课题。传统的研究主要从两个方面着手解决这一问题:一是考虑信息资源在地理区域上的合理布局和配置来实现最大限度的共享;一是通过信息提供者之间的合作来实现信息资源共享。就信息资源配置的结果来说,满足社会信息需求的程度越高,信息资源优化配置的程度就越高。而这两方面又都形成一个以信息机构为节点的网络,所以用网络分析的方法研究信息资源配置问题或许会有新的发现。
共享必须合作,合作就要形成网络,运用复杂网络的特征来分析现在的信息共享网络是否是最优化并在现有基础上构建更大范围的合作网络。根据无尺度网络理论,让所有人共享所有信息既不经济也不可能,再大的努力也只能让大多数人得到大多数的信息,所以重点工作是确定网络度值大的节点,找出关键点,这些点可能就是区域中心图书馆或信息中心,计算网络中关键点的数量,对他们进行重点建设和保护。
5.4 复杂网络与信息检索
研究复杂网络的拓扑结构的目的在于认识网络上的重要过程。例如,我们希望理解www的拓扑结构是怎样影响Web冲浪和Internet中的网络搜索和网络导航。从网络的结构来关注信息检索,核心的问题是如何研究各种网络的拓扑结构、揭示网络结构与功能之间的关系、发现它们的规律、探索最佳网络设计及其应用。
网络信息资源检索质量问题一直困扰着我们,进一步说就是搜索引擎的搜索结果的查准率问题,能否利用复杂网络的理论和性能指标设计搜索引擎的算法,提高查准率。这也是情报学应用研究的范畴。
5.5 复杂网络与知识地图
自从英国学者布鲁克斯提出“知识地图”的概念后,构建人类知识地图的梦想首先在企业的知识管理中实现了。但这与我们设想中的蓝图还有差距。现在企业中应用知识地图的作用就是指引人们寻找所需要的知识,是知识的指引而不是知识的集合。布氏提出的“知识地图”,是以知识网络的形式来说明知识单元的发展与变化,从而明确学科知识的发展与变化。 1981年印度的斯·科·森提出“情报基因”理论,他建议从基本概念开始,按照思想基因进化图谱重建文献分类体系。在情报检索领域中亦应从文献中找出思想基因,按自然进化方式聚类,形成思想基因串,然后再编制成为新型的概念索引,供人们利用。我国学者刘植惠在1996年连续发表论文,提出“知识基因”这一术语,还创立了基于知识基因的分类法。
以上研究涵盖了人类几千年知识的形成、演化、交叉、融合等过程,是一项庞大的工程,在这个过程中,无论哪一种学说,都是以知识为研究对象。知识是有继承性的,如果能够确定知识基因及他们之间的联系,这样构成一个复杂网络,我们可以用复杂网络的方法和理论对其进行研究。在知识地图的研究中运用网络分析的方法,确定网络关键节点,可以找出核心位置的概念,在知识进化中起关键作用的知识,这些知识是进化的基础,或者说是核心知识,利用复杂网络的情报学应用研究,是否可以使知识地图的研究更进一步?
5.6 其他应用
欧美国家的企业高层管理者已经在用网络分析技术分析企业和组织内部的组织结构,用统计学方法找到信息流的结构特征,以提高组织效率;哈佛商学院的教授[16]Alvin Roth使用网络分析的匹配 (Matching)技术,为全美国的医学生就业市场设计择业程序,解决了几十年来医学生就业市场的积弊。
运用小世界网络分析知识管理中的知识交流。小世界现象及其相关理论为学术界研究社会网络开辟了一条崭新的思路。企业内部员工的知识管理本质上是一个由组织中各职能部门的代表组成的人际网络。提高知识交流和共享可以有效提高创新的效率,团队成员中也存在着非正式组织等等。如果用SWN来描述员工团队的交流网络,那么“节点”是企业团队成员,“连接”是他们之间的交流。这样,就可以用“小世界”的特征路径长度、集团化系数、断键重联概率等数量特征来描述和分析员工的交流网络。每个员工在网络中的作用是不一样的,找出关键节点,减小网络的路径,促进知识共享。
6 结束语
目前情报学领域还没有非常明确地提出复杂网络的应用研究问题,只是在个别学者研究中有某一方面的涉及。复杂网络在情报学领域的应用首先是其研究方法——运用计算机进行大规模网络分析的方法,这为我们提供了一种研究问题的新视角,使我们认识到网络不仅是一种客观存在,也是一种观察事物、分析事物的方法。其次是在具体层面的应用,复杂网络的两个最基本的特征是小世界性和无尺度性,这些特性可以在情报学的某些领域应用,如:信息传播领域、信息资源配置领域、信息检索、知识地图、知识交流等,在第二章对上述问题做了全面的论述。
科研合作网络和引文网络是物理学家从复杂网络的角度进行研究的和情报学关系非常密切的网络。在对物理学家从统计物理学角度进行的研究加以介绍后,笔者从情报学的视角分析了复杂网络的性能指标,包括最短路径、长程连接、连通集团、介数有哪些情报学意义,使科研合作网络和引文网络的复杂网络研究和情报学联系起来。
情报学还有一个重要的阵地——网络信息资源的组织与服务,这也是复杂网络研究的重要内容。本研究从复杂网络的理论出发,在了解Internet和www的网络拓扑结构的基础上,对网络信息资源的传播、检索、共享进行初步的尝试性的探索。其中对网络的无尺度特征在网络信息资源利用方面的作用进行了总结,同时也对一些指标在信息检索方面的应用做可能的说明。
复杂网络的情报学应用研究的内容不止如上所列,还刚刚开始。随着关注学者的增多,研究将不断向纵深发展。开辟复杂网络在情报学应用的美好未来,是我们这个时代的伟大任务。
收稿日期:2006-11-16