知识网络及其度量研究_知识地图论文

知识网络及其度量研究_知识地图论文

知识网络及其测度研究,本文主要内容关键词为:知识论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G35

世界上的每个人之间都存在着千丝万缕的联系。上世纪60年代,美国社会心理学家米尔格伦提出了“六度分割”理论。他认为,只要通过六个人,你就能够与任何一个陌生个体建立联系。有时这种关联很强也很近,可是有时这种关联的丝线非常微弱且异常遥远,即使我们意识到对方的存在,但我们听不见对方的挣扎呼喊,就算听到依然无法理解也无法进行有意义的沟通。知识单元之间的关联也是如此,也存在着直接的、显现的关联和隐含的、潜在的关联,构成复杂的知识网络。

看似无关的任何事物之间都存在着某种联系,只是有的联系是直接的,有的是间接的,有的是显性的,有的是潜在的,而且相互之间联系的强弱大小不同。如果我们把人与人之间的联系通过图形来描述,必然会形成一张无边无际的、复杂的人际关系网络,任何人都是网络中的一个节点,那么根据米尔格伦的“六度分割”的理论,两个节点间至多存在6个节点。如果我们把人际关系网络中的节点换成文献单元、信息单元或知识单元,那么是否就会形成类似的文献单元关联网络、信息单元关联网络或者知识单元关联网络(可以统称之为知识网络)呢?我们认为,组成知识网络的知识节点之间的联系也应该是如此:两个知识单元可能通过一个或多个节点和链接才能建立相关关系。然而,有相互联系的两个知识单元之间的联系强度有多大,又该如何测度呢?在知识网络广泛存在的今天,这是一个值得思考和研究的问题。目前文献计量学和科学计量学界正在广泛应用的引文分析、内容分析、共引分析、共词分析、共现分析、知识地图、科学知识图谱和社会网络分析等就是对知识网络及其测度高度关注的直接反映。

1 知识关联与知识网络概述

知识关联是指知识单元之间存在的各种联系的总和。知识网络是指由知识节点(知识单元)和知识关联构成的知识体系,知识网络反映的是知识单元之间的关系网络,反映的是知识单元之间的时空变化关系和逻辑结构关系。

唯物辩证法认为事物是普遍联系的,客观事物都是相互联系而不是孤立存在的。任何事物之间都存在一定的联系,称为关联或关系。任何事物之间的关联不仅仅是单一的和单向的简单关系,而是一个复杂的和多向的网络关系。事物之间的关联有强有弱,称为关联强度;范围有大有小,称为关联网罗度(或广度)。知识单元和知识节点之间的关系也是如此,知识之间的关联最重要的形式是知识链和知识网络,而知识链是知识网络的一种特殊形式,因此可以说网络关系是知识关系最重要的表现形式。知识网络中的节点是分析对象(如文献、作者、机构、期刊、学科、主题词和关键词等知识单元),节点间的链接或连线是知识单元之间的关系,通常用节点间的距离或连线的粗细来表示知识单元之间关系的强度。以任何一种知识单元为节点,从任何一个知识节点向四周延伸,历时或跨越空间扩展,都会得到不同类型的知识网络。如果将这种知识网络用图形或图像显示出来,就形成了一张完整的知识地图或知识图谱,据此可以清晰地了解整个知识网络的结构,并可由此透视知识网络背后知识活动者间的关联,有助于知识的交流、管理、传播和利用。

2 知识网络的产生与发展

最早给予知识网络以直接关注的是企业管理界。据报道,国外关于“知识网络”的概念最早是由瑞典工业界(M.J.Beckmann,1955)提出的[1],对“知识网络”的研究多集中在实际构建方面,同时也对知识网络的经济、市场结构模型进行了大量分析和研究。主要有两种认识:(1)知识网络的经济学模型(M.J.Beckmann,1955),认为知识网络是进行科学知识生产和传播的机构和活动。(2)知识网络的市场结构模型(K.Kobayashi,1955)[2-3],认为公司是知识网络的节点,它通过R&D活动扩大其知识存储量。

1996年,经济合作与发展组织(OECD)在题为《以知识为基础的经济》的报告中提出了知识网络及其测度问题,认为“知识经济像重视知识的创造那样注重信息和知识的扩散与使用。企业和国家经济成功的决定因素在于搜集和利用知识的效率。战略性的诀窍和能力相互作用而发展,它们在子系统和网络中(这里Know-who的意义重大)得到共享。经济变成了网络体系,并由变化速率和学习速率的加速度所推动。它所创立的是一个网络社会,在此社会中,接触和介入知识和学习密集型的关系的机会和能力,决定了个人和企业的社会经济地位(David和Foray,1955)。”“需要有新的指标来捕捉创新过程以及知识在经济的关键参与者和机构中分配的情况。这实质上涉及测度‘国家创新体系’的问题,包括国家和相关系统在不同经济参与者和机构间分配知识的能力。”[4]

1999年,美国国家科学基金会(NSF)在关于“知识网络”的一个课题中明确阐述了知识网络是一个社会网络,该网络能提供知识、信息的利用等[5]。

在情报学和信息管理领域,对知识网络的研究始于对文献关系网络的研究。知识网络源于普赖斯(D.Price)的一篇著名论文《科学论文的网络》。在这篇论文中,他详细而又创造性地研究了科学论文之间的引证和被引证关系,由此形成了“引证网络”。根据网络分析的原理,他进而提出了能指明科学研究前沿的定量模型。普赖斯最后强调指出,第一流的科学家都应密切注视他的同事和同代人的工作,因为科学研究前沿依赖近期的研究成果;在网络图上,必有密集分布的小条或小块,如果把这些小条和小块研究清楚,我们就可以绘制出当代科学的“地形图”(Topography)[6]。加菲尔德则在引文分析的基础上利用《科学引文索引》(SCI)使引文关系网络分析从理论研究走向实践和实际应用。

布鲁克斯在1980年发表了一组论文,首次提出了他关于知识网络的天才构想,即“认识地图”(Cognitive maps)的概念[7-8]。他认为:目前图书情报工作者利用分类法和索引法对文献的标引分类都不是组织知识,而是组织文献。按这种方式建立起来的系统只能向用户提供文献线索,用户通过这一线索获得原始文献,还需花大量的时间阅读分析才能获得所需要的那部分知识内容或情报。因此他提出按“认识地图”来组织知识。“认识地图”就是分析文献中的逻辑内容,找出人们进行创造和思考的相互影响和联系的结点,按知识的逻辑结构找出人们思维的相互影响的连接点,像地图一样把它们直观标示出来,展现知识的有机结构。

作为知识管理工具的知识地图思想来源于英国著名情报学家B·C·布鲁克斯“认识地图”的启发。知识地图是利用构造地图的方法将各类知识资源中的事关联起来,使之成为一个知识网络图。因此,知识地图的研究者首先在组织或数据库中寻找知识点,发现其中的关联,并为各类关联建立连接,以形成知识网络图,同时标以知识的流动和转移方向,就绘成了知识地图。美国国家科学基金会早在20世纪70年代就出版了关于科学基金的地理分布的报告,并论述了科技分布对地区经济的影响。由此,科学研究地理学、高技术地理学作为经济地理学分支在20世纪80年代得到发展[9]。美国捷运公司最早的知识地图是一张展示知识资源地理分布的美国地图[10],这就是知识地图的雏形。之后,带有索引号或用其他方式表示层次关系的表格和文件,以及用来表示信息资源与各部门或人员之间关系的信息资源管理表和信息资源地理分布图,可以说都是知识地图的不同形式。

随着信息技术的迅速发展,知识地图进入了电子时代,在Internet和Intranet上普遍使用的超文本链接和应用链接就是知识地图的简单形式。这时,很多绘制知识地图的工具也应运而生,如LotusNotes、IBM的KnowledgeX和微软的Visio等,它们都是基于数据库来绘制知识地图,有利于知识地图的动态更新和扩展,这就突破了局限于描述知识地理分布的知识地图界限,并逐渐演化为涵义与内容更加广泛的知识图谱了。知识地图反映的是知识资源之间静态的二维关系,而知识图谱则体现了知识之间存在的多重复杂动态关联。著名德国科学计量学家赫尔德若·克里奇默)Kildnm Kretschmer(关于科学合作的三维空间模型研究[11-12],大大地推动了科学知识图谱的发展。知识图谱绘制是科学计量学的发展与创新。科学知识图谱的出现和兴起,一方面是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,另一方面又是显示科学知识地理分布的知识地图转向以图像可视化地展现知识结构关系与演进规律的结果[13]。2001年,纽曼开始应用社会网络分析方法(social network analysis)构建科学家之间科学合作网络[14]。将作者(或论文、机构、期刊)引证关系网络、合作关系网络等作为一种科学界广泛存在的社会网络来进行研究,并反映其相互关系、特征和规律,成为近年来文献计量学和科学计量学领域兴起的一个重要研究方向。

在计算机和信息科学领域,对知识网络的研究更是引人注目。如关于数据库、知识库、知识仓库、知识挖掘、知识发现、搜索引擎、网络链接关系、语义网络等方面的研究,都广泛涉及知识网络,并且研究领域和应用范围不断拓展,正在同其它学科领域的研究结构、交叉、渗透和融合。与此同时,社会学、教育学和心理学等学科领域也都开展了有关知识网络的研究,如人际关系网络、专家网络、概念地图、概念网络等。

由此,知识网络开始引起了人们的广泛关注,在知识组织、知识检索、知识挖掘、知识发现、文献计量学、科学计量、科研管理和知识管理等领域得到广泛应用。

3 知识网络的结构

一般来说,知识网络是由知识节点或知识元素和节点链接(知识关联)构成的一种网状结构,这种网状结构的表现形式多种多样,有树形结构、星状结构、辐射结构、环形结构、综合或混合结构、单向关系网络、多向交叉复合关系网络等。任何知识网络都由多个知识节点和节点之间的关系连线构成,知识节点的数量表示网络的大小,节点间的距离、连线密度或粗细表示节点间的关联强度。从一个知识节点出发探索知识节点间的单向关系就可以生成一个知识链,从多个知识节点出发探索它们之间的多向交叉关系便形成了一个知识网络。可以说,从任何一个知识节点出发向外延伸,便可形成一个知识链,从多个知识单元出发向外延伸便可形成一个知识网络。知识网络是若干个知识链的组合。如果这个知识网络无限向外延伸,那么就会形成一个庞大的科学知识网络体系。知识网络是一个立体的动态网络结构,类似于银河系,甚至是整个宇宙的结构。

有学者认为,“知识就是由众多结点(即知识因子)和结点间联系(即知识关联)两个要素组成的[15]。”“知识因子是组成知识的最细微的成分,一个概念、一种事物(如“图书馆”、“文献”等)都是组成知识的一个因子,也就是说,知识由一个或多个知识因子组成。知识关联是为若干个知识因子间建立起的联系,因为知识是有机联系的网状结构,而不是各个因子的散乱分布。知识关联在产生新知识、形成新文献中起重要作用,是使知识有序化的必要条件[13]。”这里所说的知识单元是广义的概念,不仅包括知识内容本身,还包括各类知识载体及其集合。因此,知识网络中的知识节点可以是不同的知识单元,如文献、引文、作者、机构、期刊、国家、地区、学科、主题词和关键词等。

4 知识网络的类型

不同时代、不同领域和不同学科的学者,也就是说处在不同时空的人们对“知识网络”概念的内涵和外延具有不同的认识[13]。但从知识网络的起源来看,知识网络大概可以分五类:(1)在管理学界和企业知识管理中,知识网络主要是针对企业内部及企业外部知识的创造、利用与传播。有时也指企业知识联盟、专家知识网络和资源网络。因此,知识网络被界定为“是一批人、资源和它们之间的关系,为了知识的积累和利用,通过知识创造、知识转移,促进新的知识的利用”[16]。(2)在信息管理、情报学、文献计量学和科学计量学等研究领域,知识网络主要是针对科学研究活动中知识的组织、存储、检索与利用。所以,知识网络被认为是“知识节点及其结构与关系”。从科学论文的网络到认识地图、引文网络、知识地图、知识图谱等都是知识网络的不同类型。(3)在计算机科学和人工智能等研究领域,知识网络通常是语义网络、概念网络、神经网络、“Wordnet”、“Knownet”和知网等概念的统称,反映知识和概念之间的逻辑关系,被广泛应用于数据信息可视化、知识挖掘、知识工程、知识表示、自然语言理解等众多领域。(4)在教育心理学领域,知识网络被视为一种学习中的记忆方法或工具。教育学与心理认知学专家认为,我们学过的知识可以分两大类:一类是陈述性知识;一类是程序性知识。这两类知识紧密联系,共同组成了人们头脑中的“知识网络”。以知识为内容的神经网络称为知识网络,它是各种知识在脑内系统化的储存方式。学习就是一个逐步建构和不断完善知识系统网络的过程,学习的直接目的就是获得知识系统网络图[17]。也被称为概念网络或概念地图。(5)在社会学领域,知识网络被认为是一种普遍存在的“人际关系网络”,它是一种宝贵的财富。人与人之间存在着各种复杂的社会关系,这些社会关系就构成了“人际关系网络”。通过各种人际关系网络(如友谊网络、信任网络、工作网络和咨询网络等),人们可以广泛地获取、交换或交流所需的物质、能源、信息、知识和情报等[18]。

知识网络的划分方式还很多。从构成知识网络的结点形态看,知识网络主要有如下3种情形:人、企业等知识主体之间的网络;知识与人之间的网络;知识与知识之间的网络[19]。根据知识网络的层次可以分为宏观知识网络和微观知识网络,根据知识网络的开放程度可以分为封闭式知识网络和开放式知识网络等。如果我们以不同的知识元素或称知识节点为对象来研究它们之间的关系,就会形成不同的知识网络。我们常见的知识网络有文献知识网络、知识单元网络、信息单元网络、人际知识网络、组织知识网络、社会知识网络、概念知识网络、主题词知识网络、关键词知识网络、作者和机构知识网络、引文知识网络、数据库知识网络、知识仓库、知识管理系统、知识地图、科学知识图谱等[20]。

5 知识网络的测度与应用

5.1 知识网络测度的主要指标与方法

知识网络可以用4个基本指标来测度:一是知识网络广度,即指知识网络中与一个知识单元(知识节点)链接数的多少,即有多少个其它知识节点与该知识节点有关联。二是知识网络深度,即具有相互联系的两个知识单元或知识节点之间所包含的中间节点个数,节点越多则关系深度越大,表明知识节点是否具有直接关联及间接关联的程度如何。三是关联强度,即具有直接关联的知识节点间的联系密切程度,一般用知识节点间的距离、连线的长度、连线的粗细来表示。四是知识链接关系和链接方向,知识单元之间存在着等同关系、等价关系、层次关系、等级关系、包含关系、因果关系、先后关系、交叉关系、并列关系、矛盾关系等各种关系,链接方向有链入链出,链入是指向某个知识节点的链接,链出是从某个知识节点出发的链接。

5.2 知识网络及其测度在图书情报领域的应用源于引文分析,主要集中在引文知识网络分析上。在引文知识网络分析的基础上又相继延伸出一系列新的知识网络分析方法,如共词分析、共现分析、相关文献分析、非相关文献分析、社会网络分析和科学知识图谱等,并在不同的学科领域得到了大量应用,获得了巨大的成功,引起了科学界、管理界的广泛关注和高度重视。

5.2.1 引文知识网络

最早研究引文知识网络的当属加菲尔德和普赖斯。1955年,加菲尔德发表了题为《引文索引用于科学》的论文,系统地提出用引文索引检索科技文献的方法,并于1960年成立了“科学情报研究所(ISI)”。通过一系列试验后,于1961年开始编制面向全部科技领域的综合性引文索引,1963年编成出版,取名为《科学引文索引》(SCI),为文献知识网络的研究提供了科学的方法和工具。1965年,借助《科学引文索引》,普赖斯发表了论文《科学论文的网络》,研究了科学论文之间的引证和被引证关系,以及由此形成的引证网络。至此,引文分析方法和工具受到青睐,被广泛用于研究各国科学状况、科学前沿发展、学科结构和联系等方面,取得了令人瞩目的研究成果。1961年,美国的开斯勒提出了引文耦合的概念,之后在此基础上发展出引文耦合分析。他把共引一篇论文的两篇或多篇论文称为耦合论文,它们间的关系为引文耦合关系,并用耦合强度来定量表示耦合论文间的联系,耦合强度值即耦合论文共同的参考文献数。引文耦合关系是一种重要的引文关系网络,被大量用于研究科学学科结构和联系。1973年,美国的斯莫尔又提出了共引的概念,并发展出共引分析。当两篇论文同时被第三篇论文所引用,则这两篇论文间的关系为共引或同被引关系,并提出了定量测度论文之间共引或同被引程度的指标,即共引强度,指共同引证相同论文的论文数。共引关系也是一种重要的引文关系网络,被用于对学科的结构以及学科间的联系和交流作定量的动态分析。由文献耦合和共引可以引申出作者、机构、期刊和学科耦合和共引等相似现象,这些相似现象从不同的角度共同反映了科学技术发展进程和学科专业主题结构及其关系。建立在耦合强度和共引强度基础上的文献聚类分析逐渐发展成为当前文献计量学、科学计量学最活跃的研究领域之一。共引聚类分析可以用来表示某一学科或专题的研究结构和状况。在此基础之上,对某学科和专题的高被引论文的连续共引聚类分析则可以动态地反映该学科和专题的变化情况。如Grimth和Henry Small在20世纪70年代通过文献的同被引测度,将具有不同的同被引强度的文献聚合成簇,以文献簇代表不同的专业研究,把文献簇以方框表示,方框之间的连线代表文献簇之间的同被引强度,连线越多,同被引强度越大,从而对学科专业结构进行展示[21-24]。

5.2.2 共词分析和共现分析

共词分析研究始于20世纪70年代中后期,最早由法国文献计量学家提出并得到详细描述,经过20多年的发展,共词分析方法已经日趋成熟,逐步形成了基于包容指数和临近指数、基于战略坐标和基于数据库内容结构分析的3类共词分析方法,被广泛应用于发现和寻找学科领域研究热点,分析领域学科的发展过程、特点以及相互关系,反映某个学科专业的科学研究水平及发展历史和结构,拓展信息检索领域以求帮助用户检索信息等方面,取得了大量令人瞩目的应用成果。这些应用研究成果主要集中在人工智能、科学计量学、信息检索、信息科学与信息系统研究和人文学科计算研究等学科领域[25],并显示出扩散的趋势。

共词分析(Co-word Analysis),也称词共现分析,共词聚类分析等,是一种内容分析方法,以词频统计分析为基础。它的基本原理主要是对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化[26-27]。它利用大量文献中共同出现的关键词对有效地反映文本关键词之间的关联强度,减少了关键词的空间,用一套结构图有效地展示了关键词或主题词之间的关联[25]。因此通过共词分析和共现分析可以确认文本所代表的学科领域中相关主题的关系,进而探索科学学科的发展进程。通过对高频主题词的聚类,可以发现学科的研究热点。对聚类结果进一步分析,可以绘出战略坐标图,能够揭示研究热点所处的发展状态,并描述研究领域内部的联系情况和领域间相互影响情况[28]。

共词分析是在词频统计分析基础上发展出来的主题词或关键词知识网络。词频统计分析关注的是词出现的频次和排列秩序,并没有有效反映主题词和关键词之间存在的关联和结构,而共词分析正是以词的频次和排列秩序为基础,重点分析词与词之间存在的结构和关联。因此,共词分析揭示的是以主题词或关键词为知识节点构成的知识网络,共现频次反映了词与词之间的关联强度。其基本原理为:若两个词(或多个词)在一篇文献或多篇文章中共同出现,根据心理学家的邻近联系法则和知识结构及映射原则,则这些词之间必然存在某种程序的联系或潜在关系。如果将分析对象进一步扩展,则可衍生和延伸出引文共现(如引文耦合和共引)、作者共现、机构共现、期刊共现等相似现象,形成以不同知识单元为知识节点的知识网络。例如,两个或多个作者共现的频次,可以反映出他们之间的合作关系和合作网络;某两个或多个学科领域的论文共同发表同一期刊上,则可反映这些学科之间的关系;多个期刊共同刊载某一学科领域的论文,则这些期刊必然是相关期刊;若两篇(或多篇)科学文献有一个(或多个)相同的关键词,则这两篇(或多篇)文献或其相应著者间必然存在一种潜在的关系,就是词共现网络分析方法,是将各种信息载体中的共现信息定量化的分析方法。通过共现分析,人们可以发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用的知识,并揭示研究对象所代表的学科或主体的结构与变化关系,在计算机技术的辅助下,利用信息可视化技术,可以清晰地用二维或三维图示反映出研究对象之间的网络关系,具有更广阔的应用价值和前景。共现分析在构建概念空间、语义检索、知识组织、信息检索、文献内容知识关联分析、知识挖掘和知识发现等方面彰显出独特的功能,正在成为支撑知识挖掘和知识服务的重要手段和工具[29]。

5.2.3 相关文献和非相关文献分析

过去人们对文献的分析主要集中在相关文献的研究上,即一些文献之间彼此在形式和内容上总存在一定程度的关联,这些文献构成了相关文献,由此形成了较为完善的引文分析、共引分析、共词分析和共现分析等文献分析方法。近些年来,在相关文献分析的基础上,研究者们又发现了一种新的文献分析方法,即非相关文献分析法,大大丰富和发展了文献分析和研究的方法。1986年,Swanson和Smalheiser利用基于非相关文献的知识发现方法发现了隐藏于医学文献中的有价值的知识。在Swanson的研究方法的基础上,很多研究人员对基于非相关文献的知识发现方法进行了改进。Gordon和Lindsay(1996,1999)改进了Swanson的基于单词的词频统计方法,利用基于短语的词频统计方法,引入了四个参数来获得短语的最终词频,验证了“Raynaud”与“fish oil”之间的关联。Weeber(2001)利用UMLS的语义类型实现了自然语言与UMLS概念的映射。这种语义筛选的机制能够产生概念的聚类,尤其是中间集合的概念聚类。Padmini Srinivasan(2004)将Weeber的语义分析方法和Gordon的词频统计方法结合起来提出基于概念的词频统计方法,将自然语言通过MeSH与UMLS的语义类型联系起来,并利用Gordon的统计参数,计算概念之间的相关性。另外,一些研究人员也对这些方法进行了应用,如Stapley and Benoit(2000)and Jenssen,Laegreid,Komorowski,and Hovig(2001)在生物医学文献中识别了基因符号,并用图形对共现的基因进行了组织。利用这个图形,他们能够对相关的基因符号进行聚类[30-33]。经过近20年的发展,基于非相关文献的分析与研究形成了词频统计方法、语义分析方法、词频与语义分析方法相结合的分析方法等一系列方法,无论是在基本方法的研究上,还是在应用领域的拓展上,都取得了重大进展。

相关文献是指文献在形式或内容上有直接关联。与相关文献对应,非相关文献是指文献之间彼此不引用、没有或极少被共引,并且也不共引其他文献[34]。也就是说,非相关文献就是指在文献特征上没有共现特征,即文献之间不具有共同的主题词、关键词等体现文献内容特征的成分,它们在内容上没有直接关联,即使有关联,这种关联也是内隐的,需要深入挖掘[31]。围绕相关文献和非相关文献形成了两类知识网络,即直接的、显现的相关文献知识网络和潜在的、隐含的相关文献知识网络。有关相关文献知识网络的研究已较多,如关于引文网络、共引网络、共词网络、共现网络等的分析和研究都取得了重大进展。非相关文献知识网络正引起知识发现、知识挖掘等研究领域的高度关注,具有重要的应用前景。

5.2.4 社会网络分析

1998年Watts和Stragatz在《Nature》杂志上发表文章引入小世界性质(Small-world property)的概念,在全世界范围内引发了复杂网络研究的浪潮,并标志着现代意义下复杂网络研究的开端。近年来复杂网络迅速成为科学界的一个研究热点,在与物理学、生物学、管理学、经济学、社会学等基础研究发生交叉的同时也迅速应用到信息通信、网络搜索和传染病控制等领域[33-37]。社会网络分析也被广泛应用到情报学、科学计量学和科研管理等领域,在竞争情报获取、知识管理、信息检索、科研合作网及其可视化、互联网可视化及其管理等方面获得了巨大的成功。普赖斯和多纳德·比沃在这方面进行了开创性的工作,他们率先开展了对科学合作的形式及其科学家所扮演的角色的研究[38-39]。随后,Schubert和杜特等分别从中观组织机构层面和宏观国家层面上研究了科学研究领域的合作网络[40-41]。2001年,纽曼开始应用社会网络分析方法构建物理学、生物医学和计算机科学领域中科学家之间的科学合作网络[42]。2004年科学计量学家克雷奇默呼吁在未来研究中应关注微观层面的科学合作。无论是应用于竞争情报和知识管理,还是应用于科研网络的社会网络分析,其本质都是构建知识网络,目的都是为了处于社会网络结构中的行动者能够广泛有效地进行信息、情报、知识的交流与获取。

社会网络分析(Social Network Analysis),也称“结构分析”,并不是一个正式的理论,而是一个广义的研究社会结构的战略。广义上说,“社会网络分析将社会结构界定为一个网络,这个网络由成员之间的关系进行连接。社会网络分析更多地聚焦于成员之间的联系而非个人关系的特征,并把共同体视为‘个人的共同体’,就是视为人们在日常生活中所建立、维护并应用的个人关系的网络。[43]”在社会学中,社会网络分析起源于社会计量学,其主要思想来源于数学和计算机技术。传统的个人社会理论和数据分析仅仅研究个体行动者本身,而不考虑其他人的行为,忽视了行动者的社会背景。而在社会网络分析中,行动者之间的关系成为研究的第一要素。另一方面,社会网络结构对行动者行为的影响也成为极其重要的研究方向。社会网络分析包括自我网络分析(ego network analysis)和全球网络分析(global network analysis)两类。自我网络分析研究单个的人,比如White对加菲尔德个人科研网络的研究。全球网络分析试图发现整个网络中全体参与者的关系。一个社会网络是一个人群的集合,其中每一个都与其中某个子群的人相互熟悉。因此,社会网络可以节点的集合来代表人,用线的连接来表示相识或联系。在理论上,可以为任何共同体构建一个社会网络,如一个公司、学校、大学、研究机构、地区甚至全世界。在情报网络中,如果两个或多个具有联系,则形成一个社会网络,便于情报网络的构建以及情报的获取、交流、管理和利用;在科学研究活动中,如果两个或多个研究者合作发表了学术论文,则他们之间的联系就是一个社会网络,便于了解科学研究网络的结构、发现核心科学家、构建科研合作网、开展学术交流。

5.2.5 知识地图和科学知识图谱

知识地图、科学地图和科学知识图谱是20世纪70年代以来相继在科学计理学和信息计量学研究领域兴起的、用可视化的图像直观地展示科学知识的发展进程和结构关系的一系列研究手段、方法,是知识网络的各种图形显示。知识地图、科学地图和科学知识图谱绘制是知识网络的可视化方法,是有效地揭示知识网络关系的科学工具和方法。其共同之处在于,以引文分析、数学、信息科学的计算机技术等为研究手段,用可视化的方式显示科学知识和信息之间的联系,也被称为信息可视化、知识可视化、数据可视化和引文分析可视化等。其中最受关注的是科学知识图谱,反映了科学计量学和信息计量学研究领域的最新进展,具有广阔的应用前景。

科学知识图谱是基于引文分析理论和信息科学与技术发展起来的、国际上新兴的可视化研究方法,目的是应用图示的方法揭示出学科领域的发展及演进趋势、研究课题的扩散与传播、作者或机构间的关系等等。具体方法包括引文分析、共引分析、多维尺度分析、因子分析、聚类分析、词频分析、社会网络分析等。主要应用领域为:(1)明确主要研究领域、专家、机构、授权、出版物、期刊和特定研究领域的其他关键主题词,以及这些主题词之间的内部联系;(2)明确各研究领域之间的知识输入与知识输出;(3)科学研究领域的动态变化(如增长速度,多样化等);(4)信息生产和传播中的经济因素;(5)科学社会网络,科学家、研究机构和国家之间的科研合作网络;(6)明确战略的作用和政府项目的应用研究;(7)科学论文引文分析,技术专利分析和引用论文专利与股票价值的联系。目前科学知识图谱在科学计量学和信息计量学中的研究热点主要集中在共引分析(包括文献共引、作者共引、机构共引、期刊、学科)、共词分析(包括主题词和关键词共现)、词频分析(统计分析和聚类分析)和社会网络分析(包括科学家、机构和国家三个层次的科研合作网络分析)三个方面[37,44-59]。

6 结论及讨论

知识网络类型丰富,结构复杂,研究视角多样,以不同的知识单元为知识节点,以知识单元之间的联系为链接都可以形成不同的知识网络。知识网络具有一定的共性,即都由一定数量的知识节点(知识单元)及其相互间的关联构成,因此可以用知识网络广度、知识网络深度、知识关联强度和知识链接方向四个重要指标来反映和测度知识网络中知识单元的关联度。本文对此做了初步研究,并发现目前情报学、文献计量学、科学计量学、知识管理、计算机科学、信息科学、社会学等学科领域正在研究的引文分析、共引分析、共词分析、词频分析、共现分析、相关文献和非相关文献分析、社会网络分析、语义网络分析、概念网络分析、知识组织、信息检索、知识地图、科学地图和科学知识图谱等都涉及知识网络的测度问题,分别使用了不同的测度指标、方式和方法来揭示、反映并显示知识网络中知识单元间的联系,可见知识网络及其测度问题具有广阔的应用前景。知识网络及其测度是一种十分复杂的研究课题,目前需要整合各学科的理论和方法,开展更为深入的综合研究。

(来稿时间:2008年10月)

标签:;  ;  ;  ;  ;  ;  ;  ;  

知识网络及其度量研究_知识地图论文
下载Doc文档

猜你喜欢