社会网络分析法及其在情报学中的应用,本文主要内容关键词为:分析法论文,情报论文,学中论文,社会论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
社会网络分析法是在人类学、心理学、社会学、数学以及统计学等领域中发展起来的,已经经历了70多年的历史。至今,社会网络分析法已经形成了一系列专有术语和概念,被广泛应用于社会学研究中,成为社会科学研究的一种新的范式。作为一种非常有用的方法,社会网络分析法早已突破了社会学领域的范围,为其他领域的学者所采用。一直善于借助其他学科研究方法为自身所用的情报学领域也开始关注这一有效的研究方法,并取得了一些成果。本文旨在介绍社会网络分析法的基本概念、分析角度,归纳总结国内外情报学研究领域对社会网络分析法的应用现状。
1 社会网络分析法
1.1 概述
“社会网络”指的是社会行动者(Actor)及其间的关系的集合。也可以说,一个社会网络是由多个点(社会行动者)和各点之间的连线(行动者之间的关系)组成的集合。社会网络中所说的“点”是各个社会行动者,而社会网络中的“边”指的是行动者之间的各种社会关系。关系可以是有向的,也可以是无向的。同时,社会关系可以表现为多种形式,如人与人之间的朋友关系、上下级关系、科研合作关系等,组织成员之间的沟通关系,国家之间的贸易关系等。社会网络分析(Social Network Analysis,SNA)就是要对社会网络中行为者之间的关系进行量化研究,是社会网络理论中的一个具体工具。
图论是社会网络分析的基础数学理论之一,社会网络的形式化描述可分为社会关系网络图及社会关系矩阵。在图论中,网络可以分为有向网络和无向网络。因此,社会关系网络也可以分为有向和无向两种。社会关系网络图由一组节点N={n[,1],n[,2],…,n[,k]}及节点间的连线L={l[,1],l[,2],…,l[,m]}所组成。在无向网络中,节点之间的连线是没有方向的,用直线表示,如图1所示。
图1 社会关系网络图(无向)
在有向网络中,节点之间的连线是有方向的,用带箭头的直线表示,图2就是一个简单的有向网络图。
图2 社会网络关系图(有向)
用网络图的方式表现社会关系的比较直观,可以很清晰地观察社会网络的成员及他们之间的关系。但是当所研究的社会网络规模比较大时,社会关系网络图将变得十分复杂。同时,这种表达方式也不利于对社会关系进行定量分析,而社会关系矩阵则可以避免这种弊端。社会关系矩阵是由社会关系网络图转换而来的,矩阵元素表示行为者之间的关系。社会关系矩阵的表达形式比较规范,利于计算机进行处理,是计算机存储及进行定量分析的基础。
为了简单明了地说明问题,下面就以无向网络为例。假设在该无向社会网络关系中,仅考虑行动者之间有无关系,而不考虑关系的强度,因此用1表示两者之间存在某种关系,而0表示两者之间不存在某种关系。表1是由图1转换而来的简单的社会关系矩阵,从中可以看出,用二值表示的无向网络关系的矩阵是对称矩阵。
1.2 社会网络基本概念
经过多年的发展,社会网络分析法已经形成了比较完整的理论体系,涉及的概念和术语很多,这里仅解释几个重要的概念。
1)度数。在社会网络图中,如果两个点由一条线相连,则称这两个点为“相邻的”。与某点相邻的那些点称为该点的“邻点”,一个点n[,i]的邻点的个数称为该点的“度数”(Nodal Gegree),记做d(n[,i]),也叫关联度[1]。在无向网络中,一个点的度数就是与该点相连的线的条数。在有向网络中,点的度数分为点入度和点出度。一个点的点出度是网络中以该点为起点的有向边的数目,点入度是网络中以该点为终点的有向边的数目[2]。
2)密度。密度(Density)是社会网络分析最常用的一种测度,是图论中一个得到广泛应用的概念。密度是网络中实际存在的关系数目与可能存在的最多关系数目之比。如果一个网络的密度为1,则意味着该网络中的每个点都和其他点相连,反之,若该网络的密度为0,则意味着该网络中任何点都不相连[3]。密度表达的是网络中点之间关系的紧密程度。对一个规模确定的网络来说,点之间的连线越多,则该图的密度越大。
3)捷径。捷径(Geodesics,也译为测地线)即两点之间最短的途径[4]。在图1中,a—f—b,a—f—e—b,a—f—e—d—c—b都是途径。a—f—b经过了2条线,a—f—e—b经过了3条线,而a—f—e—d—c—b则经过了5条线,因此a—f—b为从a到b的捷径。
4)距离。两点之间的捷径的长度叫做两点之间的距离[1]。因此图1中a和b之间的距离为2。如果两点之间不存在途径,即两点之间不存在直接关系,也不能通过其他点建立其联系,则称两者之间的距离是无限的。
5)关联图。如果在一个网络图中,在任何一对节点之间都存在途径使之相连,则此图是关联图[4](Connected Graph)。图1就是一个关联图。如果一个图不是关联的,则称之为“不关联图”(Dis-connected Graph)。
2 社会网络分析法的分析角度
社会网络分析法可以从多个不同角度对社会网络进行分析,包括中心性分析、凝聚子群分析、核心—边缘结构分析以及结构对等性分析等,这里仅介绍前3种。
2.1 中心性分析
“中心性”是社会网络分析的重点之一。个人或组织在其社会网络中具有怎样的权力,或者说居于怎样的中心地位,这一思想是社会网络分析者最早探讨的内容之一[1]。个体的中心度(Centrality)测量个体处于网络中心的程度,反映了该点在网络中的重要性程度。因此一个网络中有多少个行动者/节点,就有多少个个体的中心度。除了计算网络中个体的中心度外,还可以计算整个网络的集中趋势(可简称为中心势)(Centralization)。与个体中心度刻画的是个体特性不同,网络中心势刻画的是整个网络中各个点的差异性程度,因此一个网络只有一个中心势[3]。根据计算方法的不同,中心度和中心势都可以分为3种:点度中心度/点度中心势,中间中心度/中间中心势,接近中心度/接近中心势。
2.1.1 点度中心性 在一个社会网络中,如果一个行动者与其他行动者之间存在直接联系,那么该行动者就居于中心地位,在该网络中拥有较大的“权力”。在这种思路的指导下,网络中一个点的点度中心度,就可以网络中与该点之间有联系的点的数目来衡量,这就是点度中心度。
网络中心势指的是网络中点的集中趋势,它是根据以下思想进行计算的:首先找到图中的最大中心度数值;然后计算该值与任何其他点的中心度的差,从而得出多个“差值”;再计算这些“差值”的总和;最后用这个总和除以各个“差值”总和的最大可能值。
2.1.2 中间中心性 在网络中,如果一个行动者处于许多其他两点之间的路径上,可以认为该行动者居于重要地位,因为他具有控制其他两个行动者之间的交往能力。根据这种思想来刻画行动者个体中心度的指标是中间中心度,它测量的是行动者对资源控制的程度。一个行动者在网络中占据这样的位置越多,就越代表它具有很高的中间中心性,就有越多的行动者需要通过它才能发生联系[4]。
中间中心势也是分析网络整体结构的一个指数,其含义是网络中中间中心性最高的节点的中间中心性与其他节点的中间中心性的差距。该节点与别的节点的差距越大,则网络的中间中心势越高,表示该网络中的节点可能分为多个小团体而且过于依赖某一个节点传递关系,该节点在网络中处于极其重要的地位。
2.1.3 接近中心性 点度中心度刻画的是局部的中心指数,衡量的是网络中行动者与他人联系的多少,没有考虑到行动者能否控制他人。而中间中心度测量的是一个行动者“控制”他人行动的能力。有时还要研究网络中的行动者不受他人“控制”的能力,这种能力就用接近中心性来描述。在计算接近中心度的时候,我们关注的是捷径,而不是直接关系。如果一个点通过比较短的路径与许多其他点相连,我们就说该点具有较高的接近中心性。对一个社会网络来说,接近中心势越高,表明网络中节点的差异性越大,反之,则表明网络中节点间的差异越小。
2.2 凝聚子群分析
当网络中某些行动者之间的关系特别紧密,以至于结合成一个次级团体时,这样的团体在社会网络分析中被称为凝聚子群。分析网络中存在多少个这样的子群,子群内部成员之间关系的特点,子群之间关系特点,一个子群的成员与另一个子群成员之间的关系特点等就是凝聚子群分析。由于凝聚子群成员之间的关系十分紧密,因此有的学者也将凝聚子群分析形象地称为“小团体分析”。
2.2.1 凝聚子群 根据理论思想和计算方法的不同,存在不同类型的凝聚子群定义及分析方法。
1)派系(Cliques)。在一个无向网络图中,“派系”指的是至少包含3个点的最大完备子图。这个概念包含3层含义:①一个派系至少包含三个点。②派系是完备的,根据完备图的定义,派系中任何两点之间都存在直接联系。③派系是“最大”的,即向这个子图中增加任何一点,将改变其“完备”的性质。有向网络中派系的概念十分严格,这里不再介绍。
2)n-派系(n-Cliques)。对于一个总图来说,如果其中的一个子图满足如下条件,就称之为n-派系:在该子图中,任何两点之间在总图中的距离(即捷径的长度)最大不超过n。从形式化角度说,令d(i,j)代表两点n[,i]和n[,j]在总图中的距离,那么一个n-派系的形式化定义就是一个满足如下条件的拥有点集N[,s]的子图,即:d(i,j)≤n,对于所有的n[,i],n[,j]∈N[,s]来说,在总图中不存在与子图中的任何点的距离不超过n的点。
3)n-宗派(n-Clan)。所谓n-宗派(n-Clan)是指满足以下条件的n-派系,即其中任何两点之间的捷径的距离都不超过n。可见,所有的n-宗派都是n-派系。
4)k-丛(k-Plex)。一个k-丛就是满足下列条件的一个凝聚子群,即在这样一个子群中,每个点都至少与除了k个点之外的其他点直接相连。也就是说,当这个凝聚子群的规模为n时,其中每个点至少都与该凝聚子群中n-k个点有直接联系,即每个点的度数都至少为n-k。
2.2.2 凝聚子群密度 凝聚子群的密度(External-Internal Index,E-I Index)主要用来衡量一个大的网络中小团体现象是否十分严重。这在分析组织管理等问题时十分有用。最糟糕的情形是大团体很散漫,核心小团体却有高度内聚力。另外一种情况就是大团体中有许多内聚力很高的小团体,很可能就会出现小团体间相互斗争的现象。
凝聚子群密度的取值范围为[-1,+1]。该值越向1靠近,意味着派系林立的程度越大;该值越接近-1,意味着派系林立的程度越小;该值越接近0,表明关系越趋向于随机分布,看不出派系林立的情形[5]。
E-I Index可以说是企业管理者的一个重要的危机指数。当一个企业的E-I Index过高时,就表示该企业中的小团体有可能结合紧密而开始图谋小团体私利,从而伤害到整个企业的利益。其实E-I Index不仅仅可以应用到企业管理领域,也可以应用到其他领域,比如用来研究某一学科领域学者之间的关系。如果该网络存在凝聚子群,并且凝聚子群的密度较高,说明处于这个凝聚子群内部的这部分学者之间联系紧密,在信息分享和科研合作方面交往频繁,而处于子群外部的成员则不能得到足够的信息和科研合作机会。从一定程度上来说,这种情况也是不利于该学科领域发展的。
2.3 核心—边缘结构分析
核心—边缘(Core-Periphery)结构分析的目的是研究社会网络中哪些节点处于核心地位,哪些节点处于边缘地位。核心边缘结构分析具有较广的应用性,可用于分析精英网络、科学引文关系网络以及组织关系网络等多种社会现象中的核心—边缘结构。
根据关系数据的类型(定类数据和定比数据),核心—边缘结构有不同的形式。定类数据和定比数据是统计学中的基本概念,一般来说,定类数据是用类别来表示的,通常用数字表示这些类别,但是这些数值不能用来进行数学计算;而定比数据是用数值来表示的,可以用来进行数学计算[6]。如果数据是定类数据,可以构建离散的核心—边缘模型;如果数据是定比数据,可以构建连续的核心—边缘模型。而离散的核心—边缘模型根据核心成员和边缘成员之间关系的有无及关系的紧密程度,又可分为3种:①核心—边缘全关联模型;②核心—边缘局部关联模型;③核心—边缘关系缺失模型。如果把核心和边缘之间的关系看成是缺失值,就构成了核心—边缘关系缺失模型。这里介绍适用于定类数据的4种离散的核心—边缘模型。
1)核心—边缘全关联模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),另外一组的成员之间没有联系,但是,该组成员与核心组的所有成员之间都存在关系。
2)核心—边缘无关模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),而另外一组成员之间则没有任何联系,并且同核心组成员之间也没有联系。
3)核心—边缘局部关联模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),而另外一组成员之间则没有任何联系,但是它们同核心组的部分成员之间存在联系。
4)核心—边缘关系缺失模型。网络中的所有节点分为两组,其中一组的成员之间的密度达到最大值,可以看成是一个凝聚子群(核心),另外一组成员之间的密度达到最小值,但是并不考虑这两组成员之间关系密度,而是把它看作缺失值。
3 社会网络分析法在情报学领域的应用
根据E.Otte和R.Rousseau对CSA Sociological Abstracts Database(SA),Medline Advanced和PsycINFO 3个数据库中有关社会网络分析的文献的分析,发表论文最多的47位作者中,就有12位的文章被图书情报学专业数据库LISA所收录,足见社会网络分析对图书情报学专业研究也是非常重要并十分有用的[7]。
3.1 国外的应用
国外的研究主要集中在两个方面:合著网络的研究以及引文网络的研究。
1)合著网络研究。合著网络方面的研究成果比较多。在这些研究成果中,作者往往根据各自的研究目的选取一定范围的学者,或者是某一数据库中有关一个特定主题的所有文献的作者,或者是一个专业数据库中所有文献的作者。在构建社会网络时,将这些作者作为网络中的节点,而作者之间的合著关系则构成作者之间的连线,然后应用社会网络分析法对合著网络进行分析。
例如,Liu Xiaoming等人选择对ACM和IEEE各自的数字图书馆会议以及ACM/IEEE联合召开的数字图书馆会议JCDL(Joint Conference on Digital Library)的文献进行研究。他们首先根据社会网络理论建立起作者之间的合著网络,然后应用社会网络分析法中的中心性分析研究该合著网络。同时还在PageRank方法的基础上提出了AuthorRank方法,并应用该方法对合著网络进行分析。最后对两种方法的分析结果进行了一定的比较[8]。
另外,还有一些作者对经济学领域的合著网络进行了分析。他们选取RePEc(Research Papers in Economics)数据库中的所有作者,分别构建了二值合著网络和加权合著网络,并对两种网络都应用社会网络分析方法进行了中心性分析,最后对得出的结果进行比较,并分析了不同结果之间的相关性[9]。
也有学者对自然科学领域的合著网络进行了类似的研究。如M.E.J.Newman就应用社会网络分析方法对物理学、生物医学和计算机科学领域的合著网络进行了比较研究,指出了不同学科合著类型的差异[10]。
2)引文网络研究。大多数情报学家对引文分析都很熟悉,但是对社会网络分析比较陌生。不过网络分析人员的出发点是“社会结构可以用网络来表示——用一组节点和一组关系来表示他们之间的交互”。这种方法和引文分析家所使用的方法是一致的。因此,引文分析学者得出的结论是,社会网络分析将扩展他们的研究方法[11]。由于认识到这一点,国外很多学者都积极应用社会网络分析法进行引文分析,取得了丰富的研究成果。
引文网络(Citation Network)的构建也是以作者为网络节点,以作者之间的引用关系为网络连线。引文网络一般是有向网络,因为作者A引用了作者B的文献,并不代表作者B就一定引用了作者A的文献,所以用无向网络来表示就不太适合,这时就要采用有向网络。
前面已经提到,为了方便利用计算机进行量化处理,需要把网络图转换为关系矩阵。在国外学者的研究成果中,从网络图转换出的关系矩阵有两种:二值矩阵和赋值矩阵。所谓二值矩阵,就是用1和0表示两个作者之间的引用关系,如果A引用了B的文献,不管引用了多少次,只要有引用关系存在,都用1来表示二者之间的引用关系;反之,则用0表示二者之间不存在引用关系。表2就是从图2转换而来的二值矩阵(Binary Matrix)。从表2可以看出,用二值表示的有向网络的矩阵是非对称矩阵。
用二值矩阵来表示网络关系的优点是比较简单明了,其缺点是忽略了引用的次数,因此丢失了大量的信息,进行分析的结果可能与现实有些出入。比如,假设作者C引用A的文献的次数是两次,但是引用B的次数是10次,不难得出,C和B之间的关系比C和A之间的关系更为紧密。但是在表2中,C和A、C和B之间的引用关系都用1来表示,忽略了两者之间的差异。为了弥补二值矩阵的缺陷,学者们用赋值矩阵(Valued Matrix)来表示引文网络[12]。在加权矩阵中,不再用0和1表示作者之间的引用关系,而是用引用的次数表示两者之间的引用关系,如表3所示。从表3可以看出,用加权矩阵表示的引文网络也是非对称矩阵。
除了上述引用网络的构建外,学者们还提出了构建同被引网络的研究方法,用来分析作者的同被引情况[13](Author Co-citation Analysis)。在同被引网络中,作者是网络的节点,节点之间的关系是两位作者之间的同被引关系。可以用二值矩阵来表示同被引网络或者用加权矩阵来表示同被引网络。表4是以二值矩阵表示的同被引网络。
在这个矩阵中,矩阵元素值1表示两位作者同时被他人引用过,0则表示两位作者没有同时被他人引用过。从表4可以看出,作者A和B同时被他人引用过,作者B和C也同时被他人引用过,而作者B和C却没有同时被他人引用过。用社会网络分析法分析引文网络比较直观,同时还可以结合作者之间的社会关系,如同事关系、朋友关系等进行分析,因此是一种值得研究的方法。
3.2 国内的应用
从国内已有的研究成果来看,情报学领域应用社会网络分析法的学者和文献比较少,涉及的主题包括社会网络在竞争情报中的应用、图书馆资源配置,在互联网中的应用等。
1)在竞争情报中的应用。主要是使用社会网络分析法分析人际网络在竞争情报中的应用。这方面最早的文献是包昌火等人的《社会网络分析》。这篇文献在描述人际网络基本内容的基础上,论述了人际网络的构建和分析,为人际网络在竞争情报中的应用提供了理论和方法指导[14]。除此之外,在其他文献中,有些文献侧重于理论研究,如研究基于不同社会网络理论的企业人际情报网络模型及其构建策略[15];有些文献则侧重于实证分析,比如对竞争对手企业的人际网络的分析[16]。
2)在知识管理方面的应用。这方面的研究成果集中于探讨社会网络理论与知识管理的关系,研究如何应用社会网络理论和社会网络分析法促进组织中的知识共享,特别是隐性知识的共享。
在借助“社会网络分析”这一具体工具促进组织中隐性知识共享方面,有的学者进行了理论方面的分析,在定量方法基础上构建分析方法,为组织隐性知识共享提供具体的操作工具,尝试解决目前研究中面临的“说和做”的两难境地[17];有的学者进行了实证分析,以中国人民大学经济科学实验室为应用案例,对其社会网络进行数据收集、网络分析,获取了一些初步的成果,并结合该案例详细介绍了应用SNA促进隐性知识管理的具体步骤、问卷设计、数据收集、网络分析等关键环节[18]。
3)在其他方面的应用。其他方面的文献数量较少。有的学者研究社会网络分析法在图书馆资源配置中的运用,采用社会网络分析框架分析图书馆联盟,从社会网络资源配置的角度得出联盟存在的合理性和科学性[19]。有的学者利用社会网络分析法对科学学主题共词网络进行研究。主要是采用可视化手段对国际科学学与科学计量学领域中6种核心期刊的高频关键词的共词网络进行分析,利用社会网络分析的方法对共词网络进行聚类,指出科学、技术和创新活动的研究是科学学与科学计量学的主题,并在此基础上对科学学研究的若干热点、未来的研究方向进行了预测[20]。综上所述,国内的研究更多地停留在理论研究的层面上,进行实例分析和实证研究的比较少,即使有实例分析,采用的数据样本也是比较小的。而国外的研究则更多地侧重于实例研究,数据分析量也比较大,取得了较多成果,值得我们借鉴。
标签:社会网络论文; 文献分析法论文; 矩阵管理论文; 情报学论文; 社会关系论文; 网络模型论文; 关联矩阵论文; 矩阵论文;