社会网络可视化的技术方法与工具研究,本文主要内容关键词为:工具论文,方法论文,社会论文,技术论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
随着社会网络数据规模的膨胀和类型的多样化,文字和表格已无法展现其内部结构,人们迫切需要新的方法来展示社会网络,而信息可视化技术正是解决上述难题的重要手段之一。通过对网络中节点之间的联系进行可视化建模,社会网络可视化技术能科学高效地反映、揭示社会网络中各种复杂关系及其变化规律并帮助人们加深对社会网络结构的理解和交流[1],因此它对社会科学、生物医学、物理学等众多领域的研究都有重要意义。
社会网络可视化是融合社会网络分析、可视化这两个不同学科知识的研究领域。它以社会网络分析理论和统计方法为基础,借助可视化静态显示技术协助人们对社会网络进行观测分析,同时也通过可视化动态交互技术来帮助人们进一步挖掘社会网络中的潜在规律。目前国内外已有大量学者利用社会网络可视化软件(如UCINET[2]、Pajek[3]、NWB[4]等)对知识管理、人际传播、Web分析等领域进行研究并取得了丰硕的成果。笔者在查阅了近10年来国内外相关研究成果后,归纳了目前社会网络可视化的技术方法、分析工具和发展趋势。
2 研究背景
2.1 可视化
Crosby[5]把现代科学发展如此迅速的原因归结为两方面:测量方法变得越来越快速和规范;可视化的运用。可视化技术作为连接两个最强大的信息处理系统——人的大脑和计算机的桥梁,它利用人的自然优势——快速视觉模式,把数据、信息和知识转换成可视化的形式以方便识别。它是一个融合多学科知识的领域,如计算机图形学、图像处理、计算机辅助设计、人机交互以及人工智能等,其主要特点如下:
(1)交互性:方便用户以交互的方式管理和开发数据;
(2)多维性:反映对象或事件数据的多个属性或变量,也可以按每一维的值对数据进行分类、排序、组合;
(3)可视性:用图像、曲线、二维图形、三维体和动画来显示数据,并对其模式之间的关系进行可视化分析[6]。
2.2 社会网络分析
社会网络分析按照研究群体的不同可分为两种基本的类型:自我中心网络(Ego-centered Networks)分析和整体网络(Whole Networks)分析。自我中心网络是从个体的角度来界定社会网络,以特定的行动者为研究中心,只考虑与该行动者相关的联系,以此来研究个体行为如何受到其人际网络关系的影响。而整体网络关注的焦点则是网络整体,即一个社会体系中角色关系的综合结构或群体中不同角色的关系结构[7]。这两种类型的社会网络采用不同的分析方法,其指标如表1所示。
就技术方法而言,整体网络分析主要采用专门的社会网络分析软件对中心性、子群、位置角色等方面进行分析,并通常会借助可视化技术来对网络进行探索分析。而自我中心网络分析主要运用SPSS、R[10]、Stata[11]等统计软件中的线性相关分析、协方差分析等模块来实现网络特性与结构分析,一般不涉及网络可视化分析。本文的社会网络可视化技术方法主要是指整体网络分析领域的可视化技术方法。
综上所述,社会网络可视化是可视化和社会网络分析相结合的产物。可视化技术能使社会网络分析结果更具直观性和解释力,它通过对社会网络分析指标的可视化转换,让人们能直接观察到网络的整体结构、群聚情况以及节点中心度等。同时,社会网络分析指标可以为可视化结果提供更准确、详细的统计数据,以支持研究结论的推导和网络特征的挖掘。在由网络指标分析发展到可视化分析的过程中,社会网络可视化逐渐形成了其自身的技术方法体系。根据这些方法功能的不同,将其大致分为:静态表示方法和动态交互方法。
3 社会网络可视化的静态表示
目前社会网络可视化的静态表示多数采用社群图(Sociogram)方法,又称节点连接图法(Node-link Diagram)。它是由表示行动者(Actors)的点和表示行动者之间关系(Connections)的线组成的一种关系模式[1]。其中,节点的布局方法直接决定了其静态视图的可读性和解释力,是实现社会网络可视化静态表示的关键环节。本文参照Shneiderman等[12]提出的网络节点布局方法分类标准,将社会网络可视化静态表示方法主要归纳为以下5类:
(1)力导引布局(Force-directed Layout)
力导引布局,又称弹性布局(Spring-embeded Layout),是模拟力学平衡原理,将图中节点模拟为钢环,连接模拟为弹簧,通过不断调整钢环位置来使物理系统达到力学平衡,从而实现布局的方法[13]。由于具有能充分展现网络整体结构及其自同构特征等优点,力导引布局成为使用范围最广的布局方法。目前针对该布局的改进算法很多,如:FR(Fruchterman-Reingold)算法[14]、KK(Kamada Kawai)算法[15]等。其缺点是每次循环都必须计算每对节点间的力,算法复杂度较高。
(2)地图布局(Geographical Map Layout)
地图布局是一种简单且易于理解的网络节点布局
方法,它以世界(大洲、国家、省或市)地图作为背景,根据节点的地理坐标将其布局在背景图上,然后根据节点间连接关系绘制网络边[14]。其优点是符合人类视觉思维,可直观展现节点的地理分布,且能准确定位节点;缺点在于节点位置过于固定,节点交叠、边交叉问题严重[13]。
(3)环状布局(Circular Layout)
环状布局是一种在圆心放置一个或一组节点并在同心圆周上按顺序布局其余节点的布局方法[12]。它能便于用户识别网络中度较大的节点,也能较规则地反映出网络节点规模和密集程度。缺点是忽视网络拓扑属性,无法观察节点之间联系的紧密程度和局部社团的结构特征。此外,环状布局法可扩展为放射状布局(Radial Layout)或雷达布局,也称为自我中心布局(Egocentric Layout),这种布局方法根据网络节点的排列顺序,将优先度最高的节点放置在网络中心,其余节点再按照关联程度沿放射线依次排布[12]。
(4)层次布局(Substrate-based Layout)
层次布局是一种首先根据节点的分类属性将屏幕划分为几个区域,然后在其对应区域中布局节点的方法[12]。这种方法有效利用了节点的属性信息,增加了网络图所包含的信息量,有助于用户发现部分趋势及关系信息。其缺点在于:网络可视化质量很大程度上取决于分层属性选取的科学性;对网络自身结构特征反映不明显等[13]。层次布局中的一种特例是树型布局(Treemap Layout),这种布局方法按照一定标准将节点进行分层,通过树型结构来强调节点间接连的层次关系,其中节点间距离通常用于表现节点相似度、网络时延等权值信息[16]。
(5)时间布局(Time-oriented Layout/Temporal Layout)
时间布局是一种根据节点时间顺序进行排布的方法。优点在于能清晰反映网络节点随时间的演化规律,但对于除时间属性外的其他网络结构特性表现力不足,且容易产生节点交叠问题[13]。
此外,还有几种通常不单独使用的布局方法,如相对空间布局(Spatial Calculated Layout)、聚类布局(Cluster Layout)、随机布局(Random Layout)和手工布局(Hand-made Layout)。其中聚类布局、随机布局和手工布局通常只作为节点连接图初始化、更新或改进的辅助布局方法。科学的布局能提高节点连接图的可读性,从而让用户快速掌握网络整体结构等信息,但若要对某一子群等局部区域进行深度的可视化分析,则往往还需要借助社会网络分析工具的动态交互技术[17]。
4 社会网络可视化的动态交互
动态交互是在可视化探索过程中通过人机交互来提高用户对数据的感知能力,基本思想是通过交互图来增强可视化结构,帮助用户理解数据、交互查询、探索结论,使静态表示变成可操控(Animated)的可视化[18]。本文参照Keim[18]提出的信息可视化交互技术分类标准,将社会网络可视化动态交互方法主要归纳为以下5类:
(1)关联更新法(Brushing and Linking)
关联更新是针对多维数据集的简单可视化交互技术,其本质上是对系统不同视图变换技术的合并。其中每种视图变换技术对应一个视图,从而克服了单一视图变换技术的缺点[18]。在高亮显示系统中,用户可通过对比不同视图来从不同侧面发掘已选择点的数据特征,从而总结出数据的特点、性质和规律。社会网络分析工具通常会使用关联更新技术来协调不同布局的社群图、数据窗口与可视化视图等多个视图。如图1所示,社会网络分析工具MixVis[19]的界面可分为数据查询窗口(a)、社群图展示窗口(b)、社团窗口(c)和标签窗口(d)。当用户在标签窗口(d)中选择一个标签时,社群图展示窗口(b)中会使用相同颜色来高亮同一个社团及其成员,社团窗口(c)中也会高亮对应的社团标志,从而方便用户从视觉上区分相关成员及联盟。
图1 关联更新的示例
(2)动态投影法(Dynamic Projections)
动态投影是一种通过降维来获得多维数据动态视图的可视化技术。传统的静态投影法主要利用二维散点图来探索多维数据集合中各个数据维之间的关系。而动态投影法区别于静态投影法之处,就在于其投影角度是可动态变换的,因此它被形象描述为在多维欧几里得空间里录制降维图形流的移动电影摄像机[20]。但是随着数据维数增加,可能的投影组合会呈指数级增加,处理难度也会越来越大[21]。
(3)动态查询法(Dynamic Queries)
动态查询主要是通过为用户过滤无用信息或设置信息的排序,使其能更直接地聚焦在感兴趣的检索结果上的一种交互技术。用户能利用此技术来直接操作信息资源,如控制实时反馈、调整过滤参数、修订检索提问、排序控制等[22]。目前它已在多种社会网络分析系统(如Spotfire[23]、Attribute Explorer [24])中得到应用。
社会网络分析工具GUESS[25]为用户提供了动态查询控制工具来辅助数据分析和可视化探索等操作。图2是初始社群图,图3是用户在滑板上选择频率阈值后GUESS实时过滤后显示的社群图,网络中未满足筛选条件的边和点则被隐藏。
图2 动态查询前的社群图示例
图3 动态查询后的社群图示例
(4)交互式缩放法(Interactive Zooming)
交互式缩放是一种通过放大可视化结构或改变视角以显示细节的交互技术。其主要利用变换移动缩放(Zoom in/Zoom out),平移(Pan)或裁减(Clip)的方式来进行视图变换[26]。Igarashi等[27]提出了一种在平移的视图变换过程中实现自动视图缩放的方法——以用户平移视图的速度为参数,自动调节视图的缩放比例以满足用户的阅览要求。目前,交互式缩放在MGV和其他可扩展框架中都有广泛运用[18]。
(5)交互式变形法(Interactive Distortion)
交互式变形是在保持社会网络整体视图的基础上显示焦点区域详细信息以辅助用户数据挖掘的一种交互技术[18]。其主要思想是在保持图形完整性的基础上,对某一选定区域周围的图形进行放大,而远离选定区域的图形则相对缩小。常见交互式变形方法有鱼眼(Fisheye)、双曲线变形(Hyperbolic Distortions)、球面变形(Spherical Distortions)、多焦点显示(Polyfocal Display)、双焦点(Bifocal Lens)、透视墙(Perspective Wall)等方法[28]。
图4表示没有使用鱼眼技术之前的放射状布局社群图。而图5是保持布局方法不变,使用了极坐标鱼眼(Polar Fisheye)技术[28]得到的社群图。图6是保持焦点位置不变,使用笛卡尔坐标鱼眼(Cartesian Fisheye)技术[29]进行变形并采用层次布局法生成的社群图。
图4 鱼眼变形前社群图示例
图5 极坐标鱼眼变形图示例
图6 笛卡尔坐标鱼眼变形图示例
5 典型社会网络可视化工具
目前具有可视化效果的社会网络分析软件已有50多种[29],它们大多不仅具有社会网络分析的统计功能,还能为用户提供多种静态布局和动态交互的可视化功能。本文选取其中5个进行介绍。
(1)UCINET
UCINET(University of California at Irvine Network)[2]是加州大学欧文分校的一群网络分析者开发的一个社会网络分析软件。UCINET可以处理分析1-模网络和2-模网络,并能对网络假设进行检验,如QAP矩阵相关和回归、定类数据和连续数据的自相关检验等。此外,UCINET集成了可对一维与二维数据进行统计和可视化分析的NetDraw[30],包括NetDraw的多种布局算法,如:力导引、环状、地图等布局算法[30]。此外,UCINET还集成了三维图形展示分析软件MAGE[31]。因此UCINET在网络结构可视化、用户交互性探索等方面都有不错的效果。
UCINET是当前主流的综合性社会网络分析工具之一。与其他专门针对社会网络的统计分析软件如内含实证网络分析仿真研究SIENA(Simulation Investigation for Empirical Network Analysis)模块的StOCNET[32]以及STRUCTURE[33]相比,UCINET的优点在于其具有可视化功能且界面友好。
(2)Pajek
Pajek[3]是卢布尔雅那大学研究团队为处理大型数据集而专门设计开发的一款网络分析和可视化软件。Pajek不仅可对普通网络进行分析,还可同时分析多种网络,如:2-模网络、多关系网络(Multi-relational Networks)、暂时性网络(Temporal Networks)等。Pajek也提供基于过程的分析功能,包括探测结构平衡和聚集性、分层分解、构建和解释团块模型等。Pajek能提供二维、三维的网络可视化功能,其布局方式主要有环状布局和力导引布局。Pajek的一大特色是能分析内含100万个以上节点的超大型网络,它把大型网络划分为不同的亚结构再分别予以可视化。
针对大型数据集的分析工具,除了Pajek外,还有MultiNet[34]和NodeXL[35]等。不过Pajek大部分分析功能是非统计性的,如果要对社会网络进行详细的统计分析,还需要配合StOCNET[32]等统计功能较强的软件。
(3)NWB
NWB(Network Workbench)[4]是由美国印第安纳大学、东北大学、密歇根大学的研究团队为多学科的大型网络分析、建模和可视化而开发的一个工具包。除了具有基本统计功能外,NWB也可对2-模网络和复杂网络、P2P网络和暂时性网络进行分析。NWB集成了力导引、环状、放射状、小世界布局和DrL大型网络布局等算法,成为目前少数能处理内含100万个以上节点网络的软件之一。由于集成了GUESS工具包[25],NWB在布局及交互方面具有较好的灵活性,而且GUESS使用的图形化前端解释语言Jython也极大地提高了NWB的易用性。
NWB在科学计量学领域内的社会网络分析功能已相当多样。与另一款常用的软件CiteSpace[36]相比,NWB虽然缺少时区视图、地区视图分析功能,但是它也增设了不少功能,如重复节点自动剔除、著者与论文2-模关系分析、K-核提取等[4]。
(4)NodeXL
NodeXL(Network Overview Discovery Exploration for Excel)[35]是由微软研究院Marc Smith团队及众多研究机构为网络可视化分析而开发的一个Excel外接程序。NodeXL不仅具备常见的分析功能,如计算中心性、PageRank值、网络连通度、聚类系数等,还能对暂时性网络进行处理。在布局方面,NodeXL主要采用力导引布局方式。NodeXL的一大特色是可视化交互能力强,具有图像移动、变焦和动态查询等交互功能。其另一特色是可直接与互联网相连,用户可通过插件或直接导入Twitter、YouTube、Email或网页中的数据。
目前,具有针对暂时性网络的可视化探索、筛选和群聚功能的社会网络分析工具中,典型的有适用于大型网络的NodeXL和适用于中小型网络的SocialAction[37]。两者在用户交互算法和界面设计上都比较人性化,易用性较好。
(5)Gephi
Gephi[38]是由法国SciencesPo、Linkfluence等研究机构合作研发的一款网络分析领域的数据可视化软件,其目标是成为“数据可视化领域的Photoshop”。除了基本的中心性分析、凝聚子群分析外,Gephi也提供小世界网络分析、链接分析等复杂网络分析功能和动态网络分析功能。其布局方式主要有力导引布局和Yifan's Hu多层次布局。Gephi采用多任务架构框架,并装配有快速3D渲染引擎和自适应OpenGL引擎,因此它在网络探索方面具有较强的互动性和较高的效率。
近年来,基于互联网的社会网络研究已成为社会网络分析领域的研究热点。由于Gephi可通过外接网络爬虫来实时获取互联网的信息,而且其动态网络分析功能强、效率高、可视化效果佳,因此Gephi常用于互联网中的人际关系、信息传递、知识共享等网络的研究。
上述5种软件对比如表2所示。
可以看出,目前典型的社会网络可视化软件大多是免费开源的,它们主要面向中大型数据集,普遍有较好的兼容性、全面的非统计分析功能和较强的可视化效果:如3D展示效果等。此外,其中不少软件已具备动态网络分析功能,如Pajek、NWB等。
6 社会网络可视化发展趋势
目前社会网络可视化分析方法被广泛地应用到多个学科领域的研究当中,它能让研究者快速地对大量数据进行观察、交互,发现其中潜在的规律和模型。同时,其理论和技术、工具也在实践中得到不断发展和创新,主要表现为以下三种趋势:
6.1 从二维可视化到三维可视化
随着社会网络规模扩大化和结构复杂化,二维社群图要在满足绘图审美标准的原则下合理布局节点和边变得越来越困难。其面临的问题主要有:并非所有二维社群图均能达到无边相交的要求;二维布局算法存在多种局限,如平面图中难以找到一个能说明社团边界的布局[40];密度较大的社会网络显示效果不好等。而三维空间的布局、导航和符号体系能在某种程度上有效地缓解这些问题[41]。
Pajek是最早具有三维布局功能的网络分析软件之一,但是其关于透视性的线索太少,以至于三维效果说服力不足[1]。网络分析软件MultiNet[34]也可产生三维图像且允许用户旋转图像和节点,创新之处在于其允许用户使用红/绿色立体眼镜,以更好地洞察三维空间[1]。而后来出现的三维图形展示软件MAGE[31]的空间展示能力更强大,它可通过读取并演示Kinemage格式(一种电脑图像交互式演示格式)文件,实现社群图的实时旋转、三维动画演示、隐藏部分图形等功能。越来越多的社会网络分析软件都具备了三维可视化功能,同时三维的布局算法也会朝着符合人类认知习惯的目标不断改进,三维、可控的可视化技术方法也会得到更广泛的应用。
6.2 从静态网络可视化到动态网络可视化
传统的社会网络可视化通常是对某一时间点上静态网络的可视化分析,它能较好地反映网络演化过程中的某一中间状态,但难以支持节点属性、网络结构及子群分布演化等信息的挖掘。为了解决此问题,研究者们提出了动态网络可视化方法。
早期动态网络可视化主要采用时间曲线图[42]来反映一段时间内网络统计指标的变化情况[43]。随着动态网络分析的深入,研究者们借助网络快照(Snapshot)来记录网络的具体变化,如Powell等[44]利用快照中节点形状来标记节点的新增情况。为了便于不同快照间的对比分析,Moody等[45]提出静态手翻书(Static Flip Books)的方法,保持节点布局的稳定性,只记录连接形成、节点的新增和移动等动态变化。Federico等[46]在此基础上提出了一致性布局方法,通过保持快照间网络结构的一致性来反映网络结构的演化过程。近年来,也有不少研究者采用视频流(Movies)的可视化方法[47]——把离散的快照按时间顺序排列并通过使帧部分重叠、插入附加帧等方法使其连贯起来,或利用实时连续的动态网络数据制作图形流。目前如SoNIA[47]、Gephi[38]等软件都已具有视频流可视化功能。随着动态网络可视化方法和实践的不断增多,其对网络演化机制、发展趋势的分析效果也会进一步提高,动态可视化方法也会成为社会网络可视化的重要分析方法之一。
6.3 从单一可视化到混合可视化
社会网络的表示方式主要有两种:节点连接图和邻接矩阵[1]。节点连接图因拥有简洁直观、便于观察网络结构和识别子群等优点而被绝大多数的社会网络可视化工具所采用[29]。但不少研究者在实际操作中发现,节点连接图不适用于稠密网络[48]。而邻接矩阵法虽然不够直观且难以支持路径相关分析,但是其优点在于分析效果受网络规模、密度的影响较小[29]。
为了结合两者的优点,Henry等设计多种混合使用这两种表示方法的软件——MatrixExplorer[49]、MatLink[50]和NodeTrix[29]。MatrixExplorer采用双重表示系统,可提供同步的邻接矩阵和节点连接图双重视图,并具有多维转置、聚类等交互功能,但其不足在于无法较好地将两种视图整合起来。MatLink的改进之处在于通过把线性的节点连接图覆盖在矩阵的行上实现了两种视图的融合。NodeTrix是该团队的最新研究成果,通过节点连接图来呈现网络映像部分(Arbitary Portion)以揭示网络结构,同时也可通过邻接矩阵来展示密度大的局部网络。通过观察NodeTrix中社群在矩阵和社群图之间的平缓转换,用户可了解到社群内、社群间连接的形成过程,进而得到社群间的关系以及社群内关键角色等信息[29]。随着复杂网络研究的进一步深入,这种受网络规模、密度局限较小的混合可视化方法也会成为社会网络可视化的重要分析方法之一。
7 结语
目前,社会网络可视化是社会网络分析和可视化技术领域的研究热点之一,本文综述了社会网络可视化的理论基础、技术方法以及典型工具,并进一步总结了其发展趋势。从社会网络可视化工具介绍可以发现,通过结合人机交互、信息可视化等技术可以提高社会网络可视化工具的用户友好性和机器自动处理能力,从而使得更多科学领域乃至商业、传媒等行业的工作人员也可以轻易地掌握社会网络分析的能力并运用到实践当中。同时从社会网络可视化的三维化、动态化、混合化的发展趋势可以发现,通过结合复杂网络、系统动力学、本体论等方面的理论和方法可以提高社会网络可视化工具对大型复杂网络的分析效果以辅助研究人员进一步挖掘社会网络的模式和演化规律。总之,随着社会网络可视化技术方法和工具的不断发展,社会网络可视化将逐步改善其分析工具的易用性,扩展其分析方法的适用范围,进一步提高分析结果的可靠性和科学性。
收稿日期:2012-04-28
收修改稿日期:2012-05-07
作者E-mail:1097253898@qq.com
标签:社会网络论文; 可视化技术论文; 可视化管理论文; 网络节点论文; 三维可视化论文; 网络结构论文; 用户研究论文; 社会结构论文; 静态分析论文; 功能分析论文; 用户分析论文;