人类时效交互网络的建模与传播研究综述
李 靖a,李 聪,李 翔
(复旦大学a.电子工程系自适应网络与控制实验室;b.信息科学与工程学院智慧网络与系统研究中心,上海 200433)
摘要: 时效人类交互网络有自身的动力学性质,可以通过定义相应的拓扑和时效特性来刻画;另一方面,时效网络所固有的结构特征对其上的动力学过程,如流行病传播过程,具有重要影响。本文从人类交互的类型与表示方法、时效网络的结构特征(网络拓扑、时效特征和时间尺度)、模型及时效网络中的传播动力学等多方面对时效人类交互网络的研究进展进行综述,并对目前的研究现状进行分析,展望了该领域未来的研究方向。
关键词: 时效网络;人类交互;网络模型;流行病传播
0 引言
人类具有社交性。在现实的社会系统中,每个人无时无刻都和不同的人接触交流,会发生多种多样的交互行为。这些交互行为可以发生在虚拟的网络空间上,如打电话、发邮件、微信聊天以及微博论坛上的互动等,也可以发生在现实的地理区域内,如性接触、面对面的谈话和因空间位置临近而相遇(类似于排队、集会以及地铁、公交和航空出行)等。前者一般称之为线上交互行为,而后者为线下交互行为。关于人类交互,在传统的社会学中定义为存在于两人之间,其中一个人所完成的某些动作须依据另一个人的存在以及与他的关系如何而定的行为[1]。自上个千禧年之末,两篇具有开创性意义的文章相继在《自然》和《科学》杂志上发表后[23],网络科学作为一种新兴的重要理论工具逐渐被用于分析人类交互行为中的特定规律,并为进一步研究网络拓扑结构的演化及其对网络系统上发生的动力学过程的影响提供了一个统一的框架。从网络的研究视角,把人看作节点,人与人之间的某种交互关系看作连边,人类复杂的交互行为就可以形象化地表示成一个人类交互网络。
在早期研究中,由于数据采集与存储设备的限制,反映线下真实人类交互行为的数据极其匮乏。大量的研究工作及成果都集中在分析以互联网为媒介的线上人类交互活动,主要思路是采取集聚的静态网络框架[49]。交互行为的时间属性在这些研究中往往被简单地忽略而不作考虑。尽管这种简化的技巧会带来计算和分析上的方便,但有关人类交互网络的拓扑性质以及网络上发生的动力学过程的研究,相比于实际情况,都存在一定的偏差与误解[1012]。例如,受到连边时序的影响,原本在集聚的静态网络中存在连边的两个节点在对应的时效网络中却不一定相互可达,即使这两个节点彼此可达也不一定具有相同的时间相关路径[10,1315]。类似地,时效网络与对应的集聚静态网络的差别还体现在网络中的最大联通片规模[11,1617]、网络上的随机游走[18]、网络传播的速率与感染范围[11,15,1921]以及网络免疫策略的设计[2223]等等。在现实生活中,人类的社会关系随着时间的推移不断发生变化,个体间进行的交互行为也具有时序先后性,并在一定的时间尺度下发生、结束与重建[10]。此外,现实中发生的很多传播过程(如流行病的传播)只能通过线下近距离交互的途径实现[2425]。以上这些,使得线下时效人类交互网络的分析与研究格外重要。近年来,由于技术的飞速发展,获取高分辨率的带有时间标签的人类通信和移动轨迹数据变得越来越便捷。移动通信技术采集得到的丰富数据为学者们提供了一种前所未有的视角来感知和分析人类行为中存在的规律特征。
1 人类交互行为的时效网络表示
在如今信息爆炸的大数据时代,人的集群交互行为使得丰富多样的信息(舆论或谣言)得以在人群中快速地传播。相比于传统的结构化数据,采用网络的形式来描述复杂的人类交互行为更加形象。人类交互网络的定义是以人为节点,人与人之间的某种社会交互行为为连边的网络。个体间的交互行为随时间推移不断发生改变,对应到网络上则表现为网络拓扑随着时间演化的过程。因此,实际的人类交互网络是一个典型的时效网络。接下来,我们介绍如何利用实际的人类交互数据构建时效人类交互网络,主要从数据的采集手段、人类交互的类型与数据表示以及时效网络构建3个方面说明。
1.1 人类交互数据的采集手段
人类交互无处不在,现实场景也丰富多样,研究这些交互行为背后的复杂规律首先要有高质量的数据支撑。这些数据有些采集自射频识别设备[2628]或者红外线传感器[29],刻画了人与人之间在几米的空间尺度上的交互行为。这些测量设备会过滤掉持续时长相对较短的交互行为,仅捕获在有限活动空间内的人群或者类似于会议展览场景下的具有一定时长的面对面交互。蓝牙设备[15,20,3031]同样能够获得具有一定空间尺度分辨率的数据。但与射频识别和红外线测量设备需要两两交互的个体对之间处于正对方向不同,蓝牙设备弱化了对方位信息的限制。基于这些高分辨率数据的研究缺点就是计算费时且复杂度高。为了采集在大空间尺度下大范围的人类集群交互行为,往往需要牺牲一定的数据精度。Zhang等人[3235]研究了在校大学生的校园WiFi登录日志数据并构建了时效人类交互网络。他们构建网络的规则是:如果两个用户在一定时间范围内同时接在同一个局域网地址上,那么这两个个体之间就会存在一条实际的线下交互连边。Sun等人[36]研究了新加坡公交车的出行刷卡数据,认为同时乘坐同一辆公交车的所有个体之间都存在着交互连边。Song等人[37]研究了手机用户之间的通话数据记录,认为两个个体只要通过同一个手机信号发射塔进行通话就会发生交互。Crandall等人[38]研究了Flickr网站上的图片分享数据,他们按照图片分享的地理位置以经纬度1°划分成多个空间格子,并认为同处在一个格子超过一定次数的个体之间存在着交互行为。很明显,这种场景下的空间分辨率已经很低了。另一种特殊类型的交互网络是性接触网络[4]。它们同样存在着前面提及到的大空间尺度低分辨率的问题。例如Rocha等人[39]研究了巴西性交易网络,在国家层面内使用某个在线性交易论坛上的用户自我报告的性接触数据构建了时效人类交互网络。
1.2 人类交互的类型与数据表示
人类交互根据交互时所使用的媒介不同,主要可以分为两类:线下交互和在线交互。线下交互指的是在有限空间内存在真实的地理位置邻近的交互行为,包括会议[27]、展览[27]、校园[3233]以及办公室[40]中的物理接触等等。在线交互不受现实空间的约束,不同个体可以通过互联网、通信网等虚拟媒介联系起来,例如类似于电子邮件的即时消息[6]、因特网博客[41]、社交媒体[31]和手机通讯[12,42]等等。学者们利用这些高时间分辨率的人类移动、通信以及面对面物理临近数据来研究真实人类交互网路的结构。这些由可穿戴式传感器或者网站日志所收集的数据,可以获取到个体对交互的详细列表。这些交互列表可以记录成四元组的格式(i ,j ,t ,δ ),其中i 和j 代表两个个体,t 是两个个体发生交互的开始时间,即两个个体通过射频识别设备或者网络通信协议交换数据包的开始时间,δ 代表交互的持续时间。另一种表示方式是将交互列表表示成三元组的格式(i ,j ,t ),用以记录个体i 和j 在时刻t 发生了交互。前一种类型的表示方式称之为区间图,后者称之为接触序列[43]。在多数情况下,同样的分析方法可以同时应用于区间图和接触序列。为了计算的简便,前一种表示形式也可以退化成后一种表示形式。可以通过离散化时间把一个区间按照每隔一定时间间隔取出一个交互时刻表示出来,或者将一个区间的开始时刻设定为交互时刻。这些转变方法在一定程度上都会损失交互事件本身所包含的完整信息。另外,与发生在虚拟空间上的线上交互明显不同的是,线下交互涉及到个体的位置移动,不同个体间或者同一个体对的交互行为在不同时间段往往具有不同的地理位置信息。因此,为了更具体地描述这种线下人类交互行为,还可以进一步的扩充并添加地点维度,利用五元组的格式(i ,j ,t ,δ ,l )来记录线下发生的交互行为,用以描述个体i 和j 个体在时刻t 在地点l 发生了一次持续时间为δ 的交互行为[44]。当然,人类交互行为的表示形式还不仅限于此,可以根据更细致的数据信息来提高表示的维度。但是,数据维度的不断提升,随之带来的往往是计算复杂度的增加,同时对揭示人类交互行为中隐含的普遍性规律也会产生干扰。所以,在实际分析问题中,需根据研究问题的不同权衡利弊从而选择合适的表示形式。
1.3 利用实际数据构建时效人类交互网络
对于实际交互数据,以简单的三元组交互序列(i ,j ,t )为例,其时间分辨率为Δt ,整个数据的观察时间跨度为T 。以时间窗t w =wΔt 对实际数据的进行等间隔均匀划分,可以得到多个不重叠的时间切片。每个时间切片称之为一个时间步,每个时间步包含的时间分辨率的数目为w 个,处于同一个时间切片内的所有交互记录集聚成一个无权无向图。因此,实际的人类交互网络可以表示为一个时序图序列g (t w )={G 1,G 2,…,G t ,…,G T },其中,G t =(N t ,L t )表示对发生在时间切片[(t -1)t w ,t ·t w ]内的交互序列进行集聚得到的第t 个时间步的网络,N t 和L t 分别表示时间步t 网络中的节点集和连边集,T 为构建的人类交互网络中所包含的时间步数目。图1是由交互数据构建时效人类交互网络的一个示例。对所有时序图序列g (t w )进行集聚可以得到整个交互数据的静态集聚网络,表示为其中,和L 分别为整个数据中包含的节点集和连边集。
注:t w 是聚集时间窗的持续时间。
图1 由交互序列构建时效网络的一个例子
Fig.1 Schematic illustration of the construction of temporal networks and the time slice of a contact sequence
2 时效人类交互网络的特征
人类交互网络是社交网络的典型代表之一。它承载着人类意识流的传递[4546]、社会关系纽带的建立[4748]以及流行病的传播[4,24]等等。同时,网络作为承载信息的一种表现形式,其固有的拓扑结构属性决定了网络自身的连通性、脆弱性和鲁棒性[4950]。然而,网络的结构并非是一成不变的,在现实世界中,随着时间的推移,网络结构也在不断发生演变。时间具有不可逆性,它表征了物质运动、变化的连续性和顺序性。当时间作为一种新的维度被引入到传统的复杂网络表示中,时效网络作为一种新的框架逐渐成为当今网络科学中的活跃研究领域之一,并不断产生新的概念和工具方法[10]。当然,这种快速发展的时效网络框架也给研究带来了许多新的挑战。当网络引入了时间属性后,最直接的改变就是,网络中的节点和连边不再自始至终保持不变。不同节点对之间的连边出现的先后次序、节点和连边活跃的持续时间、间隔时间和活跃规律等新的时效特征的出现,导致了信息在节点间的传递以及网络上发生的动态过程将由网络的拓扑结构、时效特征以及网络自身演化的时间尺度三方面共同决定。
2.1 拓扑结构特征
网络拓扑通常指代的是一种静态结构。在过去的对静态网络的研究中,度量网络拓扑一直推动着这个领域的发展。例如,在1999年,Barabási等人首次发现了在现实世界中大多数网络的度分布呈现出无标度的幂律分布规律[3],此后便引发大量学者投身于验证各类网络的度分布的研究工作中。然而,对于时效网络,类似的普遍规律却尚未被发现。这使得人们对于时效网络的研究思路和静态网络上存在着很大不同,过去的研究工作更多的是关注网络上的动态过程以及它们是如何受网络的时效结构影响,而很少致力于发现一种普遍的拓扑特征。关于时效网络的研究也或多或少会受到静态网络理论的启发。许多学者试图把静态网络上的拓扑结构推广到时效网络上,包括节点度[14,32]、最短路径[5152]、聚类系数[53]和最大联通片规模[5455]等等。
在教学实践上,百色学院紧密结合边疆少数民族地区基础教育和地方经济、文化的需要,结合应用型人才培养需要,以培养具有创新精神和实践能力人才为目标,卓有成效地开展了一系列的改革与实践,形成了“科研促进教学”和“立足边疆、服务边疆、走向东南亚”的鲜明特色。为了深化教学改革,突出实践性和服务地方社会经济发展的功能,学校和有关单位建立了密切的合作关系,分别与靖西县旧州村、田阳布罗陀文化研究会、那坡吞力黑衣壮村寨、田林壮剧团等达成了合作关系,摸索成立研究和教学实践基地的路子,为非物质文化遗产的深入研究和学生的实习实践提供了平台。
2.1.1 节点度与节点度分布
度是刻画网络中节点属性的最基本概念之一。在静态无向网络中,节点的度k 定义为与节点直接相连的邻居节点的数目,等同于和该节点直接相连的边的数目。在静态有向网络中,由于连边的方向性,我们把指向节点和由节点发出的连边数目分别称为节点的入度和出度。对网络中所有节点的度求均值可以得到整个网络的平均度,一般记为〈k 〉。想要对网络整体的拓扑连接情况有个全面的认识,一个很重要的度量指标就是网络中的度分布p k 。它描述了从网络中随机挑选一个节点的度为k 的概率。实际网络根据其度分布函数的形式不同可以分为异质网络和同质网络。例如,以巴西性交易论坛中的性接触数据构成的静态集聚网络的度分布为幂律分布[39,56],这意味着网络中节点度的分布高度不均匀,单个节点所连接的邻居节点数目具有异质性,有相当少的一部分节点却拥有非常大的连边数目。而在一些个体规模较小的面对面人群交互场景中(如会议、展览、医院、工厂和校园等)[2628,30,40],对交互数据集聚产生的网络中度分布却接近正态分布,说明在这类场景下单个个体所连接的邻居节点数目具有同质性。而在时效网络中,网络的拓扑结构随着时间的推移不断发生改变,节点所拥有的连边数目也在随之改变。为了衡量节点度的变化情况,有了节点时效度的概念[10,57]。节点的时效度定义为在一定时间窗口内,集聚而成的静态网络中与该节点直接相连的连边数目,标记为k (t ),是一个关于时间的函数[58]。研究时效网络中度分布的特征,还没有一个统一定论。目前的研究仍主要采用时间集聚的方法对一段时间内的人类交互数据进行集聚,产生一个集聚静态网络来进行分析。
2.2.1 阵发性
对于时效网络,时间维度的引入极大地改变了网络上演化的动力学过程。例如,在流行病(信息)的传播过程中,感染个体(信息获知者)与他的邻居之间建立交互连边的时间往往决定了流行病(信息)能否最终被传播出去。同样地,若流行病(信息)从个体i 发出,通过中介个体k 经由传播路径i →k →j 最终到达个体j ,或者直接在其他时间段个体i 和个体j 建立的连边上进行传播。但是,如果用时间聚集的方法来表示网络,得到的静态网络中节点k 和j 都会被等同视为节点i 的邻居节点,因此我们无法判断流行病(信息)是通过怎样的路径来进行传播的。而在时效网络上,传播过程只能在时间相关路径[10,13,59]上进行。形式上,若节点i 与节点j 建立交互连边的时间属于时间集合则在该连边上发生的动力学过程仅可以在时刻t ∈τ i,j 发生。因此,时间相关路径刻画了节点间的交互模式,并进一步影响了网络上不同节点之间的可达性。在时效网络上,对于任意一组节点对(i ,j ),从节点i 到节点j 的时间相关路径可能存在也可能并不存在。相对于静态网络上最短路径(两个节点间通过最少数量的连边相连接的路径)的概念,时效网络上衍生出两种不同的路径定义[57]。一种是最快路径,它指的是从节点i 耗费最短时间到达节点j 的路径,无关于需要中转的节点数目。另一种是最短时间相关路径,它指的是节点i 经过最少数目中介节点到达节点j 的路径,无关于所要耗费的时间。我们分别定义为最快路径长度、最短时间相关路径长度和集聚网络下的最短路径长度。定义分别为最快路径和最短时间相关路径的持续时间,即从节点i 首次出现至最终到达节点j 所花费的时间。正如文献[27]所指出:正是因为时效网络上的传播过程遵循着这些时效路径特性,从而导致了在实际时效网络上发生的动力学过程要远远慢于在对应的集聚的静态网络上。这也进一步论证,如果简单地采用静态集聚网络上的传播结果来描述现实世界中流行病(信息)的动态传播是会存在极大偏差的。
2.1.3 聚类系数
聚类系数(Clustering Coefficient)这个概念最早发源于社会学。它刻画了社交网络中一个人和他朋友的朋友是否也互为朋友的概率,反映了网络中朋友关系的紧密程度。传统的静态网络研究表明,社交网络具有“小世界”的特性,即该类型网络相对于等规模的随机网络具有非常大的聚类系数和较小的平均最短路径长度[2]。对于这种社交网络上出现的聚类系数大的现象,社会学上的一个重要解释为“三元闭包”原则[60]—即如果两个互不相识的人的共同朋友数目越多,那么他们俩在未来某个时刻成为朋友的可能性越大。三元闭包原则实际上隐含了一种人类交互随着时间演化的可能—有些交互关系会被动的加入到网络,从而使得网络中的闭合三角连边数目增加,进一步的产生了实际存在的聚类系数很大的社交网络。为了验证这个想法,Medus等人[61]在对实际数据建模时引入了三元闭包原则来刻画这种网络上连边建立时的偏好连接特性,并增大连边的闭包概率,最终得到了具有高聚类系数的集聚静态网络。把静态网络上的聚类系数推广到时效网络中,Cui等人[53]提出了时延聚类系数和时长聚类系数两种指标。文中指出,相比于静态网络中的聚类系数,时效聚类系数能够充分刻画随着网络演化带来的时效特性,并且网络的时效聚类系数越大,越能有效地促进网络上的流行病爆发。
3)在下一个离散时间步t +1,网络G t 中的所有连边被移除;
现实世界中的许多网络都是不连通的,往往存在一个很大的连通片包含了整个网络中的大多数节点。我们把这一连通片称为网络中的巨片(Giant Component)。对于实际的人类交互网络,往往仅存在一个巨片,所以通常又称之为网络的最大连通片(Largest Connected Component,LCC)。一些关于网络的拓扑性质以及网络上发生的动力学过程往往都是针对最大连通片来进行研究的[12,49,55,6265]。例如,Newman等人[62]在研究邮件通信网络时就指出计算机病毒的传播需要在网络上的最大连通片上进行。Barabási小组成员[49]研究无标度网络在遭受网络上的随机攻击和目标攻击后的脆弱性和鲁棒性时,就以移除网络中节点和连边之后的最大连通片规模作为一种重要的衡量指标。在研究网络中节点的重要性时,Morone等人[65]先以集体影响力指标对网络中的所有节点进行重要性排序,然后根据排序后的节点顺序依次移除相应节点,文中评价节点影响力大小的衡量标准即为网络中最大连通片的下降速率。Karsai等人[12]在研究手机通信网络上个体间连边的强弱社会关系属性对网络拓扑结构演化速率的影响时,一个重要的观察指标就是网络中最大连通片的规模随着时间变化的情况。
2.2 时效特征
3)生成满足一定分布函数的个体对交互事件发生的间隔时间序列;
肾癌是泌尿系统常见的恶性肿瘤,近年来其发病率呈逐年升高趋势[1-2]。手术切除是治疗早期肾癌疗效最肯定、最确切的方法,在早期肾癌的手术方式中,后腹腔镜下肾部分切除术目前在国内外应用较广泛[3]。对于肾脏腹侧肾肿瘤而言,施行后腹腔镜下肾部分切除术术中由于腹膜反折的遮挡,手术操作受到干扰,往往使患者手术时间和肾脏热缺血时间延长,增加了手术困难,甚至影响手术疗效。为了便于手术操作,缩短患者的手术时间,减少肾热缺血损伤情况,我们将自制的腹膜反折悬吊装置应用于肾脏腹侧肾肿瘤的后腹腔镜下肾部分切除术中,取得较好的效果,现报告如下。
2.1.2 节点可达性与时间相关路径
“阵发”这个概念最早是由Barabási等人在2005年发表在《自然》期刊上的一篇文章中提出。文章通过分析3 188个个体长达3个月的电子邮件通信数据发现,单个个体收发邮件行为的事件间隔时间分布偏离了传统的泊松分布的统计特征,而满足重尾或幂律分布,并使用“阵发性”来指代这种行为特征[7]。“阵发性”表征了个体行为在较短时间内密集发生,而在相当长的一段时间内静默不活跃的特征。如果从交互事件的间隔时间分布来看,阵发性很强的网络中大多数的间隔时间都要小于平均间隔时间,但偶尔会有非常大的间隔时间出现。这说明该间隔时间分布的标准差很大,具有严重的异质分布性。阵发性现象广泛存在于现实世界的各种人类交互网络中。大量研究的发现,人类的电子邮件通信[6]、手机短信交流[6768]、面对面交互[26,69]和性交易[39,56]等构建的时效网络均呈现出幂律分布的特征。用幂函数律来刻画间隔时间分布,用幂指数来表征阵发性的强弱程度,是一种常用的方法。但这里却隐含了一个先验的假设,即人类交互行为的间隔时间分布均服从幂律分布,然而这个假设目前为止仍尚未被学术界普遍接受[70]。事实上,一些研究在实证数据中发现,基于手机设备的人类在地理空间上的物理接触[71]构建的时效网络呈现出指数截断的幂律分布,基于社交媒体的在线交流行为[72]构建的时效网络呈现出对数指数分布的特征。针对以上,Goh等人提出了一个用来定量刻画这些异质性分布阵发性强弱的“阵发指标”[73]:
(1)
其中,σ τ 和m τ 分别表示的是间隔时间分布f (τ )的标准差和平均值。B 取值在-1~1之间。若f (τ )服从泊松分布,其均值和标准差相等,则阵发性B =0;若是服从重尾分布,标准差远大于均值,则阵发性B →1;如果个体交互事件的发生极具有规律性,则间隔时间序列是一个周期规则信号。它的间隔时间分布为一个δ 函数,标准差0,因此阵发指标B =-1。然而,对于实际得到的一些规模较小的数据集,在统计个体交互对时常常由于采样时间有限而具有很短的时间序列,从而不足以准确衡量个体对交互连边的阵发性(甚至无法衡量,若交互连边在整个观察时期仅出现过一次)。这意味着用以上的指标来计算个体交互对的阵发性仍然是存在很大偏差的。Karimi等人通过拼接间隔时间来计算时间序列的阵发性[74],但本质上仍没有解决数据量有限的情况下,单个个体和连边所独有的交互模式的问题。
2.2.2 记忆性
除了阵发性以外,人类交互网络上还存在的一个重要特征是记忆性。“记忆性”是人类在现实交互中(无论是在线交互还是线下交互)区别于随机无规律的物质运动,并体现出人类独有的主观能动性的一种固有属性。大量的实证研究发现,人类在现实世界交互中存在着各种各样的记忆机制。Goh等人[73]利用Pearson关联系数来衡量人类交互事件发生的记忆性强弱。假设个体在整个数据观察时期内一共有n +1个交互行为发生,按行为发生的先后顺序对其排列并计算相邻两次交互行为发生的间隔时间,则产生的间隔时间序列中一共有n 个元素,令序列中前n -1个元素组成子序列1,后n -1元素组成子序列2,文中指出该序列的记忆性可以用皮尔森关联系数进行计算如下:
(2)
其中,m 1和m 2分别表示序列1,2的均值。σ 1和σ 2表示序列1,2的标准差。记忆性指标M 的取值范围在-1~1之间。若M >0,则认为交互行为发生的间隔时间序列具有记忆性,表现为长的间隔时间后往往跟随着一个也较长的间隔时间,而短的间隔时间后也往往跟着一个也较短的间隔时间;若M <0,则和前面描述相反,表现为长的间隔时间后往往接着一个较短的间隔时间,而短的间隔时间后跟着一个较长的间隔时间;若M =0,则说明交互行为发生的前后间隔时间无以上显著规律。
到这里,可以发现,以上所讨论的记忆性实际上刻画的是个体交互事件(不管交互对象是否发生改变)发生的间隔时间序列的自相关性。然而,这可能与通常意义上所说的人类“交互记忆”有所不同。我们所说的“交互记忆”刻画的是人类记住过去发生的某种特定事件—交互行为,并在未来再次发生的现象。通俗的说,对于某个个体,他在过去和许多其他个体发生了交互事件并且已经结束,由于人脑的记忆功能,他往往会记住过去交互过的对象,在当前时刻他要进行的交互行为可能会受到这些历史记忆的影响,从而会倾向于和过去交互过的个体再次产生交互行为。
基于这种交互行为再现机制,已有大量的学者展开了研究。Karsai等人[12]通过分析手机通话数据指出个体能够记住它们过去建立的交互关系,并且趋向于和之前建立交互的个体再次产生连边。作者把这类反复出现的交互关系称之为强社会关系(Strong Tie),并发现强社会关系有效阻碍了时效人类交互网络上的流行病传播。Kim等人[75]用时效网络中节点间的交互方式和偏好连接机制来刻画人类交互的记忆性。文中引入了个体交互时间步长的概念,这里的个体交互时间步长有别于交互持续时间,指的是发生在两个个体之间的所有交互行为的累计时间步数。作者通过分析实际数据发现,个体的交互时间步长越大,他连接过去交互过的对象的概率越大。Vestergaard等人[66]通过分析会议和医院的面对面人群交互数据,引入了四种不同的记忆机制来表征实际人类交互数据中持续时间和间隔时间的分布均呈现出幂律分布的特性。这些记忆机制包括:交互自增强机制(Contact Self-Reinforcement, CSR)—即交互持续的时间越长,交互结束的概率越低;活跃度自增强机制(Activity Self-Reinforcement, ASR)—即最近越活跃的个体,越容易产生新的交互连边;个体导向优先连接机制(Agent-centric Preferential Attachment, APA)—即越最近活跃的个体越容易被其他的个体选择而产生交互连边;连边导向优先连接机制(Link-centric Preferential Attachment, LPA)—即个体越趋向于与最近交互的个体进行交互。其中,ASR和APA表征了高度活跃的个体更倾向产生新的交互连边并且更容易被其他个体所连接,而CSR表征了交互行为随着持续时间变化的增强过程,LPA表征了个体倾向于与熟人进行交互。Colman等人[76]认为网络中新的连边产生的概率与产生连边的两端节点的固有活跃概率有关,并且前期发生的交互事件(连边)能够以一定的记忆规模储存下来。文中给出了更新网络中连边的两种记忆机制,一种是从系统过去发生的所有交互事件中随机选一个被新的连边替代的随机记忆,另一种是基于交互事件的持续时长记忆,即每次网络更迭时持续时间最长的连边被新的连边替代。尽管以上讨论的这些人类交互行为的“记忆性”从形式上各不相同,本质上都是在刻画个体在动态建立连边时的偏好选择机制。
优化幼儿园一日活动科学保教实践需要充分认识到保教活动的重要价值,了解其对幼儿成长的重要作用,从而合理设计幼儿园一日活动。具体来讲,可以从以下几个方面加以思考。
2.2.3 周期与波动性
对于现实生活中的人类交互行为,一方面由于自然周期(如年、月、周、昼夜以及一些特定的人类行为活动周期)的存在,人往往会按照日程安排在特定的时间进行特定的行为,这种行为的发生具有一定的规律性和周期性[77]。另一方面,由于人的行为在一定程度上会受到各种外部环境因素的干扰,因而在行为的执行时会出现一定的偏差和波动。所以实际的人类交互行为还具有另一种明显的时效特征—周期与波动性。如果把单位时间内个体参与交互行为的次数定义为该个体的活跃度,我们会发现在很多人类活动中个体活跃度的周期与波动广泛存在,例如校园里的学生交互[44,78]、会场上参会人群的交互[14]、手机通话交互[77]、维基百科上用户共同编辑内容构成的交互[79]等等。这种周期性的规律有时候还会直接反映在交互行为的间隔时间分布上,例如学生在校园内的上课周期是一星期,那么在每周的特定时间内将会有特定的一群人在同一个教室上课从而发生交互行为,当然这样原本规律性的行为也可能因为调课或节假日休息而产生时间上的扰动。最近Liang等人[44]的工作就表明,在大学校园内具有“熟悉的陌生人”社会关系的个体的交互间隔时间分布呈现出显著的周期特性,并且随着间隔时间的增加整体上指数下降。
式中,S=1.62;P为试样平行测量次数,3;n为拟合曲线得数据对总数,21(每个浓度测量3次,共18次);Cp为试样平行测量3次结果的平均值,23.46 μg/L;C¯为绘制标准曲线的标准溶液的总平均值,62.7 μg/mL。
这您就不知道了吧。那时候,三妮是怀着孕嫁到西山窝的,孩子生下来之后,不到一岁就死了。三妮像魔道了似的,又跑回来找老鳜鱼,非要跟老鳜鱼不可。咱也不知道老鳜鱼好在哪。反正,两个人是东躲西藏。这天夜里,老鳜鱼把三妮藏到我家的地瓜窖。这事儿我一点也不知道。半夜里,我听到狂风大作电闪雷鸣,雨水击打着门窗。我醒来之后,担心地瓜窖进水,打算在地瓜窖洞口的石板上盖层塑料纸。没想到,我走到地瓜窖门口一看,那盖地瓜窖的石板露着一道缝。我正要盖严实的时候,地瓜窖里突然传出话来。
2.3 时间尺度
时间尺度是时效网络中经常出现且不可回避的一个重要概念。它是衡量网络拓扑随着时间发生演化的特征标度。这里所谓的特征标度是指网络中的大部分拓扑结构发生变化的时间取值应该落在以某个时间为中心的一个相对比较小的区间内。相对于时间尺度缺失的静态网络(例如BA无标度网络),时效网络对应着一类特殊的网络,这类网络自身拓扑结构的演化时间尺度要小于或者相近于网络上发生的动力学过程(如流行病传播、谣言传播等)的时间尺度[80]。如果网络演化的时间尺度大于网络上发生的动力学过程,则可以认为动力学过程在网络拓扑发生改变前已经完成,则相应的研究结论可以近似对标到传统的静态网络上的研究。然而,对于时间尺度的认识远不仅限于此。我们根据现有的认识[10,80]总结成如下几点:
1)现实世界中的很多时效网络,发生在它们上面的动力学过程都有其各自所特有的时间尺度。以人类交互网络为例,从一个人身边经过仅需要数秒,进行一次谈话需要几分钟,主持一场集会要几小时,一系列会议的论坛可能需要连开数天,完成一项研究项目会耗时数月,两个人成为要好朋友可能需要几年甚至数十年时间。所有这些交互行为构建的时效人类交互网络都遵循了各自所独有的时间尺度(见图2)[42]。
2)时效网络上不同个体的交互模式迥异。有的节点和交互连边的状态变化极其活跃,有的甚至在很长的一段时间内状态保持不变。这也会对网络上发生的动力学过程产生巨大影响,例如性接触网络上的疾病传播[56],社交媒体上的信息传播[81]等。因此,文献[82]甚至还考虑了是否存在交互连边层面上的时间尺度特性。
注:从诸如节点和连边的短的时间尺度到更慢的中观社团结构以及网络整体演化的时间尺度。
图2 手机通信网络中时效和拓扑尺度的概述 [42]
Fig.2 An overview of temporal and structural scales in mobile call networks
3)很多情况下,人类的交互行为满足无标度的时间统计特性,这意味着没有一个明确的时间尺度可以用来表征这些交互行为。大量过去的研究工作指出,人类交互行为的持续时间分布和间隔时间分布均服从幂律分布的形式[7,2628,66]。如果幂指数γ 足够大,时效网络中所有的时间相关特性都集中在某个值(均值)附近,那么这个值则能够很好的反映网络的时间特征;如果幂指数相对较小(如γ ≤3),时效网络中的时间相关特性是高度不均匀的,很难像指数分布那样用一个稳定的均值来刻画整个网络中的时间特性。然而,通过对实际数据分析发现,人类交互行为的幂指数多集中在1~3之间,这也导致了实际的人类交互行为很难用一个明确的时间标度来准确刻画。这有点类似于模型选择问题,时间尺度的选择是在简单通用模型与复杂精细模型之间进行折折衷。
4)衡量时间尺度划分准确性的标准相差甚大,有的时候使用自然活动的时间尺度(如昼夜模式[14,77])来分析网络上的动力学过程得到的结果较为准确,但使用其他的时间尺度来进行研究是否也同样有意义仍有待考究。
5)确定实际数据中的时间尺度的另一大困难还在于,有时候很难把它从实际动态演变的网络系统中剥离出来。例如,在社交媒体上的信息传播,这种传播过程主要基于网络上的关注与被关注关系产生的交互连边,从而有可能会出现谁关注谁取决于信息是如何传播的情况,进一步地会导致最终网络上的传播动力学的时间尺度纠缠在社交媒体上关注网络演变的时间尺度中难以分离出来。
3 时效随机化零模型
2)每次从序列中随机选择一个时间标签并随机分配给网络中的一条连边,若产生同一时间标签的重边则将时间标签放回序列,重选;
3.1 随机置换交互的时间标签(Randomly Permuted Times ,RPT )
1)在时间步t ,网络G t 初始由N 个孤立的节点组成;
1)从所有交互记录中随机选择两条交互记录(i ,j ,t )和(u ,v ,t *);
2)交换两条交互记录的时间标签,得到交互记录(i ,j ,t *)和(u ,v ,t );
经Design-Expert 8.0.6软件分析优化,可得到羊肚菌SDF最佳提取工艺参数为料液比1∶20.12 (g/mL)、 碱液浓度0.75%、提取温度62.79 ℃、提取时间60 min。在此最佳工艺提取条件下,SDF理论得率为 34.62%。考虑到试验可操作性,将制备的最优条件定为料液比1∶20(g/mL)、提取液浓度0.75%、提取温度63 ℃、提取时间 60 min。在此制备条件下进行3组平行验证试验,得到羊肚菌SDF的平均值为33.06%,与模型得出的羊肚菌SDF理论值比较接近,说明数学模型对优化羊肚菌SDF的提取工艺是可行的。
3)重复以上步骤,直至每条交互记录被至少选择一次结束。
这种随机化过程保证了网络中所有交互事件参与的个体对不变。同时,由于时间标签的保留,记录在实际数据时间标签中的活动周期性(如昼夜和星期等)也能保持不变。但是,它会摧毁或者部分摧毁实际数据中的时效特征(如阵发性和记忆性),也摧毁了很多交互事件中所存在的时效相关性,如个体A 与个体B 进行交互会导致接下来个体B 与个体C 进行交互。
3.2 随机置换连边(Randomized Edges ,RE )
这种方法与静态网络上的连边置换类似,区别在于:在连边置换时,每条连边上发生的多个交互事件对应的时间标签也会全部交换[13]。具体操作我们总结如下:
1)从所有连边中随机选择两条连边(i ,j ):[tlist ]和(u ,v ):[τlist ],tlist 和τlist 分别表示这两条连边上交互事件发生的时间标签序列;
原始儒学“崇拙”而不完全“斥巧”的文化传统,随着理学诸贤登上历史舞台而发生了重大转变。周敦颐《拙赋》提出了“巧贼拙德”的理学命题:“巧者言,拙者默。巧者劳,拙者逸。巧者贼,拙者德。巧者凶,拙者吉。呜呼,天下拙,刑政彻。上安下顺,风清弊绝。”[3](P60)赋作指出,“巧”具有口舌辩给、处心积虑、作伪成凶等特性,而“拙”则兼有了“默”“逸”“德”“吉”等品质。邵雍亦有诗句云“谁道山翁拙于用,也能康济自家身”[4](P301),表达出他以“拙”处世济身的沛然自信。他又有诗句云“吾曹养拙赖明时,为幸居多宁不知”[4](P421),直以“养拙”为政治清明的景象,“尚拙”意味显豁。
2)置换两条连边的节点,以1/2的概率得到连边(i ,v ):[tlist ]和(u ,j ):[τlist ],或者得到(i ,u ):[tlist ]和(j ,v ):[τlist ];
3)若在步骤2中产生自环或者重边,则取消置换并重新回到步骤1。
体育比赛的赛场上,向来是少年英雄辈出的地方,而星光闪烁的天才少年,也绝不仅有泰国的昆拉武特。这不,男子网球选手的“王者”诺瓦克·德约科维奇最近便受到了巨大的挑战,对方是来自德国的天才少年亚历山大·兹维列夫(又被称为“小兹维列夫”)。
这种随机化过程会摧毁网络中所有拓扑结构及节点和连边活跃的时效相关性,但保留原始交互序列集聚而成的静态网络的度分布,以及所有交互事件发生的时间标签和交互间隔时间。
3.3 随机生成交互的时间标签(Randomly Generated Times ,RGT )
RPT和RE模型所构建的新的随机化交互序列能够保留原始交互序列的时间标签。因此,虽然它能够摧毁与节点和连边相关的时效结构,但数据中所有交互事件发生的累计数目以及包含在交互事件中实际人类活动的周期节律仍保持不变。如果想要研究周期节律对于时效网络上动力学过程的影响,则需要把所有交互事件对应的时间标签数值随机化,通常使用的方法是对所有交互记录的时间标签数值重新从一个均匀分布函数中随机取样分配[13]。当然,交互事件的时间标签也可以取自其他特定的分布(如泊松过程),然后通过调节参数使得每条连边的平均交互次数与实际数据相近。
3.4 随机置乱连边上的交互时间(Randomly Contacts ,RC )
这种随机化过程不改变网络中节点间的连边,保证了无权累积网络的拓扑结构不变,却对所有连边上交互事件发生的时间标签数目进行重新分配。这里的重新分配,具体操作如下:
1)将所有连边上交互事件发生的时间标签构成一个序列;
时效网络具有丰富的拓扑属性和时效属性,对时效网络上的某种特定结构进行随机化操作可以帮助我们更好地理解这种结构在网络动力学方面所扮演的重要角色。例如,可以通过一定的随机化操作,来移除网络中的某种特定结构,并在移除该结构后构造的一系列随机零模型上模拟动力学传播过程(如流行病传播、信息扩散、随机游走等等),得到的结果与实际的时效网络进行对比,从而得到该结构对于实际的时效网络上的动力学过程是起到加速还是减缓的作用[13,43,80]。接下来,我们将回顾一些在时效网络上比较常用的一些随机化零模型。
3)从步骤1的序列中删除已选时间标签,直至序列为空则分配结束。
由于连边上交互事件时间标签的数目对应了个体间的交互次数,所以以上操作不改变网络整体交互连边的数目,但会使得网络中所有连边上交互的次数最终服从二项分布的特征[13]。它通常的目的是为了研究实际数据中(特别是在社交媒体或者其他形式的人类交互数据)不同连边上交互次数相差很大并呈现出重尾分布的影响[43]。
3.5 等权值连边随机化(Equal -Weight Edge Randomization ,EWER )
有时候需要移除存在于集聚的静态网络中拓扑结构的相关性(如网络中个体对间的累积交互数目,对应于静态网络中连边的权值),并保持网络中连边的时效特性不变(如间隔时间分布)[85]。在这种情况下,就需要对集聚的静态网络中具有相同权值的连边进行随机交换。具体操作是:随机选择两组具有相同交互数目的个体对(连边),然后保持连边对应的时间标签不变,交叉置换每条连边的两个个体。经过这种随机化过程后,网络中单个连边存在的阵发性特征得到保留,同时其他在随机置换时间标签零模型中保留的性质(如每条连边上的交互数目,整个系统层面的交互事件发生频率,以及累积的加权交互网络上的拓扑结构)也能得到保留。但是唯一的缺点是,这种零模型对于数据量的需求很大,这样才能有足够多的具有相同交互事件数目的连边得以进行交换。
3.6 任意权值连边随机化(Edge Randomization ,ER )
这种零模型和上面的等权值连边随机化零模型类似,唯一的区别在于该模型是对整个网络中具有任意交互数目的连边之间进行随机交换[85]。这相当于随机交换了集聚静态网络中所有连边的权值(即每条连边上发生交互事件的次数)。然而,得到的零模型中所有连边的交互间隔时间分布仍然保持不变。
3.7 时间反演(Time Reversal ,TR )
这种零模型是为了研究具有因果交互序列[86]出现的频率及对于网络结构的影响。这里因果交互序列指的是某个交互行为会触发其他个体间进一步的交互行为。因此时间反演的做法是将原始交互事件的时间标签次序完全颠倒过来。如果连续的交互事件是因为这种因果时效相关性引起的,则在反演后的交互序列中同样会存在相近数目的交互事件。相比于原始交互序列,在时间反演的零模型中缺失的这种因果链式交互事件数目可以归因为时间次序的影响。
以上讨论的各种时效随机零模型在一定程度上都保留或摧毁了网络中存在的某些拓扑结构或时效特征。为此,在表1中我们总结了每种时效零模型对比原始数据保留和移除的特征。N为无权静态网络拓扑结构,WN为有权静态网络拓扑结构,DD为度分布,WD为权重分布,GT为全局时间序列,LT为单边时间序列,R为时效相关性。随机置换连边和随机化连边上的交互时间分别摧毁了网络连边和交互事件的相关性,但两者均保证了产生的集聚静态网络的度分布不变。这两种随机化技巧可用于研究时间相关性对时效网络上的动力学过程的影响。随机生成交互的时间标签打乱了原始数据中人类行为活动所特有的周期节律,可以用来研究其对时效网络上动力学的影响。如果想要研究网络上连边对应的个体对的特定交互时序和相邻连边的相关性,可以用等权值连边随机化和任意权值连边随机化分别对比随机生成时间标签的零模型,等权值连边随机化过程会摧毁原始数据集聚而成的静态网络中的连边间的时效相关性,而任意权值连边随机化过程会进一步摧毁连边上的交互事件数目与拓扑结构的相关性。时间反演零模型则往往用于研究个体对交互事件发生的特定时序对时效网络上动力学过程的影响。综上所述,想要研究时效网络上的某种结构特征对网路上发生的动力学过程的影响,构造合适的零模型作为参考对照模型尤为关键。
发病初期就开始用药,在阴雨天可用50%速克灵烟剂或粉尘剂熏棚,也可结合西红柿蘸花,在2.4-D溶液中加0.2%速克灵或多霉灵,既防止落花,又兼治病害。
表1 经过随机化操作后的时效零模型网络对比原时效网络的特征总结
Tab.1 Summary of the features of the temporal null models after randomization operations compared with the original temporal network
注:√(保留的特征),×(不保留特征)。
4 时效网络生成模型
时效网络的生成模型稍微不同于静态网络。对于经典的复杂网络建模工作,尤其在网络科学诞生早期,大量的研究工作关注于生成带有特定网络结构(如幂律度分布[3],社团结构[87]等)的静态网络模型。近年来,以移动互联网为代表的技术变革引发的“数据革命”使得获取海量实时的人类行为数据成为可能。这为学者们使用时效网络框架来对现实世界中动态变化的人类交互行为进行建模提供了温床。利用实际数据来分析人类交互模式并进行建模产生了大量的时效网络模型。尽管这些时效网络模型从思路上各不相同,但本质上都是在完成两个任务。其一,旨在复现实际数据中的基本网络结构,以及这些不同的网络结构对时效网络上发生的动力学过程的影响。其二,提供一个理论研究框架,用以定量解析网络生成模型中所涉及的主要参量及动力学规律。接下来,我们来简要回顾一下目前常见的几类经典的时效网络生成模型。
4.1 嵌入连边动力学的网络模型
生成时效网络的一个最直接的方法就是先通过已有的复杂网络模型生成一个静态网络(如ER随机网络[88]、WS小世界网络[2]和BA无标度网络[3]等)。这个静态网络可以作为集聚所有时效网络后最终期望得到的网络形式。然后,可以对静态网络中的每条连边分别赋予其活跃的时间标签。基于这个想法,Holme等人[89]提出了引入连边动力学的网络模型。该模型满足如下规则:
1)通过配置模型[90]生成一个静态网络,去除网络中的重边与自环;
2)对于网络中的每条连边,赋予其一个活跃的时间区间,该活跃区间的持续时间取自一个幂律截断的分布函数,区间的起始时刻从整个时间周期内随机选取,在得到的活跃区间内该连边对应的个体对可以发生有效的交互行为;
人类交互网络是以人为节点,以人与人之间的某种社会交互行为为连边的网络。对于网络中任意一个个体交互对,它可能在整个数据采样时期内存在多个交互事件,每个交互事件发生的持续时间不尽相同,相邻两次交互事件的间隔时间也存在一定差异。交互的持续时间,从字面意思来看,描述的是个体对之间发生的单次交互事件的持续时长。它在人类交互建模时往往被视为一种“富者愈富”的偏好机制,即如果个体保持活跃状态的持续时间越长,或者发生在个体对之间的交互行为持续时间越长,那么他就越倾向于维持当前的状态不变[66]。交互的间隔时间描述的是发生在同一个体对之间的相邻两次交互事件的间隔时长。它在建模时往往表征的信息更为丰富,既可以体现人类交互行为的阵发性,也可以表现个体交互行为的记忆性。另一方面,人类的日常行为往往具有一定的规律性,具有某种特定社会关系的个体对之间往往会周期性地发生交互。例如在公交车和大学校园这类人类活动周期性较为显著的生活场景下,以往的研究发现具有“熟悉的陌生人”社会关系的两个个体之间往往会频繁地进行规律性的交互行为[36,44]。但有一点值得注意,人类的交互行为并非完全受社会关系驱动,由于现实环境的影响往往会存在一定的随机性。这种随机性的嵌入,导致了原本规律性的交互行为会存在一定的波动和偏差,主要体现在交互的对象发生改变或者时间上有所偏移等,从而使得人类的行为并不能百分百的被预测出来,而是存在一定的上限[37]。接下来,我们针对阵发性、记忆性以及周期与波动性这三个人类交互的时效特征来详细展开介绍。
4)用上面得到的间隔时间序列对每条连边的活跃区间按其长度比例进行分段,然后将交互事件分别加在每个时间间隔处。
图3 活跃度驱动网络模型的示意图 [11]
Fig.3 Schematic representation of the activity-driven model [11]
这种把时间特性和网络拓扑相耦合的建模方法非常简单明了,底层的静态网络拓扑结构可以根据实际的聚集网络任意配置。Rocha等人[91]还介绍了一种类似的建模方法,唯一的区别在于其考虑的节点活跃区间是紧跟着另一个节点活跃区间的结束,因此在任意一个时间段内活跃的节点数目保持不变,而上述的连边激活方法不能保证在一个时间段内活跃的连边数目恒定。
4.2 活跃度驱动网络模型
Perra等人[11]讨论的时效网络模型(见图3)不再是基于一个固定的底层静态网络拓扑,而是引入了图序列来表示时效网络在每个时间步的网络。文中引入了节点活跃势能的概念来刻画节点在每个时间步活跃的概率。初始时赋予每个节点i 一个给定的活跃势能a i =ηx i ,其中x i 取自实际数据中观察得到的概率分布函数F (x i ),为避免概率发散x i ∈[ε ,1],ε 是下限截止概率,参量η 的引入是为了调节每个时刻的活跃节点数目使其固定为η 〈x 〉N 。节点的活跃势能衡量了时效网络中个体参与社会交互的频繁程度。定义G t 为每个离散时间步t 的网络快照。模型网络的具体生成过程为
“嗯,你别慌、别急!”李晓英从一旁战士们的哄笑声中,明白恭建兵是故意在捉弄自己、戏耍自己,从容应答着。冷不丁,一针管对准恭建兵的屁股蛋子扎了过去。
为了研究交互事件发生的时间次序对时效网络结构和动力学的影响,一种随机化手段就是随机置换交互事件的时间标签。这种随机化技巧能够使得网络的静态拓扑结构以及所有节点对之间的交互次数保持不变[56,59,8384]。具体算法实现较为简单,只需进行以下步骤:
2)对每个节点i ,它以一定的概率a i Δt 被激活,被激活的节点发出m 条连边随机连接到m 个不同的节点。不活跃的节点同样可以被活跃的节点所连接。Δt 是时间窗口的大小,同样也为该时刻所有连边的持续时间;
2.1.4 巨片
(4)考核模式的改革:引入多元化的考核手段,将期末考试、课内实验、在线测试、课程作业等结合起来,由原有的“期末笔试+课内实验”,改进为“期末笔试+过程考核”。
4)重复以上过程,直至达到时间长度T 。
这个模型由于其生成方法简便且可扩展性好,因此被广泛应用于分析时效网络上的动力学过程[18,9295]以及产生的集聚静态网络的结构特征[52]。在这个模型的基础上,Hoppe等人[96]进一步指出网络中的连边更倾向于在两个活跃势能都较大的节点间建立,并拓展了该模型以减少网络中连边建立时的随机性。Pozzana等人[97]推广了原始的活跃度驱动模型,为节点添加了除活跃势能以外的另一种属性—吸引度,来同时刻画时效网络中节点主动参与社会交互(活跃势能)和被动被其他活跃节点连接(吸引度)的偏好机制。Laurent等人[98]在活跃度驱动模型中引入了节点建立连边时的三元闭包机制[99]来刻画真实社交网络中普遍存在的高聚类系数的现象。Moinet等人[21]在活跃度驱动模型中引入了个体交互行为的阵发性用来研究科学合作网络中存在的节点“老化效应”。Sunny等人[100]在活跃度驱动模型中引入了连边存活的生命时间来研究其对时效网络上流行病传播过程的影响,并发现重尾分布的连边生命时间会减慢网络上的传播过程。
4.3 节点- 连边记忆网络模型
不同于活跃度驱动模型中每条连边活跃的持续时长为一个时间步,Colman等人[76]认为个体在每个时间步移除所参与连边的概率会受到该条连边持续时长的影响,持续时长越久的连边在每个时间步更迭连边时越容易被移除。另外,活跃度驱动模型仅考虑了节点的活跃方式,在此基础上,Vestergaard等人[66]提出了一种节点—连边记忆的时效网络模型。在该模型中,网络中节点和连边的活跃均会受到自身状态持续时长的影响。文中考虑的网络由N 个个体构成,这些个体产生的N (N -1)/2个交互对(i ,j )都是潜在的活跃连边。如果个体i 与个体j 进行了交互,则连边(i ,j )活跃,否则不活跃。记t 时刻网络中活跃连边的数目为M 1(t )。个体的状态持续时长由t -t i 表征,其中t i 是个体最后改变状态(获得或断开当前某条连边)的时刻。连边的状态持续时长由t -t (i,j )表征,其中t (i,j )是连边最后改变状态(变得活跃或者不活跃)的时刻。初始时,设定网络中所有的个体都是孤立的,所有的连边都是处于不活跃状态。在每个时间步dt ,对所有的个体和活跃连边的更迭过程如下:
1)每个活跃连边(i ,j )以概率dtzf l (t -t (i,j ))变得不活跃,其中f l 是关于连边的状态持续时长t -t (i,j )的函数,z 是控制连边状态改变速率的参数;
2)每个个体i 与其他个体以概率dtbf a (t -t (i) )建立连边,其中f a 是关于个体的状态持续时长t -t i 的函数,b 是控制交互连边建立速率的参数。个体j 以概率π a (t -t j )π l (t -t (i,j ))被其他未和个体i 交互的个体选择并建立连边。其中π a 和π l 分别是关于t -t j 和t -t (i,j )的函数。如果连边(i ,j )从未活跃,我们设定t (i,j )=0。
在该模型中,节点和连边的记忆效应分别由它们状态持续时长的记忆核函数f 和π 刻画。这些核函数均采用了幂律函数的衰减形式来表征实际时效网络中统计得到的时间特征,即交互持续时间分布和交互间隔时间分布。
4a 1H NMR(CDCl3) δ:8.15-8.12(m,3 H),7.90-7.87(m,1 H),7.50-7.45(m,4 H),7.40-7.35(m,1 H).
图4 空间偏好移动与随机交互模型的示意图 [102]
Fig.4 Schematic representation of the mode with individual poissonian activity and preferential mobility [102]
4.4 面对面交互网络模型
Starnini等人[101]提出了一个基于二维平面上的随机游走模型来描述现实世界中的面对面人类集群交互行为。在该模型中,节点游走到一个节点的几率与该节点的吸引力成比例。若节点的吸引力越大,它越会提高其他节点对该节点的兴趣,从而减慢其他节点远离该节点的随机游走速率。另外,该模型糅合了节点活跃度、吸引力、随机游走等概念,能够很好的模拟现实世界中的会场、校园或医院背景下的面对面交互数据,缺点是不能拟合无地理空间约束的交互行为,也不能拟合具有地点偏好移动的情况。Zhang等人[102]基于以上模型提出了一个更加精细的空间偏好移动和随机交互模型(见图4)。模型中假定M 个移动个体在一个拥有M 个交互地点的加权空间网络g 中,网络中两个地点之间的连边权重表示个体在两个地点间移动所花的时间。对每个移动的个体,他会以一定的概率自动激活为活跃状态并进行移动,且存在一个偏好的停留地点,而对其他地点以等概率无偏好停留。初始时,所有个体都停留在各自的偏好地点。具体建模过程满足以下规则:
花椒、大料处理:花椒、大料按1∶2放入水中煮开,晾凉后用该水浸泡黄豆适量;然后置于电饭锅中蒸50 min,蒸的过程中锅底部继续放花椒大料调料水;接0.8%纳豆菌后发酵并后熟。另一组实验用相同的辅料将大豆煮软后发酵。
1)每个个体i 以给定的活跃率(活跃率a ∈(0,1)满足均匀分布)被激活;
2)当节点状态为不活跃时,每个地点按照各自的吸引率q 吸引非活跃个体向其移动。非偏好地点具有相同的吸引率q =(1-p )/(M -1)。偏好地点的吸引率为q =p +(1-p )/(M -1),其中p ∈(0,1)代表偏好率。在移动过程中,个体不会被激活;
3)重复以上过程,直至达到仿真时间长度T 。
此外,Zhang等人[14]还根据现实面对面交互数据中发现的群体活跃现象和短时高可达现象,进一步改进了Starnini等人提出的二维平面随机游走模型,并引入了集体变化的个体活跃度、与个体活跃度相关的个体移动速度、以及变化的场地大小3种机制,经过改进后的机制可以很好的拟合真实数据中的群体活跃现象和短时高可达现象,同时对人造的模型网络上进行传播仿真也可以达到和真实时效网络上一样的感染规模。然而,很多发生在虚拟空间内的人类交互行为是没有明确的地点属性的,也不涉及个体的实际移动,例如人与人之间通过在线社交媒体工具进行的线上交互行为。以上的模型都不能拟合这种不带有空间约束的人类交互行为。
4.5 时间演化网络模型
实际生活中,个体间的交互行为都是随着时间不断发生变化的。个体在当前时刻选择和某个个体建立交互关系会受到历史交互信息的影响。研究表明,个体倾向于和某些具有特定社会关系的个体建立交互连边[44],且对这些已经建立的交互关系具有记忆性[12]。这里的记忆性指的是个体偏向于和过去已经建立交互关系的个体再次建立联系,即表征的是一种连边再现机制[103]。至今为止已经有大量的模型来揭示这种具有个体交互记忆的连边再现机制[12,75,104106]。Valdano等人[104]通过分析巴西在线论坛的性交易数据构建的时效网络,发现相邻时间步的交互网络存在很明显的连边重叠现象。据此他们假设个体在每个时间步进行社会交互时会以一定概率随机保留上个时间步已经建立的连边,并构建了一个时间演化的网络模型。然而,研究者们[12,105106]通过对电话通信数据、在线社交数据和论文合作数据等进行实证分析,发现个体在每个时间步对上个时间步邻居进行连边保留的概率并不相同:累计度(在观察时间窗口内接触的个体数目)越大的个体保留与上个时间步邻居的连边概率越大,并进一步构建了相应的时效网络模型。
图5 记忆驱动网络模型的示意图 [107]
Fig.5 Schematic representation of the memory driven model [107]
以上这些研究工作仅考虑个体对上一时间步的邻居进行连边保留且与每个邻居再次建立连边的概率相同,因此忽略了交互事件发生的间隔时间对个体建立连边时概率的影响。此外,个体的历史交互信息对其自身活跃状态转变的影响在以往的研究工作中也同样缺乏考虑。基于此,Li等人[107]通过对真实的人类交互行为数据进行实证分析,发现了两种表征网络演化的重要机制:个体活跃状态转变机制和连边建立机制,并构建了一个记忆驱动的时效网络模型。该模型假设N 个个体在一个无权的人类交互网络g 中。每个时间步的网络中所有个体存在两种状态:活跃态与不活跃态。假设个体能够进行连边保留的最大记忆步长为L ,也就是说,个体在当前时间步的连边建立只会受到过去L 个时间步内建立的连边关系的影响。这些连边关系存储在一个记忆网络序列中G M ={G t-L +1,G t-L +2,…,G t-1 ,G t }。我们产生L 个随机网络[88]来对时效网络g ={G 1,G 2,…,G L }和记忆网络序列G M ={G 1,G 2,…,G L }分别进行初始化。每一个时间步t 开始时,网络G t 由N 个孤立个体组成,整个时效网络g ={G 1,G 2,…,G L }的迭代过程如下(见图5):
1)个体活跃状态转变机制:在时间步t 度为k 的活跃个体i 以概率P A (k )=φk -a (φ ∈(0,1])在时间步t +1变得不活跃,不活跃的个体以活化概率P A 变得活跃。
2)活跃个体连边建立过程:分配每个活跃的个体以s 条连边,其中连边数目s 从给定概率分布函数F (s )中得到。活跃个体的连边建立依据以下策略:
(1)社交保留行为:个体i 以保留概率p ∈(0,1]从过去交往的个体中选择个体建立连边关系。选择和其中任意一个个体j 再次建立连边的概率为p ij 。其中,p ij 是关于个体i 与j 上次发生交互行为的间隔时间Δ (i,j )的函数,满足关系:p i,j =f (Δ (i,j ))∝Δ (i,j )-γ ,1≤Δ (i,j )≤L 。
(2)社交探索行为:个体i 以探索概率q =1-p 随机连接一个新的从未发生过交互行为(或已超出最大记忆时间步L )的个体。注意到,由于个体的交互记忆仅存在于有限的记忆网络序列中,对在t -L 时间步前发生过交互行为的个体不再进行连边保留。
3)在下一个迭代时间步t +1,生成网络G t+1 ,更新记忆网络序列为G M ={G t-L +2,G t-L +3,…,G t ,G t+1 }。
4)重复步骤1)~3)直至达到仿真时间窗口T 的结束时刻。
该模型可以成功复现出真实社交网络中广泛存在的爆发性交互特征和拓扑结构性质。同时,作者在利用实际数据构建的时效网络上进行SI仓室模型的传播仿真,发现相比于活跃度驱动模型该模型能够更加准确地刻画动态演化的真实时效网络上发生的传播过程。
5 基于人类交互行为的流行病传播研究
在过去的20年间,移动互联网技术和数据采集设备的广泛应用为学者们带来了大量高精度高质量的人类行为数据。从数据驱动的角度,学者们利用时效网络来刻画动态演化的人类交互行为,挖掘其背后统一的特征规律和行为模式,并通过对时效网络上传播过程的研究认识、理解和掌握真实人类交互行为对以流行病传播为代表的传播动力学过程的驱动作用。这也有助于人们设计控制干预的策略,并对所有具有类似传播动力学特征的社会现象的演变提供有效评估,如信息舆论的传播、创新思想的扩散和文化基因的流行等。
5.1 流行病传播模型
在时效网络上的传播动力学研究中,流行病传播过程是最为常见的一种动力学过程。在病毒传播[25,108]、信息传播[20,109110]、知识与创新扩散[4546]等传播动力学的研究中,大多沿用类似的流行病传播模型。一般根据流行病感染状态主要把个体分为3类:易感者(Susceptible,S)——未感染到流行病,能够被感染者感染的个体;感染者(Infected,I)——已经被感染,并可以继续传播流行病的个体;恢复态个体或移除者(Recover/Removed,R)——已经获得永久免疫并恢复健康的个体,或者是感染后已经死亡的个体。这类个体的共同点是既不能被流行病再次感染也无法向其他个体传播流行病。当然,随着流行病传播模型愈加复杂化,也衍生出了许多其他与流行病传播过程有关的个体状态,例如已被感染却不能传播流行病的暴露个体,以及获知了网络中的感染信息并产生警觉意识的个体[111]等。在过去的研究工作中[112114],有3种仓室模型比较经典,包括:易感-感染(Susceptible-Infected,SI)模型、易感-感染-易感(Susceptible-Infected-Susceptible,SIS)模型、易感-感染-移除(Susceptible-Infected-Removed,SIR)模型。在SI模型中,一个易感态个体以概率被所接触到的感染态个体感染,已感染的个体不能恢复健康。在SIS模型中,除了包括SI模型中的感染过程,已感染的个体还能以独立于传播过程的概率重新恢复成健康态个体,但仍然有被其他感染个体再次感染的风险。而在SIR模型中,同样包含了感染过程和恢复过程,但有别于SIS模型的一点在于感染个体恢复后的状态,即成为保持永久免疫且不会被再次感染的移除态。不同仓室模型中个体类别之间的转换关系见图6。由上述我们可知,感染事件总是在易感个体和感染个体之间发生,所以只要网络中同时存在感染个体和健康个体,并且均处于同一个直接相连的连通片中,那么网络上的传播过程就会持续不断地一直进行下去。对这3种模型小结如下:
图6 不同仓室模型中个体状态之间的转换关系
Fig.6 The state transition of representation of different compartment models
1)在SI模型中,节点的状态演化过程为S―I,当传播过程结束后,整个网络都会被感染成I状态,因而一般用于近似模拟流行病传播的早期阶段。
2)在SIS模型中,节点的状态演化过程为S―I―S,或流行病进入吸收态后一直保持S状态,当传播过程达到稳态时,整个网络只会有S与I两种状态存在。
3)在SIR模型中,节点的状态演化过程为S―I―R,当传播过程进入吸收态或者达到稳态时,整个网络只会有S与R两种状态存在。
进一步地,可以写出3种流行病传播模型的动力学方程。记ρ S 、ρ I 和ρ R 分别为网络中处于3种不同仓室的个体密度。SI模型呈现出“滚雪球”的特点,网络中感染个体数目按照如式(3)变化率增加:
=λρ S ρ I
(3)
显然在每个时刻都有ρ S +ρ I =1。SIS模型和SIR模型的微分方程可以统一如下:
=λρ S ρ I -μρ I
(4)
=-λρ S ρ I +χρ I
(5)
其中,χ =μ 对应了SIS模型,而χ =0则对应了SIR模型。在SIR模型中,网络中任意时刻恢复态个体的密度满足条件ρ R =1-ρ I -ρ S 。
5.2 基于人类交互行为的流行病传播研究
由于人类交互行为的时效性,很多在静态网络框架下得到的关于传播动力学的研究结论可能无法适用于时效网络中。Rocha等人[56]利用巴西性交易论坛上的性接触数据构造了时效网络,并在网络上分别进行SI和SIR传播仿真,发现时效相关性可以加速网络上早期阶段的传播过程,而网络拓扑结构的异质性会导致传播减速。Karsai等人[64]利用多个实际人类交互数据构建了多种不同的时效零模型网络,来分别研究拓扑结构和时效相关性对时效网络上SI传播过程的影响。作者发现社团结构及其与连边权重的关联性、个体的阵发性交互模式均对网络传播起到了减缓传播的作用,处于社团内两两个体间交互行为的相关性会轻微的加速网络传播,而个体交互连边的日常模式却对传播过程没有显著的影响。鉴于实际网络中个体会基于过去的交互关系建立连边,Pfitzner等人[15]在时效网络上引入了介数偏好的概念。他们指出尽管这种介数偏好不能被时间集聚情况下的静态网络所刻画,但却会显著地改变时效网络中的时间相关路径,进而影响网络上发生的动力学过程。文中通过在多个实际数据构造的时效网络和由人工设定的介数偏好矩阵构造的时效网络上分别进行SI传播仿真,发现介数偏好带来的时效相关性能够显著地降低网络中的感染个体比例。为了从理论上系统地研究时效网络上的传播动力学,Perra等人[11]提出了活跃驱动时效网络模型,利用经典的SIS仓室模型进行流行病传播仿真并结合异质平均场方法进行理论分析,发现时效网络上流行病的爆发阈值要明显大于对应的集聚静态网络上的爆发阈值。由于该模型保证了网络拓扑演化时间尺度的可控性,进而使得网络上发生的动力学过程能够在与网络自身演化时间尺度一致的情况下进行研究,因此该模型常常被作为时效网络的典型代表来进行广泛的研究[18,21,9293]。
另外,阵发性和记忆性作为人类交互的两大特点,在网络的传播过程中也起着非常重要的作用。Miritello等人[115]在利用欧洲一个国家的手机通话记录构造的时效网络上进行SIR传播仿真,发现个体交互行为的阵发性和群组交互对网络上的信息传播具有截然相反的作用:个体的阵发性在大的尺度范围内有效地阻碍了信息传播,而群组交互则有利于信息在局部范围内的扩散。更进一步,Kivelä等人[116]利用通话记录构造的时效网络和多个时效零模型网络从单条交互边、多条交互边以及网络整体层面等3个不同尺度上分别研究阵发性对时效网络上传播过程的影响,传播仿真使用了SI传播模型,结果发现3种尺度下的阵发性均对网络传播有减速效应,且随着尺度的扩大,减速的效应也随之衰减。Karsai等人[12]基于活跃驱动时效网络模型[11],通过增加个体能够记住过去发生交互的累计数目,并倾向于和之前已经交互过的个体再次建立连边的记忆机制,构造了具有非马尔科夫性的时效网络。文中进一步研究谣言信息在由该模型产生的人工网络上的SIR传播过程,发现人类交互行为中存在的记忆机制会产生显著的社团结构,并使得谣言信息无法在网络中广泛传播。Sun等人[95]分别分析了活跃驱动时效网络和带有记忆性的活跃驱动时效网络[12]对两类经典的传播模型—SIS仓室模型和SIR仓室模型所代表的传播过程的不同影响。文中采用异质平均场理论进行理论解析并结合传播仿真的结果,发现带有记忆性的活跃驱动网络会促进SIS传播过程,但却抑制了SIR传播过程。为了有效地促进信息在网络中的传播,Gao等人[117]在传统的SI传播模型中引入了一种非马尔可夫的传播机制。作者考虑了个体在信息传播过程中接触到邻居个体并传播信息的概率会受到信息获知者本身历史交互记忆的影响。这里的历史交互记忆指的是该个体在过去累计交往的个体中有多少已经被信息传播过。文中通过在实际网络上进行传播仿真发现,度大的节点更容易在信息传播的早期阶段被触及,而度小的节点则往往在信息传播的后期才被接触到。
5.3 流行病传播的免疫策略研究
时效人类交互网络中的流行病传播的免疫问题是一个极具有应用性的问题,如何基于网络中的某些特定拓扑结构和时效属性综合衡量个体的重要性程度,同时兼顾减少资源开销及降低网络爆发规模,来找到具有重要影响力的个体或交互链进行免疫尤为关键。当然,网络传播免疫除了应用在流行病免疫之外,在研究信息扩散、谣言传播、产品推广和社会影响力等方面,找到影响网络传播过程的关键节点都至关重要。
在时效网络中,每个时间步的网络随时间不断变化。如果直接把静态网络上的免疫策略照搬到时效网络中,往往效果不一定显著且可行性较低。一个可行的解决方案[22]就是把实际数据的采集时间(时间跨度为[0,T ])分为[0,ΔT ]和[ΔT ,T ]两段。其中,[0,ΔT ]作为“训练窗口”负责采样历史的个体交互信息,利用这段时间内的数据构造时效网络分析其特性,并据此对训练窗口内网络中出现的所有个体进行重要性排序。[ΔT ,T ]作为“测试窗口”负责衡量免疫效果的优劣,即从时刻ΔT 开始,从训练网络中选取数目为f *N 的重要节点进行免疫(其中,f 为免疫的节点比例,N 为网络中所有节点的数目),并对整个数据进行流行病传播仿真。
Tang等人[118]把静态网络上的中心性指标推广到时效网络上,提出了节点的时效介数中心性和时效接近中心性,用来衡量时效网络中的节点重要性,并可以进一步用来设计合理的免疫策略。尽管这一方法保留了网络中的时效信息,但作为一种全局性中心性指标,在计算复杂度上代价很大。为此,Lee等人[22]通过采样一定时间窗口内的实证数据来获取个体的局部信息,分别研究了采取免疫最近发生交互和最频繁发生交互的个体的策略对SIS传播过程的影响,发现随机选取一个个体并对其最近发生交互的个体进行免疫是最为有效的免疫策略。在此基础上,Starnini等人[23]进一步研究了免疫一定比率的个体分别对网络传播的时间延迟比例和爆发规模的影响,主要对比了包括基于节点度的免疫策略、基于节点的介数中心性的免疫策略、熟人免疫、最近交互免疫和随机免疫等几类传统的免疫策略。此外,作者还着重研究了采样实证数据的观测窗口大小对传播过程的影响,发现这些免疫策略的免疫效果并非一直随着数据的观测窗口时长的变大而不断提升,而是达到一定观测窗口大小后,免疫效果趋于饱和保持不变。Liu等人[93]基于活跃驱动时效网络模型分别研究了随机免疫策略、目标免疫策略和以个体为中心的免疫策略等三种不同的免疫策略,利用异质平均场方法进行理论分析并结合SIR模型进行传播仿真,发现虽然目标免疫策略有利于阻碍网络上的流行病爆发,但以个体为中心的免疫策略在实际应用中更易实现。
进一步地,Starnini等人[23]定义了两种评价指标来衡量SI传播中网络免疫策略的效果。其中一种指标是感染延迟率。免疫节点集合v 的感染延迟率τ i 可以计算为:
(6)
其中,为免疫节点集合v 后节点v 的半感染时间(即以v 作为初始感染源感染网络中50%的节点所需的传播时间)。为避免随机性,遍历网络中所有可能感染源j ∉v ,并求均值。感染延迟率τ v 量化了免疫节点集合v 对时效网络上SI传播过程的平均影响。τ v 越大,说明节点集合v 对阻碍流行病传播具有很大的作用,应该被免疫,而τ v 很小的节点集合是否被免疫对传播过程影响甚微。
除了用减缓流行病传播来衡量节点的免疫效果,另一种评价指标是采取免疫策略后网络中感染节点数目下降的比例。如果采取某种免疫策略后,相比于未免疫时感染节点数目下降得越多,说明该免疫效果越有效。这里有一点值得注意,在时效网络中免疫节点会破环网络的连通性和节点间的时序可达性,所以当数据的观察时间结束后,网络中所有的节点并非都被感染。定义和I j 分别为节点j 作为初始感染源时免疫节点集合v 和不采取免疫时最终感染节点的数目(爆发规模)。对网络中所有可能感染源j ∉v 进行遍历,可以计算免疫节点集合v 后网络的平均爆发规模下降比为
(7)
综上,尽管对于时效网络上传播动力学的研究已有一些初步的理解和认识,但目前的研究工作还远远不够,尤其是深入挖掘人类动力学与时效网络结构之间的内在联系,并进一步结合人类交互行为的动态演化特征来研究和控制传播动力学,仍需要更加深入的研究。
6 展望
前文中,我们已经对时效人类交互行为的分析、建模以及以人类交互行为渠道的流行病的传播等研究现状作了较为简要的回顾。近几年,由于移动互联网技术的飞速发展、智能可携带设备的普及以及大数据处理能力的提升,数据革命所带来的海量数据使得学者能够更加准确地感知和分析人类的交互行为模式。深入理解人类交互模式对以人类交互网络为载体的各种动力学过程的影响,将为现实世界中的各种实际应用场景如流行病防疫、推荐系统设计以及谣言传播的溯源与扼杀等等提供非常重要的理论指导。时效网络作为一个新兴的研究领域已经受到国内外学者的广泛关注,也取得了一定的研究成果,但目前仍处于一个初期探索的阶段,尚有待形成系统化完备的理论和技术支撑,仍有诸多挑战性问题亟待解决。我们认为以下几个方面将是研究的主要方向。
6.1 构建表征人类复杂交互行为的模型框架
对于人类交互网络而言,个体间的交互行为随着时间不断发生变化,网络中不断有新的交互连边产生和旧的交互连边消失,交互事件也往往具有很短的持续时间[26]。人们会记得他们之前发生过交互的个体,并有可能继续保持交互状态。个体对其建立过的交互连边的记忆性强弱在一定程度上反映了交互网络拓扑结构的演化速率。静态网络可以看作是一个完全记忆的网络,网络的拓扑结构不随时间发生任何改变。因此,基于这种人类交互记忆机制所形成了的“时效网络”[10,43],网络随着时间发生的刻画人类固有的交互模式的结构变化不再被忽视不见。所以,考虑交互事件的时序特性以及交互记忆机制如何影响网络拓扑结构的演化至关重要。尽管个体动力学对于产生人类交互网络中的记忆效应所起的作用已经得到了很好的研究[12,61,66,7576],却鲜有研究工作探寻人类交互网络在多大程度上呈现出交互记忆性,并进一步分析和量化人类交互行为中存在的记忆机制,而解决这个问题对于建构更为实际的时效人类交互网络并理解其上发生的传播动力学非常重要。
6.2 设计有效的时效网络上的疾病传播免疫策略
正确认识并理解人类交互网络上发生的动态过程,最终的目标仍然是回归到实际的现实场景中,实现控制并干预以人类交互行为为渠道的流行病的传播、信息舆论的扩散以及文化基因的流行等传播过程。其中,一个很重要的应用就是针对实际网络的拓扑特性和时效特征的不同“量身定制”一款最有效的网络传播免疫策略。一般而言,这些最优的免疫策略往往在一定程度上反映了节点的相应属性在网络中所起的作用,并进一步地可以体现出节点的重要性排名。真实的人类交互行为是动态变化的,所形成的人类交互网络也在随着时间发生改变。现有的关于时效网络上免疫策略的研究很多是把观测时间内的人类交互行为集聚成静态网络,然后直接套用静态网络上节点的重要性评价指标。这类方法损失了人类交互行为中丰富的时效信息,无法捕获人类交互网络随着时间演化的动态特征。另外,对静态网络上的指标进行时效扩展有时候不一定可行。例如,在时效网络中,每个时刻节点的连边不是固定不变的,随着时间变化数目不断改变。如果依据静态网络中的最大度免疫,则需要观察完足够长的时间并集聚得到静态网络后方能确定。同时,时间的引入也带来了节点之间的时间相关路径的问题,使得流行病在节点间的传播会极大地受到连边时序性的限制。以上这些表明,如何基于时效网络设计更合理有效的疾病传播免疫策略仍然是一个值得探讨的课题。
6.3 厘清时间尺度不一致问题对网络传播动力学的影响
传统的对于时效网络上传播动力学的研究都是基于网络自身的演化尺度与网络上发生的动力学过程在时间尺度一致性下得到的结论[1112]。尽管时间尺度的分离为我们分析和进行流行病传播仿真实验提供了很大的方便,但是由此得到的关于流行病传播的一些结论是不是具有可靠性,仍存在一定的质疑。文献[119]基于多层网络的框架,研究流行病传播与意识传播相耦合的传播模型,解析了在通信网络上意识传播的时间尺度与在物理交互网络上流行病传播的时间尺度的差异性是如何影响最终流行病的实际传播。文中指出人类的意识性可以有效降低最终的感染个体数,且意识在通信网络中传播得越快越可以有效地减缓疾病传播。虽然,该论文中基于的框架是多层网络,但是对于时效网络上时间尺度对于传播动力学的影响仍具有一定的启发作用。正如前文所言,我们研究时效网络上的流行病传播及其他动力学过程是为了解析其中的固有规律,从而为实际生活中的疾病管控与防御服务。因此,正确认识时效网络上动力学过程与网络拓扑演化在时间不一致的情况下带来的误解与偏差及其重要,有助于我们进一步修正在假设条件下得到的结论的合理性进行有效的评估。
6.4 数据采样所造成的信息不完整问题
由于数据采集设备的限制以及人类活动的影响,实际得到的数据集往往不可能完全覆盖所研究的个体的所有交互行为,因此如何利用不完整的数据来挖掘人类交互模式[35]并研究构建的时效网络上的传播动力学[120]是一个非常重要的科学问题。文献[121]通过对多个采集到人类行为数据集的重采样和重建,估算数据不完整性对时效人类交互网络中动力学过程的影响,以此来修正实验得到的结论。但是,对于很多实际采样得到的数据集,往往只是很短的一段时间内的一部分人群交互行为的小样本数据,采样到数据是否满足独立性以及一些统计分布的前提假设条件是一个问题,数据本身是否存在误差也是一个不可避免的质疑。如何利用这些不完整甚至有一定数量的错误偏差的小规模数据集来研究人类行为有待进行进一步研究。
参考文献:
[1] Rumney J. The science of society: an introduction to sociology[J]. American Journal of Sociology, 1939, 45(2): 588-289.
[2] Watts D J, Strogatz S H. Collective dynamics of ‘small-world’ networks[J]. Nature, 1998, 393(6684): 440-442.
[3] Barabási A L, Albert R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439): 509-512.
[4] Liljeros F, Edling C R, Amaral L A N, et al. The web of human sexual contacts[J]. Nature, 2001, 411(6840): 907-908.
[5] Eames K T D, Keeling M J. Modeling dynamic and network heterogeneities in the spread of sexually transmitted diseases[J]. Proc Natl Acad Sci USA, 2002, 99(20): 13330-13335.
[6] Eckmann J P, Moses E, Sergi D. Entropy of dialogues creates coherent structures in e-mail traffic[J]. Proc Natl Acad Sci USA, 2004, 101(40): 14333-14337.
[7] Barabási A L. The origin of bursts and heavy tails in human dynamics[J]. Nature, 2005, 435(7039): 207-211.
[8] Newman M E J, Barabási A L, Watts D J, The Structure and Dynamics of Networks[M]. Princeton: Princeton University Press, 2006:229-414.
[9] 汪小帆, 李翔, 陈关荣. 网络科学导论[M]. 北京:高等教育出版社, 2012.
[10] Holme P, Saramäki J. Temporal networks[J]. Phys Rep, 2012, 519(3): 97-125.
[11] Perra N, Gonçalves B, Pastor-Satorras R, et al. Activity driven modeling of time varying networks[J]. Sci Rep, 2012, 2: 469.
[12] Karsai M, Perra N, Vespignani A. Time varying networks and the weakness of strong ties[J]. Sci Rep, 2014, 4: 4001.
[13] Holme P. Network reachability of real-world contact sequences[J]. Phys Rev E, 2005, 71(4): 046119.
[14] Zhang Y Q, Cui J, Zhang S M, et al. Modelling temporal networks of human face-to-face contacts with public activity and individual reachability[J]. Eur Phys J B, 2016, 89(2): 26.
[15] Pfitzner R, Scholtes I, Garas A, et al. Betweenness preference: quantifying correlations in the topological dynamics of temporal networks[J]. Phys Rev Lett, 2013, 110(19): 198701.
[16] Viswanath B, Mislove A, Cha M, et al. On the evolution of user interaction in facebook[C]//Proceedings of the 2nd ACM workshop on Online social networks. ACM, 2009: 37-42.
[17] Schneider C M, Moreira A A, Andrade J S, et al. Mitigation of malicious attacks on networks[J]. Proc Natl Acad Sci USA, 2011, 108(10): 3838-3841.
[18] Perra N, Baronchelli A, Mocanu D, et al. Random walks and search in time-varying networks[J]. Phys Rev Lett, 2012, 109(23): 238701.
[19] Jo H H, Perotti J I, Kaski K, et al. Analytically solvable model of spreading dynamics with non-Poissonian processes[J]. Phys Rev X, 2014, 4(1): 011041.
[20] Scholtes I, Wider N, Pfitzner R, et al. Causality-driven slow-down and speed-up of diffusion in non-Markovian temporal networks[J]. Nat Commun, 2014, 5: 5024.
[21] Moinet A, Starnini M, Pastor-Satorras R. Burstiness and aging in social temporal networks[J]. Phys Rev Lett, 2015, 114(10): 108701.
[22] Lee S, Rocha L E C, Liljeros F, et al. Exploiting temporal network structures of human interaction to effectively immunize populations[J]. PLoS One, 2012, 7(5): e36439.
[23] Starnini M, Machens A, Cattuto C, et al. Immunization strategies for epidemic processes in time-varying contact networks[J]. J Theor Biol, 2013, 337: 89-100.
[24] Salathé M, Kazandjieva M, Lee J W, et al. A high-resolution human contact network for infectious disease transmission[J]. Proc Natl Acad Sci USA, 2010, 107(51): 22020-22025.
[25] Wang J B, Wang L, Li X. Identifying spatial invasion of pandemics on metapopulation networks via anatomizing arrival history[J]. IEEE Trans Cybern, 2016, 46(12): 2782-2795.
[26] Cattuto C, Van den Broeck W, Barrat A, et al. Dynamics of person-to-person interactions from distributed RFID sensor networks[J]. PLoS One, 2010, 5(7): e11596.
[27] Isella L, Stehlé J, Barrat A, et al. What′s in a crowd? analysis of face-to-face behavioral networks[J] J Theor Biol, 2011, 271(1): 166-180.
[28] Vanhems P, Barrat A, Cattuto C, et al. Estimating potential infection transmission routes in hospital wards using wearable proximity sensors[J]. PLoS One, 2013, 8(9): e73970.
[29] Takaguchi T, Nakamura M, Sato N, et al. Predictability of conversation partners[J]. Phys Rev X, 2011, 1(1): 011008.
[30] Stopczynski A, Sekara V, Sapiezynski P, et al. Measuring large-scale social networks with high resolution[J]. PLoS One, 2014, 9(4): e95978.
[31] Sekara V, Stopczynski A, Lehmann S. Fundamental structures of dynamic social networks[J]. Proc Natl Acad Sci USA, 2016, 113(36): 9977-9982.
[32] Zhang Y, Wang L, Zhang Y Q, et al. Towards a temporal network analysis of interactive WiFi users[J]. Europhys Lett, 2012, 98(6): 68002.
[33] Zhang Y Q, Li X. Temporal dynamics and impact of event interactions in cyber-social populations[J]. Chaos, 2013, 23(1): 013131.
[34] Zhang Y Q, Li X. When susceptible-infectious-susceptible contagion meets time-varying networks with identical infectivity[J]. Europhys Lett, 2014, 108(2): 28006.
[35] Zhang Y Q, Li X, Xu J, et al. Human interactive patterns in temporal networks[J]. IEEE Trans Syst Man Cybern -Syst, 2014, 45(2): 214-222.
[36] Sun L, Axhausen K W, Lee D H, et al. Understanding metropolitan patterns of daily encounters[J]. Proc Natl Acad Sci USA, 2013, 110(34): 13774-13779.
[37] Song C, Qu Z, Blumm N, et al. Limits of predictability in human mobility[J]. Science, 2010, 327(5968): 1018-1021.
[38] Crandall D J, Backstrom L, Cosley D, et al. Inferring social ties from geographic coincidences[J]. Proc Natl Acad Sci USA, 2010, 107(52): 22436-22441.
[39] Rocha L E C, Liljeros F, Holme P. Information dynamics shape the sexual networks of Internet-mediated prostitution[J]. Proc Natl Acad Sci USA, 2010, 107(13): 5706-5711.
[40] Génois M, Vestergaard C L, Fournet J, et al. Data on face-to-face contacts in an office building suggest a low-cost vaccination strategy based on community linkers[J]. Network Science, 2015, 3(3): 326-347.
[41] Leskovec J, Huttenlocher D, Kleinberg J. Signed networks in social media[C]//Proceedings of the SIGCHI conference on human factors in computing systems. ACM, 2010: 1361-1370.
[42] Saramäki J, Moro E. From seconds to months: an overview of multi-scale dynamics of mobile telephone calls[J]. Eur Phys J B, 2015, 88(6): 164.
[43] Holme P. Analyzing temporal networks in social media[J]. Proc IEEE, 2014, 102(12): 1922-1933.
[44] Liang D, Li X, Zhang Y Q. Identifying familiar strangers in human encounter networks[J]. Europhys Lett, 2016, 116(1): 18006.
[45] Montanari A, Saberi A. The spread of innovations in social networks[J]. Proc Natl Acad Sci USA, 2010, 107(47): 20196-20201.
[46] Rizzo A, Porfiri M. Innovation diffusion on time-varying activity driven networks[J]. Eur Phys J B, 2016, 89(1): 20.
[47] Granovetter M S. The strength of weak ties[J].Am J Social, 1977, 78(6): 347-367.
[48] Krackhardt D, Nohria N, Eccles R G. Networks and Organizations:Structure Form and Action[M]. Boston: Harrard Business School Press, 1992: 216-239.
[49] Albert R, Jeong H, Barabási A L. Error and attack tolerance of complex networks[J]. Nature, 2000, 406(6794): 378-382.
[50] Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Rev Mod Phys, 2002, 74(1): 47.
[51] Tang J, Scellato S, Musolesi M, et al. Small-world behavior in time-varying graphs[J]. Phys Rev E, 2010, 81(5): 055101.
[52] Starnini M, Pastor-Satorras R. Topological properties of a time-integrated activity-driven network[J]. Phys Rev E, 2013, 87(6): 062807.
[53] Cui J, Zhang Y Q, Li X. On the clustering coefficients of temporal networks and epidemic dynamics[C]//2013 IEEE International Symposium on Circuits and Systems, IEEE, 2013: 2299-2302.
[54] Motter A E, Lai Y C. Cascade-based attacks on complex networks[J]. Phys Rev E, 2002, 66(6): 065102.
[55] Motter A E. Cascade control and defense in complex networks[J]. Phys Rev Lett, 2004, 93(9): 098701.
[56] Rocha L E C, Liljeros F, Holme P. Simulated epidemics in an empirical spatiotemporal network of 50,185 sexual contacts[J]. PLoS Comput Biol, 2011, 7(3): e1001109.
[57] Holme P, Saramki, J Temporal Networks[M]. Berlin: Springer, 2013:1-14.
[58] Kim H, Anderson R. Temporal node centrality in complex networks[J]. Phys Rev E, 2012, 85(2): 026107.
[59] Starnini M, Baronchelli A, Barrat A, et al. Random walks on temporal networks[J]. Phys Rev E, 2012, 85(5): 056115.
[60] Klimek P, Thurner S. Triadic closure dynamics drives scaling laws in social multiplex networks[J]. New J Phys, 2013, 15(6): 063008.
[61] Medus A D, Dorso C O. Memory effects induce structure in social networks with activity-driven agents[J]. J Stat Mech, 2014, 2014(9): P09009.
[62] Newman M E J, Forrest S, Balthrop J. Email networks and the spread of computer viruses[J]. Phys Rev E, 2002, 66(3): 035101.
[63] Serrano M á, Boguná M. Percolation and epidemic thresholds in clustered networks[J]. Phys Rev Lett, 2006, 97(8): 088701.
[64] Karsai M, Kivelä M, Pan R K, et al. Small but slow world: how network topology and burstiness slow down spreading[J]. Phys Rev E, 2011, 83(2): 025102.
[65] Morone F, Makse H A. Influence maximization in complex networks through optimal percolation[J]. Nature, 2015, 524(7563): 65-68.
[66] Vestergaard C L, Génois M, Barrat A. How memory generates heterogeneous dynamics in temporal networks[J]. Phys Rev E, 2014, 90(4): 042805.
[67] Karsai M, Kaski K, Kertész J. Correlated dynamics in egocentric communication networks[J]. PLoS One, 2012, 7(7): e40612.
[68] Zhou T, Kuscsik Z, Liu J G, et al. Solving the apparent diversity-accuracy dilemma of recommender systems[J]. Proc Natl Acad Sci USA, 2010, 107(10): 4511-4515.
[69] Zhao K, Stehlé J, Bianconi G, et al. Social network dynamics of face-to-face interactions[J]. Phys Rev E, 2011, 83(5): 056109.
[70] 周涛,韩筱璞,闫小勇,等.人类行为时空特性的统计力学[J]. 电子科技大学学报, 2013, 42(4): 481-540.
Zhou Tao, Han Xiaopu, Yan Xiaoyong, et al. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540.
[71] Karagiannis T, Le Boudec J Y, Vojnovic M. Power law and exponential decay of intercontact times between mobile devices[J]. IEEE Trans Mob Comput, 2010, 9(10): 1377-1390.
[72] Doerr C, Blenn N, Van Mieghem P. Lognormal infection times of online information spread[J]. PLoS One, 2013, 8(5): e64349.
[73] Goh K I, Barabási A L. Burstiness and memory in complex systems[J]. Europhys Lett, 2008, 81(4): 48002.
[74] Karimi F, Ramenzoni V C, Holme P. Structural differences between open and direct communication in an online community[J]. Physica A, 2014, 414: 263-273.
[75] Kim H, Ha M, Jeong H. Scaling properties in time-varying networks with memory[J]. Eur Phys J B, 2015, 88(12): 315.
[76] Colman E R, Greetham D V. Memory and burstiness in dynamic networks[J]. Phys Rev E, 2015, 92(1): 012817.
[77] Jo H H, Karsai M, Kertész J, et al. Circadian pattern and burstiness in mobile phone communication[J]. New J Phys, 2012, 14(1): 013055.
[78] Fournet J, Barrat A. Contact patterns among high school students[J]. PLoS One, 2014, 9(9): e107878.
[79] Yasseri T, Sumi R, Kertész J. Circadian patterns of wikipedia editorial activity: a demographic analysis[J]. PLoS One, 2012, 7(1): e30091.
[80] Holme P. Modern temporal network theory: a colloquium[J]. Eur Phys J B, 2015, 88(9): 234.
[81] Gleeson J P, O’Sullivan K P, R A, et al. Effects of network structure, competition and memory time on social spreading phenomena[J]. Phys Rev X, 2016, 6(2): 021019.
[82] Clauset A, Eagle N. Persistence and periodicity in a dynamic proximity network[DB/OL]. [2019-04-30]. https://arxiv.org/abs/1211.7343.
[83] Cardillo A, Petri G, Nicosia V, et al. Evolutionary dynamics of time-resolved social interactions[J]. Phys Rev E, 2014, 90(5): 052825.
[84] Backlund V P, Saramäki J, Pan R K. Effects of temporal correlations on cascades: threshold models on temporal networks[J]. Phys Rev E, 2014, 89(6): 062815.
[85] Pan R K, Saramäki J. Path lengths, correlations, and centrality in temporal networks[J]. Phys Rev E, 2011, 84(1): 016105.
[86] Bajardi P, Barrat A, Natale F, et al. Dynamical patterns of cattle trade movements[J]. PLoS One, 2011, 6(5):e19869.
[87] Grönlund A, Holme P. Networking the seceder model: Group formation in social and economic systems[J]. Phys Rev E, 2004, 70(3): 036108.
[88] Erds P, Rényi A. On the evolution of random graphs[J]. Publ Math Inst Hungar Acad Sci, 1960, 5: 17-61.
[89] Holme P. Epidemiologically optimal static networks from temporal network data[J]. PLoS Comput Biol, 2013, 9(7): e1003142.
[90] Newman M. Networks: an Introduction[M]. New York: Oxford University Press, 2010: 424-434.
[91] Rocha L E C, Blondel V D. Bursts of vertex activation and epidemics in evolving networks[J]. PLoS Comput Biol, 2013, 9(3): e1002974.
[92] Liu S Y, Baronchelli A, Perra N. Contagion dynamics in time-varying metapopulation networks[J]. Phys Rev E, 2013, 87(3): 032805.
[93] Liu S, Perra N, Karsai M, et al. Controlling contagion processes in activity driven networks[J]. Phys Rev Lett, 2014, 112(11): 118702.
[94] Starnini M, Pastor-Satorras R. Temporal percolation in activity-driven networks[J]. Phys Rev E, 2014, 89(3): 032807.
[95] Sun K, Baronchelli A, Perra N. Contrasting effects of strong ties on sir and sis processes in temporal networks[J]. Eur Phys J B, 2015, 88(12): 326.
[96] Hoppe K, Rodgers G J. Mutual selection in time-varying networks[J]. Phys Rev E, 2013, 88(4): 042804.
[97] Pozzana I, Sun K, Perra N. Epidemic spreading on activity-driven networks with attractiveness[J]. Phys Rev E, 2017, 96(4): 042310.
[98] Laurent G, Saramäki J, Karsai M. From calls to communities: a model for time-varying social networks[J]. Eur Phys J B, 2015, 88(11): 301.
[99] Kossinets G, Watts D J. Empirical analysis of an evolving social network[J]. Science, 2006, 311(5757): 88-90.
[100] Sunny A, Kotnis B, Kuri J. Dynamics of history-dependent epidemics in temporal networks[J]. Phys Rev E, 2015, 92(2): 022811.
[101] Starnini M, Baronchelli A, Pastor-Satorras R. Modeling human dynamics of face-to-face interaction networks[J]. Phys Rev Lett, 2013, 110(16): 168701.
[102] Zhang Y Q, Li X, Liang D, et al. Characterizing bursts of aggregate pairs with individual poissonian activity and preferential mobility[J]. IEEE Commun Lett, 2015, 19(7): 1225-1228.
[103] Li J, Li C, Li X. Quantifying the contact memory in temporal human interactions[C]//2018 IEEE International Symposium on Circuits and Systems, IEEE, 2018: 1-5.
[104] Valdano E, Poletto C, Giovannini A, et al. Predicting epidemic risk from past temporal contact data[J]. PLoS Comput Biol, 2015, 11(3): e1004152.
[105] Ubaldi E, Perra N, Karsai M, et al. Asymptotic theory of time-varying social networks with heterogeneous activity and tie allocation[J]. Sci Rep, 2016, 6: 35724.
[106] Ubaldi E, Vezzani A, Karsai M, et al. Burstiness and tie activation strategies in time-varying social networks[J]. Sci Rep, 2017, 7: 46225.
[107] Li C, Li J, Li X. Evolving nature of human contact networks with its impact on epidemic processes[DB/OL]. [2019-04-30]. https://arXivorg/abs/1905.08525?context=physics.soc-ph.
[108] Qu B, Li C, Van Mieghem P, et al. Ranking of nodal infection probability in susceptible-infected-susceptible epidemic[J]. Sci Rep, 2017, 7(1): 9233.
[109] Iribarren J L, Moro E. Impact of human activity patterns on the dynamics of information diffusion[J]. Phys Rev Lett, 2009, 103(3): 038702.
[110] Wang D, Wen Z, Tong H, et al. Information spreading in context[C]//Proceedings of the 20th international conference on World wide web. ACM, 2011: 735-744.
[111] Pastor-Satorras R, Castellano C, Van Mieghem P, et al. Epidemic processes in complex networks[J]. Rev Mod Phys, 2015, 87(3): 925.
[112] Kermack W O, McKendrick A G. A contribution to the mathematical theory of epidemics[J]. Proceedings of the royal society of london. Series A, Containing papers of a mathematical and physical character, 1927, 115(772): 700-721.
[113] Anderson R M, May R M. Infectious Diseases of Humans: Dynamics and Control[M]. Oxford: Oxford University Press, 1992:13-23.
[114] Keeling M J, Rohani P. Modeling Infectious Diseases in Humans and Animals[M]. Princeton: Princeton University Press, 2007:279-334.
[115] Miritello G, Moro E, Lara R. Dynamical strength of social ties in information spreading[J]. Phys Rev E, 2011, 83(4): 045102.
[116] Kivelä M, Pan R K, Kaski K, et al. Multiscale analysis of spreading in a large communication network[J]. J Stat Mech, 2012,(3): 03005.
[117] Gao L, Wang W, Shu P, et al. Promoting information spreading by using contact memory[J]. Europhys Lett, 2017, 118(1): 18001.
[118] Tang J, Mascolo C, Musolesi M, et al. Exploiting temporal complex network metrics in mobile malware containment[C]//2011 IEEE International Symposium on a World of Wireless, Mobile and Multimedia Networks, IEEE, 2011: 1-9.
[119] Wang H, Chen C, Qu B, et al. Epidemic mitigation via awareness propagation in communication networks: the role of time scales[J]. New J Phys, 2017, 19(7): 073039.
[120] Fournet J, Barrat A. Estimating the epidemic risk using non-uniformly sampled contact data[J]. Sci Rep, 2017, 7(1): 9975.
[121] Génois M, Vestergaard C L, Cattuto C, et al. Compensating for population sampling in simulations of epidemic spread on temporal contact networks[J].Nat Commun, 2015, 6: 8860.
A Review on Modeling and Propagation of Human Temporal Contact Networks
LI Jinga, LI Cong, LI Xiang
(a. Adaptive Network and Control Lab., Department of Electronic Engineering;b. Research Center of Smart Networks and Systems, School of Information Science and Engineering, Fudan University, Shanghai 200433, China)
Abstract :Temporal human contact networks have their own dynamical properties, which can be depicted by defining appropriate topological and temporal characteristic. On the other hand, the inherent structural features of temporal networks affect the dynamical processes occurring on the network significantly, such as epidemic spreading. The research progress is reviewed in this paper, covering the types and representations of human interactions, temporal network structure (network topology, temporal features and time scales), temporal network models as well as the spreading dynamics on temporal network. Then we analyze the current research situation and put forward several future research directions of this field.
Key words : Temporal network; human interaction; network model; epidemic spreading
中图分类号: N941.4
文献标识码: A
文章编号: 16723813(2019)03000121;
DOI: 10.13306/j.1672-3813.2019.03.001
收稿日期: 2019-05-24;修回日期: 2019-07-03
基金项目: 国家自然科学基金(71731004,61603097); 国家杰出青年科学基金(614250190);上海市自然科学基金(16zr1446400)
作者简介: 李靖(1993-),男,安徽芜湖人,硕士研究生,主要研究方向为社交网络分析与建模。
通讯作者: 李聪(1986-),女,辽宁开原人,博士,副研究员,主要研究方向为复杂网络的理论及应用。
(责任编辑 耿金花)
标签:时效网络论文; 人类交互论文; 网络模型论文; 流行病传播论文; 复旦大学电子工程系自适应网络与控制实验室论文; 复旦大学信息科学与工程学院智慧网络与系统研究中心论文;