一种改进的移动社交网络SEIR信息传播模型研究,本文主要内容关键词为:社交论文,信息传播论文,模型论文,网络论文,SEIR论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G206.3 文献标识码:A 文章编号:1007-7634(2016)03-92-06 1 引言 随着移动互联技术的不断发展,其中以Facebook、Myspace为代表的社交网络服务(Social Network Services,SNS)快速发展,正改变着人们进行沟通与交流的模式,人们开始热衷这种新的互联网应用,以某种共同兴趣等聚合成特定的一个在线群体,进行信息交流或共享。 在国内,类似国外的社交网络服务也逐渐兴盛,其中包括微博、来往、微信等都快速发展,并逐渐开始适用于移动终端。随着移动SNS的发展,其呈现跨网络、跨终端的特点,表现出“及时化、社交化”更便于大众进行实时交互,信息传递[1]。其中,以微信为代表的移动终端应用,截止到2013年11月,注册用户已经突破6亿,是亚洲地区最大用户群体的移动即时通讯软件[2]。微信除了满足基本的实时通信,还有朋友圈等附加功能,人们可以将现实社会中的人际关系,映射到微信朋友圈,建立在线的群体关系,同时可以添加微信的其他应用功能建立起与陌生人的关系,不断扩大朋友圈的范围,从而进行信息获取、交流与共享等。 同时,伴随我国4G移动牌照的发放,移动互联技术的不断进步,人们运用移动在线社交网络进行日常的信息交流会更加频繁,将更加促进信息的快速传递与传播。比如:谣言、舆论、时尚、新闻、广告等信息都可以借助移动SNS在人群中进行快递的传递,产生正面或负面的社会效应。研究移动社交网络的信息传播模型将有助于了解其信息传播的特点与规律,有助于政府进行移动社交网络的舆情控制,也有助于引导移动社交网络中的信息交流与共享。本文以微信朋友圈为研究对象,分析了移动社交网络的特点,考虑微信朋友圈中用户相似度、信息价值和信息时效性三方面影响因素,以SEIR模型为基础进行改进,运用系统动力学理论研究移动社交网络的信息传播问题[3]。 2 相关研究 信息传播模型最早可以追溯到19世纪,起初研究主要集中在生物学和社会科学领域。其中,生物学主要以数理传染病学研究为主,社会科学的研究以创新扩散、社会动乱等为研究重点。伴随计算机技术的发展,Web2.0技术的兴起,人们开始运用互联网进行信息共享与交流。因此,基于网络信息传播模型的研究逐渐成为热点。 比较经典的信息传播模型包括影响力模型[4-5]和传染病模型[6]。影响力模型分为三类:①经典影响力模型,主要通过节点以及节点之间的影响力构建信息的传播过程,但其基于离散时间的方式进行模型构建,不符合现实的信息传播方式;②基于用户之间的影响力模型,主要是通过已知的信息传播特征确定所构建模型中的影响概率参数,从而进行信息预测;③基于用户影响力模型,主要是以用户之间的影响力为中心构建信息传播模型,进行信息、话题的预测。但影响力模型更多的侧重舆情的预测和跟踪。传染病模型利用微分方程建立数学模型,可以准确地描述个体信息在传播过程中随时间的变化状态,从而找出信息传播的规律,发现信息传播过程中的影响因素,进而对信息的传播进行有效控制,增强信息传播的效力,此外,也能对信息进行合理的预测。本文主要以微信朋友圈为研究对象,重点探讨影响信息传播的因素,因此,以传染病模型为基础,构建信息传播模型。 最早的传染病模型由Kermack提出,其通过研究疾病在人群中的传播规律提出SIR[7]和SIS模型。随着WS模型和BA网络模型的提出,人们开始逐渐运用传染病模型结合不同网络特点,研究信息、谣言等在网络中的传播规律,探讨如何提高信息的传播效力、影响因素和谣言控制等问题。 其中,有些学者以基本的传染病模型为基础进行研究。Liu等人[8]基于SIR传播模型,结合微博网络结构的无标度性、信息传播特性等使用NetLogo构造了一个基于主题的模型。Wang等人[9]以SIS模型为基础,进行模型改进,增加信息关注者转发信息和转发者多次转发同一信息的传播模型。张彦超[10]将社交网络节点分为传播、未感染和免疫三类,并构建基于节点度的在线社交网络信息传播模型。 此外,有些学者并没有采用传统的基本模型,而是根据具体的在线社会网络信息的传播过程及特点进行传播模型构建。Xiong等人[11]利用Twitter中不同用户对信息接收程度的不同进行类型划分,提出SCIR模型,并进行仿真实验,探讨网络结构与信息传播速率之间的关系。Wu等人[12]根据在线社会网络中用户发表、浏览等行为,以信息所处状态不同划分阶段研究其动态传播规律。何清等人[13]基于热力学公式,结合基于SIR的信息传播方式,构建了基于能量的社会网络信息传播模型。 上述的信息传播模型中,只是基于传统在线社会网络,以用户对信息的接受状态,以及信息传播的动态变化来进行研究的,并未考虑信息本身的价值特性和用户所构成的关系网络的结构差异对信息的影响。同时以上研究都是研究传统的在线社交网络,并未涉及移动社交网络。本文结合移动社交网络的传播特点,以微信朋友圈为研究对象,通过引入用户相似度、信息价值等影响因素对SEIR模型进行改进,从而解释移动社交网络中的信息传播问题。 3 一种改进的SEIR模型 传统的SEIR模型是有Anderson和May提出,其最早以SIR模型为基础加入潜伏节点,当疾病在传播中存在一个潜伏期,而不是立即进行传播。其基本结构如图1所示。 图1 SEIR模型图 但是,随着移动SNS的发展,以微信朋友圈为研究对象,其信息传播运用SEIR模型无法准确的描述微信朋友圈的信息传递。首先,朋友圈依靠现实的社会关系进行映射形成移动在线的社会网络,不同的朋友圈其用户之间的兴趣相似度不同,其信息的传播方式与速率也不同;其次,信息本身价值的不同也会影响其在朋友圈进行传播,产生不同的影响效力;再次,朋友圈中信息出现频次也会促使用户产生信息传递的行为,最后,信息具有一定的时效性,也是影响信息进行传递的影响因素。 与此同时,朋友圈中的用户在接受信息后并不一定直接以某种概率转化为潜在信息的传递者,因多种因素的影响,有可能直接转化为信息的终结者,阻止信息的继续传递等情况。基于以上考虑,本文尝试引入用户相似度、信息价值、信息出现频次等因素构建一种适用于移动社交网络的改进的SEIR模型。 3.1 用户相似度计算 微信朋友圈作为信息传播的平台,人们日常可以进行信息的传递与交流,我们以用户自身产生的信息内容、分享内容作为信息依据,将信息内容进行整合,通过分词,特征值提取,得出向量矩阵F,再将F矩阵映射到VSM模型中[14],得出用户内容整合的特征距离,其计算如下: 通过公式(1)、(2),我们可以计算出两两整合信息后的值,其代表了用户共享内容之间的相似程度,数值越大,用户与整个微信圈的相似度就越大,所关注的信息和分享的内容越接近。 微信朋友圈主要是以强连接为主的人际交流圈,其所组成的人员相对比较固定,用户相似度相对比较稳定,但用户的信息关注点会不断改变,同时,微信多种应用功能,使得其不断增加弱关系的构建。因此,我们选定一个固定周期进行用户间的信息相似度测算,以便达到数据的即时有效性。 3.2 改进的SEIR模型 我们结合微信这种具有代表性的移动社交网络的现实情景,从以下3方面对传统的SEIR模型进行改进.在改进的SEIR模型中,用户节点状态变换更加多样,从而更能真实的描述现实当中信息的传播状态,同时考虑了用户相似度及信息价值、时效性和信息出现频次等因素,以重点研究他们对微信朋友圈中的信息传播影响。 (1)由于微信朋友圈的现实情境,用户浏览后并不一定转化为潜在的传播者,还可能成为信息的免疫者,阻止信息的继续传递。因此,改进的模型将潜伏期状态的节点一部分转变为感染节点,另一部分以某一概率转变为免疫节点。 (2)免疫状态的节点处理方式更为多样,因信息的传递者有可能在成为免疫节点再次转变为信息的传播者,进行信息的再次传递。因此,结合现实情况免疫节点部分获得终身免疫,部分仍会以一定的概率变为传播节点。 (3)用户浏览信息后,并不一定以一个确定的概率转化为潜在的信息传播者,可能会受到信息价值[15]、朋友圈中用户相似度、信息时效性等因素的影响,因此,模型引入参数,构造易感染节点转换的信息吸引力函数,同时潜在节点除了转换成传播节点,因受其他因素的影响,也可能成为信息的免疫者。 综上所述,改进的SEIR模型如图2所示。 图2 改进的SEIR模型图 如图2所示,其中: ①S→E表示信息发布之后,易感节点因接收到来自其邻居节点(好友)的信息,以概率φ转化为潜伏节点; ②S→R表示易感节点对信息不感兴趣或不相信该信息,以概率θ变成免疫节点; ③E→R表示节点虽接收了来自邻居节点的信息,但并未继续传播,以概率α变为免疫节点; ④E→I表示节点浏览了信息并进行转发和分享,以概率β成为传播节点; ⑤I→R表示传播节点以概率δ转化为免疫节点; ⑥R→I表示部分免疫节点会以一定的概率转化为传播节点,概率为η; 用N表示微信中节点的总数量,一段时间内,微信中的节点都是保持不变的。因此假设任何时刻所有状态的用户总数保持N不变;S(t)表示t时刻处于易感状态的节点数,E(t)表示t时刻处于潜伏状态的节点数,I(t)表示t时刻处于传播状态的节点数,R(t)表示t时刻处于免疫状态的节点数。 在改进的SEIR模型中,设时刻t处易感状态的节点数,S(t)连续且可导。同时,每分钟将有个节点接收到来自邻居节点的信息,有θS(t)个节点接收不到信息,因此在t+Δt时刻,有: 同理可得E(t)、I(t)、R(t)的微分方程,因此,该模型可用公式3~5表示: 信息从发布到用户浏览,会受到诸多因素的影响,因此两状态之间的转移不能仅用某一概率来表示。信息的价值、时效性、同一时间信息出现频次以及用户之间的相似关系都会影响信息在传播的过程中对用户的吸引力。 鉴于以上分析,我们定义如下的信息吸引力函数,表示由易感染节点转化为潜伏节点的转移概率如公式3~6、公式3~7: 代表用户之间关注信息的相似度,因为在微信朋友圈中,朋友之间所发信息或关注的内容不同,我们运用VSM模型,对用户之间的兴趣度进行测量,计算出用户之间的相似程度,一般取值在[0,1]之间,其相似度越高则说明两者之间的信息传播概率会越大。代表信息价值,对于信息价值并没有统一的定义,这里只是代表信息对用户的重要程度,将信息价值用[0,1]上的数值表示,数值越大,其信息价值就越大。n表示同一时间同一信息出现的次数,其值越大,说明信息的重要性越大,阅读完此信息后,易感染节点转化潜伏节点的概率越大。 4 仿真实验 本文使用Matlab2012a对建立的数学模型进行仿真。因为文本针对移动社交网络中微信朋友圈信息的传播研究,根据“150”法则,首先,假设节点初始量。我们假定用户数量N=150,根据论文[16-17],在t=0时刻,设定S(0)=N-1/N,E(0)=0,I(0)=1/N,R(0)=0;其次,参照文献[18]中的参数设置,设有1/20的节点为不活跃节点,即直接由易感状态转变为免疫状态,所以θ=0.05;有1/4的节点会对信息进行浏览但不一定信任或对信息不感兴趣,即该节点由易感状态向潜伏状态转化,则设定n=1,V[,0]=0.1,=0.25;假定α=0.15、β=0.85、δ=0.5、η=0.005。 信息在微信朋友圈上的传播受到诸多因素的影响,通过改变不同的初始条件,对影响信息传播的几个关键因素进行仿真分析。我们通过改变参数取值分析在该参数的不同影响程度下信息的传播规律。 4.1 用户相似度 在微信朋友圈中的信息传播主要依赖于人际之间的关系直接影响信息的传播速率,根据VSM模型,我们用代表人与人之间的相似度值,在实际生活中,我们需要根据用户分享和关注的信息内容进行相似度计算得出G9AA6114.jpg}的数值,但在仿真实验中假定取值,分别选择偏近极点和中间点的数值0.1、0.9和0.5,研究在相似度比较低和比较高和居中值时的信息传播规律,同时再任取一个数值做对比试验,从而观察在不同的相似度取值下,信息的传播过程,因此在实验时,分别取:0.1、0.5、0.75、0.9,仿真结果如图3所示。 图3 用户相似度仿真试验图 从图3中,我们可以看到,随着取值的不断增大,拐点前,S(t)曲线快速减小,陡峭,同时R(t)曲线在快速增加,这说明微信朋友圈中,人们之间的关系(即相似程度)紧密程度越高,人们浏览信息,成为潜在节点的可能性越大;拐点后,S(t)曲线、R(t)曲线逐渐趋于平缓,说明随着相似度的不断增加,微信中大量节点会快速转化为潜在的节点,但随着信息的不断传播而趋于稳定,则微信中的节点状态缓慢变化。I(t)、E(t)曲线的峰值会随着的增大变大,同时到达峰值的时间缩短。 基于以上分析我们可知,微信朋友圈形成后,其人际之间的兴趣越相似,用户之间的联系更为紧密,相互信任的程度更大,信息获取、传递的速率更快,信息可以较短时间产生传播效力形成影响。 4.2 信息价值对信息的传播影响 由于信息的独特性,其价值的判定标准也不同,使得难以统一。在本文中我们假定信息的重要程度是介于0和1之间的随机数,数值越大表示信息的价值越高。其中,取值与取值规则一直,分别取0.1、0.5、0.75、0.9四个不同的数值,其他参数保持不变,实验结果见图4。 图4 信息价值仿真试验图 从图4中,我们看到:V[,1]取值不同,不同状态下的节点会表现出不同的变化和特点。其中,易感节点的数目都是随着时间的推移先快速减少,接下来在剩余的时间里保持另一种下降趋势;潜伏节点最初先增加达到峰值后再缓慢减少;传播节点在最初的时间里先呈现增加趋势,到达峰值之后,随着节点对信息失去兴趣或是信息具有时效性的原因,导致传播信息的节点数目下降,最终没有节点再传播该信息;免疫节点的数目随着时间的推移保持增长趋势,这表明最终微信大部分用户会成为免疫者而不会继续传播该信息。 同时,当信息价值比较高时,大量用户会在较短时间内浏览该信息成为潜伏节点,若信息价值比较低,用户不会关注此信息,从而继续保持在易感染状态。但随着信息的不断传播,和用户浏览数的不断增加,导致了易感状态的节点变化速度不断减少较小。 除此之外,用户节点对信息价值的识别能力直接影响到信息在微信中的传播,信息价值越高信息在微信中的传播速率越快。 4.3 信息出现的次数 在微信朋友圈信息传播中,信息的出现次数也是影响因素之一,但因为微信朋友圈中人员组成较稳定,信息出现次数不会很大,更不会无限。因此,我们按照信息出现频次从小到大设置试验参数,进行仿真,其中n分别取值1、6、10、14,将设定为0.9,其他参数保持不变。仿真结果如图5所示。 图5 信息出现次数仿真试验图 由图5所示可知,随着信息出现次数的增多,S(t)曲线越来越相对舒缓,说明人们在同一时间看到同一信息的数量越多,越不愿意转化为该信息的潜在传播者,促使E(t)曲线也增长放缓。同时随着n取值的增加,I(t)曲线在拐点前越加平缓,峰值减小,达到峰值时所用时间变长。表明此时,信息出现次数的增多,使得转发的速率减慢,信息传播趋于稳定状态。R(t)曲线从图中可知,随着并没有太大变化,说明信息在同一时间出现的次数并不影响免疫节点的数量,只是在信息传播的过程中促使更多的潜在传播者变为传播者,但随着信息的时效性的不断降低,促使传播者逐渐转化为免疫者,使得信息流动处于平衡状态。 通过以上分析,我们可以看出,信息出现的频次越多,人们浏览并进行传播的意愿越小,会直接转化为信息的免疫者,使得信息的传播效力停止。同时,我们发现,随着信息频次的增加,其时效性会加速减弱,网络中不再进行其信息的传播。 4.4 免疫系数α 我们在Matlab 2012a中对免疫系数的不同取值进行了仿真实验,观察传播过程中各状态节点数随免疫系数取值不同的变化情况。为了消除其他影响,其余参数保持初始设定值,将免疫系数分别取三组数值:0.009,0.09,0.9,仿真结果如图6所示。 图6 免疫系数仿真试验图 通过图6,我们发现免疫系数较小时,S(t)曲线下降趋势较为平缓;而随着免疫系数的不断增大,S(t)曲线下降速率增加,趋势变陡峭,最终保持较低水平。E(t)、I(t)曲线的峰值基本不受免疫系数的影响。R(t)曲线随免疫系数影响较大,随着系数的增加,其增加的速率不断加快。 通过以上分析可知,在其他参数不变时,免疫系数越小,单位时间内就有越少的易感节点能成为免疫节点,免疫系数越大,单位时间内转化为免疫节点的易感节点数目就越多,当达到一定临界值后,易感节点会在某一时间降为0,相对应的免疫节点的上升趋势也会减缓。 在实际中,免疫系数对信息在朋友圈中的传播起到关键作用,可以大幅度影响信息传播效力。在日常生活中,我们更是可以通过改变免疫系数进行谣言、舆论等信息控制等。但免疫系数可能受多种因素影响,比如:用户自身特性、朋友圈关系结构、微信软件的自身设计等,还需进一步研究。 总之,微信较传统的社交网络服务有许多不同和创新。首先,其主要以强关系建立熟人交际圈进行信息交流与沟通。其次,微信朋友圈主要建立在基于现实生活实体关系的基础之上。再次,微信功能众多,个人或人群使用微信的习惯各不一样,使得信息传播的效力不尽相同。最后,微信以强关系为主,弱关系为辅的应用功能设计,和基于对等方式的关注机制,使得微信相对私密和保守,易产生小众传播的效应,但却能够使得信息进行精确传递。 5 结语 本文以移动社交网络具有代表性软件中的微信朋友圈为研究对象,分析了其信息传播特点,及用户相似度、信息价值和信息出现频次对其信息传播的影响,在此基础上给出一种适用于解释移动社交网络信息传播规律的改进的SEIR模型,实验表明,该改进模型能较好说明用户相似度、信息价值和信息出现频次对移动社交网络信息传播的影响。 虽然本文最后进行了模型的仿真实验,但因为微信涉及个人私密信息,目前,腾讯公司未能开放接口平台对用户数据进行收集,只能按照理论的方式进行实验,从而跟真实状况有一定出入。同时,在进行用户相似度计算时,运用VSM模型,其实际的计算量较大,实施相对复杂。下一步,我们将着手进一步的研究,改进用户相似度的计算方式,争取收集到部分用户的真实数据进行研究。标签:社交网络论文; 仿真软件论文; 网络节点论文; 用户研究论文; 网络模型论文; 概率计算论文; 社交平台论文; 移动互联网论文; 朋友圈论文;