一类新SEIRS模型上的网络舆情传播行为研究,本文主要内容关键词为:舆情论文,模型论文,网络论文,SEIRS论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近些年来,互联网已渗透到人们生活的方方面面,借助于网络这一平台,人们可以自由发表对某一事件的言论和观点,这使得互联网成为舆情表达和传播的主要阵地,进而形成了一种对社会具有深刻影响力的重要因素——网络舆情。网络舆情是互联网上公众对某事件的认知、态度、情感和行为倾向的集合[1]。 网络舆情作为一种新生的舆论力量,在社会舆情中占据着重要的地位,对网络舆情传播演化和舆情控制的研究已经引起了各国政府和学术界的广泛关注,并取得了较大程度的进展,研究结果能够为网络舆情的管控工作提供重要的理论依据。 1 研究背景 对于网络舆情传播规律的研究,大致分为两个方向:一类学者从微观角度自底向上建立模型,这一类模型比较典型的包括Zanette的小世界网络模型[2]、元胞自动机模型[3-5],其主要思路是通过研究主体之间的交互展现出舆情在宏观群体中的传播态势,这类模型的个体状态和交互规则简单,为研究提供了方便,而这也是此类模型的局限之处,因为不能很好地模拟舆情话题在真实网络世界中的传播。一类学者从宏观群体的角度自顶向下建立模型,在宏观群体中探究舆情传播演化规律,由于网络舆情的传播同传染病扩散机理的相似性,很多学者借鉴传染病传播模型探究网络舆情传播演化规律,Sudbury[6]借鉴传染病模型中的SIR模型探究谣言的传播规律,模型设置的演化规则比较简单,但是为后继学者利用传染病模型研究舆情信息的传播演化提供了思路。张彦超等将传染病动力学与复杂网络相结合提出了一个基于SNS网络的信息传播模型[7],Leskovec等人引入了SIS模型[8],Gruhl等人在此基础上引入了SIR模型[9]。最新的研究成果是以陈波等[10]为代表的在前人研究基础上为了使模型更好地贴近现实情况,引入了潜伏期阶段,将研究放在了媒体的开放环境中,这样得到的研究成果能更好地说明现实的舆情传播规律。这些研究工作均借助于数学工具来分析,使分析结果更具科学性和严密性。朱恒民等以无标度网络为载体提出了舆情传播的SIRS模型[11],该模型充分考虑到了舆情话题传播过程汇总的话题衍生特性,有效地揭示出基于微博用户关注关系形成的复杂网络中舆情传播演化的机理。伍盈等[12]从传播学的视角探讨了网络舆论的衍生传播现象,说明网络舆论衍生现象存在交互性、理性与非理性并存与非制度性的特点;兰月新[13]以突发事件网路舆情传播规律模型为铺垫,研究了网络衍生舆情特点,建立了衍生舆情监测预警模型。但是这些文献在三个方面表现出较大的局限性:(1)虽然有些研究工作充分考虑了舆情传播过程中的话题衍生特性,但是鲜有学者建立基于网络舆情衍生效应的传播模型,并利用模型探究网络舆情的传播衍生行为。(2)建立模型后未对传播模型的阈值进行求解分析,仅仅依靠数值仿真实验探究舆情传播规律,因此不能从传播学的角度深层次地探究舆情传播规律,导致模型在适用性上存在一定的缺陷,得到的实验结果也缺乏充足的理论支持。(3)建立模型后未利用真实舆情事件对模型进行实证研究,以前的研究工作并没有将模型用于真实案例的分析,致使模型的实践指向性不强。 为了弥补上述研究工作的不足,本文在文献调研的基础上提出了基于话题衍生性的网络舆情传播演化SEIRS模型。较之前面提到的模型,该模型充分考虑了舆情传播演化过程中表现出的较强的话题衍生性的特点,并从传播动力学角度求解传播阈值和平衡点,得到舆情传播过程的影响因素,通过数值仿真实验分析这些因素对舆情传播过程的影响程度,这样得到的分析结果可靠性和准确性都得到了提高,最后预测舆情的传播特性并给出相应的舆情导控手段。 2 基于话题衍生性的网络舆情传播演化模型 在SEIRS中,系统中的网民处于四种状态:易感态(S)、潜伏态(E)、感染态(I)、免疫态(R)。对应到舆情传播系统中,S(t)代表无知者,即t时刻不知道舆情的网民;E(t)代表在时刻t已得知舆情信息但尚在犹豫是否传播的网民;I(t)代表在时刻t得知舆情并立即传播的网民;R(t)代表在时刻t接收到舆情信息但不感兴趣的网民。图1表示了四类网民之间的状态转移过程。系统中的参数定义及其意义如表1所示。 显然这些系数都是[0,1]之间的数,且有S(t)+E(t)+I(t)+R(t)=1。(1) 根据系统动力学,可以建立如下的微分方程组模型: 公式(2)中的ρ可以理解为传染度,根据传播动力学知识,可知。 将公式(1)代入公式(2),则原微分方程组可转换为: 研究网络舆情的传播规律,关注的是舆情话题的传播时间和波及范围以及话题何时成为舆论热点,传播过程中是否会停止传播,直至舆情话题淡出网民的视野。基于此,下面将求解传播平衡点和阈值,并分析传播平衡点和阈值揭示网络舆情的传播规律和态势。 3 系统平衡点的求解分析 3.1 传播平衡点和阈值求解 网络传播系统中都会存在一个传播的关键点h,这个值叫做传播阈值,它决定了网络舆情信息传播与否[14]。当h>1时,传播会在一定范围内传播;当h≤1时,舆情信息会逐渐消亡[15]。以下是传播阈值的求解过程。 因为系统为有边界系统,且易知系统的初值均在有界区域D{(E,I,R)|E,I,R≥0且E+I+R≤1}。 (1)无传播平衡点 在(4)中当E,I,R三者的值均为零时,系统中将不存在舆情信息的传播现象,所以边界点(1,0,0,0)是(2)的平衡点,这个D的边界点是系统的无传播平衡点[16]。 (2)内部非零平衡点 以上求出的不传播的零平衡点是一种理想的状态,在网络舆情的真实过程中是不存在的。为了与现实过程吻合,必须在D内部寻找新的非零平衡点。 另公式(3)的左端为零,可以得到: 将公式(4)代入(1)式可以得到: 结合(6)和(4)可以得到公式(3)在D内的非零平衡点(),此平衡点是D内唯一正平衡点。 当h≥1时,系统只存在零传播平衡点,即随着时间的增加,舆情话题将在网络中逐渐淡出网民视野而并未在很大范围内蔓延。当h<1时,系统存在唯一的正平衡点(),即随着时间的增加,如果不进一步采取舆情干预措施,舆情将最终趋于稳定,并在网络内部长期存在。因此需要对传播阈值和系统非零平衡点做进一步的讨论和探究。 3.2 传播阈值内在机理分析 由上述分析可知,舆情传播阈值h直接影响了舆情传播范围和态势,根据传播动力学理论[17],传播阈值越大越有利于控制网络舆情的扩散。对舆情传播阈值的内在机理及其影响因素进行分析,是制定舆情控制策略的重要理论依据。由阈值表达式公式(7)可知, 舆情传播扩散阈值大小受多个参数的影响,下文将分析这些因素对h的影响。 对公式(7)进行变形,则处理后的阈值表达式为: 由公式(9)可知α、τ对h的影响是反方向的;ε、δ、γ对h的影响是正方向的;当ε≥γ时,β对h的影响是正方向的。 通过施加人为的积极性干预,可以增大传播阈值,从而有效控制舆情在网络中大范围的传播,使舆情话题的传播朝着收敛性和可控型发展,这对于舆情防控和危机化解工作十分有利。 4 案例分析——刘志军案 2013年6月9日,原铁道部部长刘志军案开庭审理,检方指控刘志军涉嫌的罪名包括受贿罪和滥用职权罪。而2012年5月,有关部门在对刘志军问题调查情况通报中称,刘志军在2003年至2009年间,曾与多名女性嫖宿。刘志军案开庭审理后,关于刘志军是否应该以“性贿赂”定罪引发媒体和网友热议:百度新闻中,6月9日至7月1日,以“刘志军+性贿赂”为关键词搜索到新闻约930篇;新浪微博中,提及“刘志军”的同时提及“性贿赂”的微博条数高达51 356条,腾讯微博中该数据约为116 000条。刘志军案可以看做是一个比较典型的网络舆情传播的案例。 4.1 数据获取 在信息获取方面,我国的搜索引擎用户规模为4.51亿,网民渗透率达80%[18],而百度作为我国市场份额最高、访问量最大的搜索引擎,当某一网络舆情事件爆发时,绝大部分网民会选择在百度搜索里输入关键词,检索相关信息,关注该事件的进展状况。因此,本文采用百度的关键词日输入总量作为数据指标。 为了利用刘志军案的舆情事件传播规律对模型进行验证,我们在百度指数里以“刘志军案”为关键词进行检索,得到从6月9日至7月10日的网民日关注度的相关数据,如表2。 假设百度用户基数N=2000万,则根据收集的刘志军案关注度数据,通过简单的数据处理,可以得到I(t)的相关数据,如表3。 4.2 数据分析 由于I(t)的变化轨线能够充分反映该舆情时间的传播规律,根据表2中I(t)的实际变化数据画出相应的折线图,并对SEIRS传播模型进行下面的估计:S0=0.94,E0=0.03,I0=0.02,R0=0.01,通过matlab软件进行模型拟合,将其他参数设置如下:ρ=0.3,β=0.2,γ=0.4,ε=0.3,τ=0.1,δ=0.2。图2是事件关注度的折线图和仿真模拟曲线。 从图2中可以看出,仿真模拟曲线和实际数据基本吻合,拟合效果较好。实际情况是在第8天出现了最大值为0.347,而理论值是在第7天出现了最大值为0.344,第6天的数值为0.338与最大值几乎相等,也可以认为是最大值,所以天数基本可以认为是一致的,误差为(0.347-0.344)/0.344=0.87%,在误差允许的范围,理论的情况和实际情况都是传播者到达峰值后17天之后传播者逐渐消失,此时,网民对刘志军案的关注度开始出现疲态,并且随着时间的推移,逐渐平息,直至最终退出网民的视野。所以模型符合实际网络舆情的传播,可以用作对网络舆情传播规律的预测。 5 仿真实验和数据分析 为了验证上述模型求解和理论分析的正确性,本文运用matlab 7.0软件,对基于话题衍生性的SEIRS模型的舆情传播过程进行了数据仿真。实验主要针对规则中的一些重要参数对舆情传播及系统稳定性的影响,以及是否在模型中引入话题衍生率,对模型进行了模拟验证。 5.1 衍生率的存在对传播过程的影响 分析衍生话题的产生对传播过程造成的影响,要比较衍生率τ≠0和τ=0两种状态下舆情传播态势。对于未产生衍生话题的情况,设定τ=0,即舆情话题接收者对舆情话题不感兴趣,则在下一时刻以概率δ转变为易感态,设置其余参数ρ=0.7,β=0.6,γ=0.5,ε=0.6,δ=0.8;原舆情话题在传播过程中产生衍生话题的情况,即τ≠0,实验中令τ=0.2,即对原舆情话题不感兴趣的网民产生新话题的概率为0.2,在上述两种规则下系统传播达到稳定状态,整个过程的话题接收者R的变化轨线如图3。轨线图的横轴表示演化时间,纵轴刻画了R态网民所占的比例。其中实线是忽略衍生效应的话题接收者R的变化轨线,而虚线是考虑话题衍生率的情况下R的变化轨线。 由图3可知,当考虑舆情演化过程中的衍生子话题时,舆情到达平衡点所需时间即系统弛豫时间更长,且舆情传播趋于稳态时免疫者数量大幅上升。考虑某一特定舆情话题在实际网络中的传播,传播过程中若存在大量的新话题制造者,则一旦出现衍生话题,和单一话题的传播情况相比,一般地,该舆情事件的持续时间更长,影响范围更广,表现在实验中即系统弛豫时间延长,免疫者比例即接收到舆情信息的网民数也会大幅上升。实验结果和实际传播情况是相吻合的。 这说明衍生率的存在影响了舆情传播过程,它使舆情话题的传播时间更长,也使系统中接收到舆情信息的用户更多。实验结果与现实中的舆情传播规律是一致的,所以考虑衍生话题的舆情传播模型会更符合实际的舆情传播规律。 5.2 模型中的各参数对传播过程的影响程度分析 4.2节对SEIRS舆情传播模型中的一些参数对传播的影响方向做出了定性分析。在5.1节分析了衍生率的存在确实对传播过程产生影响的理论基础上,有必要针对这些参数对传播过程的影响程度做定量分析,以说明随着时间变化,以上因素对舆情传播演化过程的影响程度,进而更深刻地反映网络舆情传播规律。实验中用控制变量法和对比分析方法进行实验分析。确定各状态网民比例为S0=0.94,E0=0.03,I0=0.02,R0=0.01,以ρ=0.3,β=0.2,γ=0.4,ε=0.3,τ=0.1,δ=0.2为基准,各实验组中变动的参数依照对照组的取值均增加50%,三组实验的变动参数分别为ε、τ、δ。具体参数设置如表4。 根据上表数据设置,分别调用传播模型进行数值仿真,模拟结果见图4~图7,从实验结果中可以观测到舆情传播过程中各状态网民比例随时间变化的轨线。 从图4中可以看出,增大参数ε、τ的取值对S(t)的变化影响不大,实验组1、实验组2和对照组轨线基本重合。其中,实验组1的曲线相较于对照组稍向左下方移动,说明增大直接免疫率,可使舆情传播较快达到平衡,缩短系统收敛时间。实验组2的曲线稍向右下方移动,说明话题衍生率的增加使系统的收敛速度变慢。相较于ε、τ,参数δ的变化对S(t)的轨线影响较大,轨线明显向右偏移,说明直接免疫率的增加可以减缓易感者比例的减小速度,进而延长了系统达到平衡的时间。这些规律均和理论分析的结果相吻合。 由图5可知,处于潜伏态的网民在整个传播过程中所占的比例比较低,在传播初期就到达峰值,并较快达到平衡,这说明潜伏期在整个传播周期中所占时间较短,而且外界因素的微变就可以引起潜伏期人群较大的变动。实验组2的E(t)轨线相较于对照组峰值降低,说明增大直接免疫率可以降低潜伏态网民比例,减缓潜伏者比例的变化。实验组2和对照组曲线基本重合,说明参数的变化对E(t)没有直接影响。实验组3和对照组相比,曲线的峰值没有变化,只是到达峰值的时间稍微延长。实验说明,增大ε,减小δ能够使舆情传播较快达到稳定,并能减小舆情波及的范围,这些和表2的理论分析结果是一致的。 从图6中可以看出,参数ε的变动对I(t)的变化影响较大,相较于对照组,峰值大幅度降低,说明增大直接免疫率能够有效降低舆情话题对社会的影响程度。τ值的增加使传播者比例峰值大幅升高,且到达峰值的时间缩短,说明舆情衍生话题越多,波及的范围越大,对社会的影响程度越大,舆情的持续时间越长。实验组3的曲线和对照组基本吻合,说明δ对S(t)的变化影响不大。 由图7可知,增大直接免疫率ε可以加快免疫者比率的增加速度,可使舆情传播较快达到稳定。τ、δ的增加能够降低免疫者比例的增加速率,延长舆情话题持续时间,所以要尽量降低τ、δ值,以减小舆情的影响范围,降低舆情的负面效应。 针对参数对传播规律影响程度的实验仿真结果与理论分析一致,进一步验证了模型求解和理论分析的正确性。 5.3 模型应用 本文根据舆情话题在网络中传播行为中体现出的话题衍生性的特点,构建了基于话题衍生性的SEIRS网络舆情传播模型,并通过模型求解、理论分析、案例分析以及实验仿真研究了舆情传播规律。根据研究结果,可以建立舆情防控策略和网络舆情突发事件的应对策略,具体可以从以下几个方面入手,见表5。 6 结语 本文引入话题衍生率,提出了改进的SEIRS网络舆情传播模型,模型充分考虑了舆情传播过程中的话题衍生性特性并通过对模型平衡点和传播阈值的分析和求解,全面揭示了舆情传播过程的影响因素,这为舆情传播规律研究提供了新的思路和方法,将案例分析法引入模型,并通过数值仿真验证了求解和理论分析结果的正确性,且实验结果和实际相吻合,所以本文提出的模型更符合实际网络世界中舆情话题的传播情况,这使得此模型较之以前的模型具有更好的适用性和指导意义。 但是模型在揭示衍生话题对舆情传播过程的具体影响方面还缺乏全面性,对影响衍生话题产生的诸多外界因素如政府政策、媒体影响等没有做深入的分析;且实验所选择的数据均为模拟数据,模型参数值也根据经验设定,导致实验结果在客观性方面尚存在一定的缺陷。本文构建的模型只是研究工作的开始,是对以往传播模型的完善。探究影响话题衍生率的外界因素对舆情话题传播规律的影响并对模型进行校正和实证分析将成为接下来研究的重点内容。基于SEIRS模型的网络舆情传播行为研究_舆情论文
基于SEIRS模型的网络舆情传播行为研究_舆情论文
下载Doc文档