社交网站交互模式分析,本文主要内容关键词为:社交论文,模式论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
最近几年,社交网站(Social Networking Site,SNS)逐渐流行。最大的社交网站,如Facebook、Myspace等,已经吸引了成百万的用户。它为用户提供了一个交流和分享信息的新的平台。用户可以在上面进行各种交互:建立朋友关系、分享日志、撰写评论、搜索特定的用户或者共享的资源。传统的Web服务围绕信息文档,而SNS不同于传统的在线社交社区,它更加集中于用户和用户之间的社会关系以及基于共同兴趣的社区。
SNS正改变着用户在Internet上的交互方式,深入理解SNS中用户的交互能够帮助我们更好理解关于人类社会行为、社交网站平台的设计和应用等问题。首先,社会研究者需要理解真实世界中的相关理论是否在SNS中依然有效,是否可以使用SNS数据映射真实世界数据,以便进行将来真实世界中的相关社会理论的研究。其次,市场营销者需要理解SNS中交互网络结构特点,追踪社会网络中的信息传播,识别品牌推广和广告活动中“流行”或者“有影响力”的目标用户[1,2]。此外,理解用户的交互因素和模式能够帮助SNS设计者设计新的、更有吸引的社会交互机制,激发商业成功[3]。最后,利用交互网络提高网络应用性能,如减少垃圾电子邮件,防范Sybil攻击[4],预测SNS上连接朋友关系的强弱[5-7]。
SNS是一个新现象,它的研究历史较短。在SNS出现之前,其他各种在线交互网络交互已经被研究,如,电子邮件[8~10]、移动数据[11,12]、MSN即时通信数据[13]等。初始的测量研究SNS集中于社会图的拓扑结构[14~16]。为了更好地理解SNS用户关系的真实的本质,最近的工作已经转移注意力,研究可观测的社会交互。Golder等分析了Facebook大学生交互信息,洞察它们的规律,了解大学生的使用时间和他们的社会生活[17]。Chun等分析了Cyworld中张贴评论的活动网络的结构特征,并和对应的朋友关系网络进行了比较。他们挖掘了交互网络的权重和有向的本质,研究了互惠性、差别和网络动机[18]。Huang分析了SNS中连接朋友关系膨胀引起的问题,对于交互网络进行了宏观特性进行了分析[3]。Wilson分析了Facebook用户交互图,发现交互图网络结构显著不同于社会网络。比如,他们显示,比起社会网络,交互网络展现出更少的小世界特征,他们也检查了每个用户的交互数量的发展[4]。Viswanath研究了Facebook社会网络的交互的发展,发现交互网络中关系的强度展现出随着社会网络连接的时间一个总的减少的趋势,活动趋向于快速变化,但是,交互的很多图理论特征没有发生变化[19]。
显然,大多数文献集中于SNS的朋友连接或者交互的宏观结构特征。这些研究使用能够洞察SNS各种描述性的技术。但是,导致宏观结构的微观效果没有检查,即,是哪些因素决定了演化过程?社会网络关系之间存在非常复杂的依赖,网络数据结构不是由独立观测组成的。此外,同样的宏观结构可能由不同类型的微观过程产生。
因此,本文的目标是填补这个空白,识别社交网站交互网络形成的决定性因素,并比较它和现实世界朋友网络的异同。
2 理论与假设
计算机媒介交流(Computer Mediated Communication,CMC)正在成为人们交流的主要方式,它改变了个人的社会行为,也影响了组织的结构。通过人们一段时间交互形成的社会网络结构使得交流结构成为社会网络分析系统研究的主题。因为,个体级别角度能够回答为什么和何时个体参与交互,而网络级别方法能够处理个体如何集成而形成交互。通过一个网络视角,个体被嵌入到一个通过反复交互形成的关系网络中。社会网络分析是一个交互学科的研究范式,它结合了社会学、人类学、交流科学、经济学、物理学、管理科学和计算机科学等学科。社会网络分析中有两个不同的研究方向。一个方向考虑社会网络的发展,另外一个研究一个行动者性能及其在一个社会网络中嵌入性的关联。在第一个方向中,早期的模型检查了社会网络的发展,主要研究网络结构特征(如传递性、互惠性和度分布)如何影响网络演化过程。这种模型最近的发展也允许几个行动者特征的集成。因此,社会网络和行动者特征能够同时是独立和依赖变量。这样,这些模型能够说明在网络结构和行动者特征之间的随机关系的统计测量,而这在以前是不可能的。这种想法和Contractor等提出的应用多级别和网络视角研究新形势的组织的思想一致[20]。
首先,我们提出3个假设,检查内生网络变量。其次,我们提出假设解释行动者的人口特性(性别)对网络形成的影响。接着,我们使用组织中心理论检查对网络形成的影响。最后,我们在交互网络中特别考虑行动者性能级别对网络的影响。
2.1 内生网络效果
Contractor等回顾了关于交互网络的结构趋势,开发了一个用于检查网络动态性的多理论多级别的框架(Multi-theoretical Multi-level Framework,MTML)[20]。在这个MTML框架中,他们识别了四个不同分析级别的内生变量和理论:全局、三元、二元和单个行动者。他们认为网络形成模型不应该仅仅关注单个级别的分析,而是应该寻求在模型中集成几个级别。遵循这样的建议,我们首先识别不同级别潜在的内生网络机制。
在行动者分析级别,构建和维护交互需要成本[21]。在现实世界中,青少年中的朋友关系需要投资时间、精力和社会资本。因此,在其他结构和行为因素缺省的情况下,青少年不会创建朋友关系[22]。在Facebook上,对于大多数用户,主要的交互发生在一个小的范围的连接朋友中。用户趋向于和一小部分连接朋友交互,通常50%以上的连接朋友没有交互[4]。因此假设:
H1:在SNS中,交互关系是需要成本的。
在二元分析级别,Contractor等提出关于相互关系的几个理论[20]。这些理论包括社会交换理论和网络交换理论等。社会交换理论尝试研究个人之间的关系和社会过程(如影响的力量和实践)。它承认个体行动和交换的重要性,提供了研究集体结果的一种方式。在社会交换理论中的一个关键的发展是结合了交换关系形成网络结构观点的网络角度,从一个网络角度研究社会交换。作为一个平行的和补充的研究流,网络交换研究主要集中于力量问题,包括在社会结构中的正面的和负面的许可的效果,研究资源网络中个体和群体行为补充了社会交换理论。个体之间的社会交互,发生在个体之间,但是也在一个网络的背景中。交互本质上是社会性的,用于影响其他人。在SNS中,交互变得更加显著:张贴评论和回复对于其他的个体是可见的。网络交换理论的一个核心概念是互惠[23,24]。社会网络趋向于展示一个高互惠性,如,如果行动者i和行动者j交朋友,那么j趋向于和i交朋友。其他的研究者已经发现了在线学习网络的互惠效果[25]。因此,我们假设:
H2:在SNS中,交互关系具有互惠性。
在三元分析级别,网络闭合理论、平衡理论等理论认为存在一个传递三角的趋势。经典的三元闭合过程认为包含两个关系的三元趋向于形成第三个关系,创建一个三角形。三角传递是指,如果行动者i选择行动者j作为朋友,行动者j选择行动者k朋友,那么行动者i和行动者k很可能是朋友关系[26]。即,随着时间的发展,行动者趋向于和他的朋友的朋友成为朋友。因为形成派系和三角的压力,行动者不会形成不闭合的朋友关系,即,当一个关系闭合了二路经为一个三角形,行动者将形成这样的关系。进一步,三角形只是更大社会群体的组成部分,行动者不会创建具有公共节点的多个不闭合的三角形,如果一个关系闭合多个二路径为多个三角形,行动者更可能形成这个关系。因此,我们假设:
H3:在SNS中,比起随机选择,一个行动者通过闭合一个传递的三角选择行动者作为交互伙伴的概率更高。
2.2 人口特征效果
本部分检查行动者的人口特征是否影响网络形成过程。同质性理论认为类似的人更容易发生接触。同质性基于各种属性,如性别、年龄和爱好。早期的同质性研究了小的社会群体,其中观测者能够看到成员之间的联系[27]。观测是基于行为线索和个体关于紧密朋友的描述数据。同质性的首个证据来源于学校孩子、大学生和小城市地区的非正式的关系。这些最初的研究显示了基于人口特征的同质性,如年龄、性别、人种和教育[27]。20世纪70~80年代,由于使用现代的样本调研,同质性研究发生改变。最近的研究更多分析网络的组织背景。有两种同质性:状态同质性(stutus homophily)和价值同质性(value homophily)。状态同质性基于社会状态或者个体在社会中的位置。价值同质性基于价值、态度和信仰,而不依赖于社会状态[27]。同质性的普遍存在的事实意味着通过网络流动的文化、行为、基因或者物质信息将趋向于局部化。一些实证研究发现性别同质性的证据[28]。即,女性更加可能和女性交互,男性更加可能和男性交互。因此,我们假设:
H4:在SNS中,女性更趋向于和女性交互,而男性更偏向于和男性交互。
2.3 组织中心(Organizational Foci)效果
学校、工作和志愿组织中心提供了非亲属关系的大多数关系[29]。中心活动使得人们彼此接触,促进个人关系的形成[30],因此引入了邻近机制。组织中心效果通过空间的邻近(如邻居)或者共同的机构环境(如学校、大学课程、车间、家庭、志愿组织)[30]而出现。组织中心效果的本质和重要性依赖于个体在机构和物理空间的分布。它导致个体更加可能交互和形成关系的各种形式的社会边界。研究发现,学生居住的空间邻近可能影响学校中关系的形成[31,32]。因此,我们假设:
H5:宿舍住得越近,SNS用户越有可能交互。
H6:有过共同的选修课,SNS用户更加可能交互。
2.4 级别效果
经常使用SNS的用户常常是比较活跃的用户,他们更加可能常常更新自己的状态、写日志、浏览朋友的文章或者回复留言等。而等级低的用户登录较少,更新较慢。研究发现,人们参与层次越高,交互越多[33]。因此,行动者在SNS上越活跃,可能交互越多。此外,根据同质性原理,我们可以推测活跃用户之间更加倾向于交互。因此,我们假设:
H7:行动者在SNS中的级别越高,他越有可能被其他行动者选择交互。
H8:行动者在SNS中的级别越高,他更加可能和其他行动者交互。
H9:高级别者更容易和高级别者交互。
3 方法
3.1 数据收集和样本
为了测试提出的假设,我们使用南京某高校2007级计算机专业三个班级在人人网中的数据。人人网发布于2005年,是中国高校学生使用最多的SNS站点。当用户注册人人网之后,会得到一个主页,它包含日志、留言板等。用户能够和其他朋友建立朋友关系、分享信息、写日志、浏览照片、留下评论等。三个班级中,有12名同学没有人人网的账号,而其余同学均有人人网络账号,占93.75%,表1为数据基本信息。我们收集了2008年12月到2010年12月期间学生在留言礼物交换、留言板留言等公开交互信息的数据,以及每位学生在人人网的属性特征:级别。在人人网上,用户连续登录,回复好友的照片、日志、状态,发表日志、传照片、改状态等可以获得更多积分,通过积分的不同,划分为从第最低1等级到最高45等级。
根据三个班级的交互信息,我们为三个班级分别构建邻接矩阵。其中,一个节点表示一位用户,从节点i到节点j的一条弧表示用户i在数据收集期间内写信息给用户j。不同于SNS上的连接朋友关系,用户之间的交互是有方向的。
此外,我们得到了三个班级学生的自身的一些信息(如性别、宿舍等),并对他们进行社会调研。我们使用传统的自我中心问卷方法来创建朋友网络,请每一位同学列出自己在本班级的好朋友。图1为三个班级的交互图和对应的朋友图,图中红色圆形节点表示女性,蓝色方形节点表示男性。表2提供了总的网络统计描述。3班和5班同学的交互网络密度大于本班的朋友网络,而7班则刚刚相反,朋友网络密度比交互网更大。
图1 交互网络和朋友网络
我们使用Quadratic Assignment Procedure(QAP)比较网络之间的相关性。相关系数是正的,且都在0.01的显著水平显著,如表3所示。因此,交互关系和朋友关系在统计意义上是相关联的。这说明,朋友之间常常交互,但是,用户也常常和不是好朋友的其他用户交互。
3.2 模型
为了检验SNS的交互网络发展因素,我们使用指数随机图模型(Exponential Random Graph Model,ERGM)。该模型是网络特征的统计测量,概率函数依赖于网络统计量线性组合构成的指数函数,检验直接驱动网络形成的实际力量。ERGM是相对较新的关于建模观测社会网络的方法论。不同于传统的社会网络分析方法只是针对单一网络结构进行分析,ERGM同时考虑了多个层次的网络结构和变量,能够更加全面揭示网络结构形成的社会化过程,推断某种网络子结构是否比偶然出现更可能存在于网络中,定量评估不同社会过程对网络结构产生的相似预测的差异,实现微观到宏观的跨越[34]。
ERGM表示的是关于固定节点集的图的概率分布。模型假设网络是由随机过程产生,观察到的图的概率取决于模型中包含各种结构出现的次数。它的一般形式为:
ERGM是一组模型,基于不同的假设,它经历了一个发展的过程。最简单的模型是Bernoulli图模型,它假设所有网络中的弧都是相互独立的。所以,Bernoulli中只有弧。稍微复杂一点的模型是二方模型,它假设有向网络图中的二方关系都是相互独立的,如行动者A和行动者B的关系与行动者B和行动者C的关系无关。这样,在模型中有两种统计量,弧和互惠弧。但是,无论在经验上,还是理论上,上述两种模型都是不现实的。为此,Frank和Strauss引入了马尔可夫依赖,它假设两个关系如果有一个共同的行动者,就认为它们是条件依赖的。在同质性假设条件下,无向网络的马尔可夫随机图模型为:
公式(2)中只出现了2-星和3-星,隐含着三阶以上的高阶星数目为零。但是,许多研究表明马尔可夫模型对于观测社会网络来说不是好的模型,会产生一些严重的问题[34]。因此,Snijders等提出了三种新的统计量:交互k-星、交互三角形和交互独立二路径[35]。这些变量的引入提高了模型的收敛性,并且考虑了各阶星和三角形的综合效应。
3.3 包含在函数中的测试变量
ERGM把各种层次的网络结构变量同时加以考虑,有利于区分哪一种变量在网络形成过程中更加重要,从而揭示网络形成的社会化过程。本文中主要包含以下变量,如图2所示。
图2 有向图的网络结构变量
在图2中,Arc为弧,表示交互网络关系的密集程度,行动者交互的基本趋势。Reciprocity是互惠性,测量两个行动者相互选择的趋势,若行动者i与行动者j交互,则j与i交互的可能性。AinS描述个体的受欢迎程度(聚敛性)。AoutS表示个体的活跃性的能力(扩张性)。AT-T表示传递路径闭合。行动者i趋向于选择他的交互伙伴k的交互伙伴j交互。这是一个路径缩短效果。而且,当k的数量增加的时候,这个选择的强度会增加。但是增加不是线性的,超过某一个数据,发现一个额外的k不会显著增加2路径闭合的机会。AT-U为活动闭合,描述结构同质性效果。传统上,同质性是就属性相似性,这里的相似性存在于同伴类似的选择。潜在的可能的过程是i和j都选择了伙伴k,则i更加可能选择j。AT-D为欢迎性闭合。这是另外一种结构同质性参数效果。但是,它是基于受欢迎性的闭合。潜在的过程可能是对于k有相似受欢迎性的i和j,则i更加可能选择j。当AT-T,AT-U,AT-D效果同时出现,具有相似的强度,通过限制三个参数一样,推论一个更加综合的传递效果。即,统计AD-TDU。A2P-T表示多个局部的联系。A2P-U为基于活跃性的结构等价变量。A2P-D为基于流行性的结构等价变量。
除了网络结构变量之外,模型中还引入了个人属性变量,包括性别、宿舍、选修课以及级别。Gender_interaction表示相同性别是否增加交互的可能性。Room_differenance表示宿舍距离越小是否增加交互的可能性。Curriculam_matching描述共同的选修课是否增加交互的可能性。Performance-sender说明高级别的个体是否更加可能交互。Performance_receiver反映高级别的个体是否更加可能被选择交互。Performance_sum体现高级别的个体之间是否更加容易交互。
3.4 分析
本文使用基于MCMC-MLE的PNet软件对若干模型进行参数估计。常用的用于估计参数的方法有极大伪似然估计法(Maximum Pseudo-Likelihood Estimation,MPLE)和马尔可夫链蒙特卡罗极大似然估计法(Markov Chain Monte Carlo Maximum Likelihood Estimation,MCMC -MLE)。MPLE方法将模型转变为Logit形式,从而可以利用Logistic回归技术进行似然性的拟合检验。MCMC-MLE的核心是模拟一个起点的参数集合的随机图的分布,通过比较相应随机图与观测图的分布来修正参数值,重复这个过程一直到估计值稳定为止。有研究表明MCMC-MLE方法比起MPLE方法工作更加出色[36],特别是当网络中有强二方依赖的时候。
在模型结构参数估计完成以后,需要评价模型如何有效地描述反映变量及模型匹配观察数据的程度。如果模型的估计值能够与对应的观测值有较高的一致性,就认为这一模型拟合数据。否则,将不能接受这一模型,而需要对模型进行重新设置。这个过程称为拟合优度(goodness of fit)。在MCMC-MLE方法中,这个过程将根据估计变量值仿真产生图,通过计算拟合优度统计值比较仿真图形和观测图形。对于每一个参数,将使用t-统计(t-统计量=(观察值-样本均值)/标准差)来衡量拟合优度。对于模型包含的参数变量,t-统计绝对值要小于0.1,而模型中没有出现的参数变量,t-统计绝对值要小于2[37]。
首先,我们仅仅使用网络结构变量构建模型。然后,我们研究了行动者人口特征、组织中心、级别的效果。最后,我们将两者结合。结合的模型有最好的模型拟合,模型中包含的参数变量的t-统计值均小于0.1。模型中没有包含的参数变量,我们参考Robins[38]的建议,从图数量和关联统计、度分布、聚集和地理分布等几个方面的选择参数变量。这些没有包含在模型中的参数变量的t-统计值都均小于2,符合模型收敛的要求,说明模型良好地拟合了数据,所以,我们最后选择了结合模型。
4 结果
表4、表5和表6为模型参数估计的结果。一个参数估计的符号说明了一个特别的结构或者行为特征如何影响一个关系形成的概率。参数的标准差评估了模型中参数的显著性。如果参数估计是偏差的两倍以上,那么它表示一个显著的效果。这说明这些结构和行为特征比起随机预测更加频繁或者不频繁地出现。
三个班级的弧参数是负的显著的,这说明形成新的关系是昂贵的,H1被支持。交互是需要成本的,在没有其他结构和行为因素的情况下很难发生,参数的值说明,这可能是一个强的效果。交互网络比朋友网络更加难于形成。互惠性都是正的显著的,因此H2被支持。互惠性在交互网和朋友网中都是非常重要的。例如,班级7的交互网中,如果行动者A和行动者B交互,那么,B和A交互的可能性增加了26倍(exp3.25)。同样的,如果A指出B是他(她)的朋友,那么B认为A是朋友的可能性增加了16倍。在三个班级中,有的交互网络比朋友网络高,有的要弱。传递闭合效果是正的显著的,H3被支持。行动者常常创建多个闭合的三角形,网络趋向于聚集在一起,形成更加紧密的区域。但是,参数的值说明它的效果没有朋友网络强。
H4测试了性别同质性对交互的影响。虽然班级7具有性别同性交互是正的显著的,但是,班级3和班级5均不显著,所以假设不被支持。而且,即使班级7虽然存在性别同质性,但是比起现实世界的朋友网络的性别同质性要小很多。
宿舍越近越容易交互(H5),参数估计有的班级显著,有的班级不显著,所以不被支持。而在真实朋友网络中都支持,这说明,在真实世界中,居住得越近,越容易成为好朋友。如果有共同的选修课则更可能交互(H6)被班级3和班级5支持(班级7没有这样的选修课程选择机会而没有使用这个效果)。在朋友网络中也是正的、显著的。但是交互网络中的这种作用比起朋友网络中要小很多。
关于用户级别的假设H7-H9均被支持,参数是正的显著的。这说明高级别行动者更容易交互,高级别能越容易被选择成为交互对象,高级别用户更容易彼此交互。
5 结论
本文检验了决定SNS交互网络发展的因素,并与现实世界朋友网络的相应的形成因素作了比较。与属性变量效果相比,网络结构变量作用更为明显。SNS的交互网络关系稀疏,支持互惠性和聚集效果。SNS交互网络中没有呈现出性别同质性。共同的选修课程对交互有正的影响,而宿舍的远近对交互没有显著影响。级别高的用户更容易交互,级别高的用户也更加容易被选择交互,级别高的用户之间更加容易进行交互。由此可见,交互网络结构和朋友网络结构相似,在一些方面一致,如高成本、互惠性、聚集性等。另外一方面,交互网络又不同于朋友网络,如性别同质性,聚集虽然存在,但是效果减弱,共同的空间邻近效果,宿舍、选修课也是如此,均没有现实的朋友网络强烈。
我们认为SNS交互和现实世界的朋友的这些差异可能是由于交互媒介的不同而产生。SNS属于计算机媒介交流(Computer Mediated Communication,CMC)。基于CMC的社会交互比起面对面的交流更加便利,突破了不同时间、地域位置和等级的局限。CMC能够是非同步的,不要求严格的立即的互惠[39],这提供了最适宜回复时间的机会。因此,可以穿越时间和地理创建和维护社会关系。比起传统研究的面对面交互,CMC中的社会线索更少[39,40],这有助于穿越一个等级和其他的社会障碍,创建多样的关系[40,41]。不丰富的交互,如缺乏态度、姿势、面部表情等似乎打破了同质性的障碍[42]。类似地,Leskovec等[13]发现Messanger即时通信也不存在性别同质性,而且异性之间交互花费的精力更多。这样,CMC通过联系各种各样的人(甚至绝少同质性的人)支持多样关系。此外,由于CMC交互和面对面交互的不同,也使得CMC交互中包含多种强度的关系,如SNS的交流中既有好友之间的交流,也有一般同学之间的非强关系的交流。因此,基于CMC的交流具有关系强度多样性的特点。在传统的面对面地社会交互中,如果i和j、k交互,根据平衡理论,j和k也很可能彼此成为强关系。而基于CMC的交互是多元关系,不仅有强关系,也有非强关系,因此,传递聚集特性就不明显了。Lex等在研究Email交互时,也有相似的发现:Email网络比朋友网络具有更低的传递聚集特性[10]。在交互网络中,宿舍的远近没有显著影响。以往的文献认为人们更加可能和近距离的人接触。Zipf把这个原则认为是努力的事情:和离得更远的人联系要花费更多的精力[43]。新技术的出现通过降低接触所需要付出的努力而放松地理边界,非常邻近不再比中间距离有很多的特权。在Lex的Email研究中,也发现了电子邮件放松了地理边界[10]。但是,这些新的科技接触并没有消除老的关系,居民地理近四仍然是朋友社交的最好预测[44]。在我们的关系中,相同的宿舍也起着显著的正的作用,宿舍距离越近,越有可能成为好友。
这些研究发现对于研究社会网络的学者、关注SNS上信息扩散的学者、从事SNS平台本身的设计者和致力于SNS上应用的研究者均有启示。对于社会学者来说,包括SNS在内的各种CMC数据的快速增长为研究者提供了一个数据金矿。以前,社会学者为了获得社会结构信息,需要进行各种问卷调查、观察或者文档交流。而使用CMC数据研究理论有很多优点:分析者能够记录SNS中的交互,允许纵向分析。从而可以弱化文献中数据可依赖性的威胁,如社会可取偏差、问卷顺序效应、记忆效应、观测之间的可靠性、面试官失真和霍桑效应。而且,很多情况下,CMC数据比起真实世界的数据更加容易获得。比如,个人可能拒绝提供个人隐私性能的数据,样本不同寻常得大。因此,一些研究收集CMC数据进行社会网络分析。例如,利用e-mail交互数据研究一个组织内知识流动[8,45]。特别地,与其他的CMC数据不同,SNS数据某些特征能映射了真实世界的朋友关系。因此,Wimmer等采用Facebook 的上传照片映射真实生活中的朋友关系,以此研究人种同质性等问题[46]。Mayer等使用Facebook上的“好友”连接,作为一个学生的社会网络,研究促进学生多元化的大学政策[47]。然而,研究发现虽然用户在SNS上有很多“好友”,但用户趋向于仅仅和一小部分“好友”交互[4,48]。学者质疑了SNS中“好友”术语的有效性,认为它不是真实用户关系的有效指示器[4,49],而用户之间的SNS上交互更加精确地描述有意义的同伴联系[4,48]。交互网络的结构类似于真实的朋友关系网络,入度和出度分布彼此接近,高度互惠[18]。我们的研究进一步补充了这些研究,交互网络结构和朋友网络结构相似,如高成本、互惠性和聚集性等。但是,使用交互网络替代朋友网络可能低估了聚集性、组织中心效果,性别同质性。这些发现能够作为社会学研究者选择SNS交互数据进行社会研究的参考。
随着SNS的流行,商业公司、政治家开始利用社交网络进行市场营销和思想传播。由于系统行为的复杂性,学者常采用基于Agent建模方法(Agent Based Modeling,ABM)研究口碑、信息扩散等。在ABM中,社会传播网络的结构是一个非常重要的因素。使用不同的网络,对信息扩散的范围、扩散速度、种子策略等会产生不同的影响[50,51]。网络模型可以是确定的或者随机的。而确定性机制可能有很大的局限性,相比之下,随机计算建模是一项更加复杂但是也更现实的工作[52]。在随机建模中,常常使用的有ER随机图、小世界网络、无标度网络。如,学者开发了一个基于小世界网络的ABM在线口碑传播模型[53]。虽然在很多时候这些方法是合理的,但是,它们产生的网络可能和真实的网络不同,而且模型中节点的状态场是同质的。Monge等阐述了使用ERGM对网络进行计算建模的方法[52]。ERGM方法允许用户指定网络形成和结构以及节点属性的特征,并且可是使用拟合测试,帮助用户选择包含预测变量和网络特征的效果,使用被拟合的模型仿真新的模型。实际上,ERGM能够产生小世界网络的特征[54]。有学者基于ERGM框架作为网络,开发了一个建模框架,用于研究HIV的传播。而随着SNS的日益流行,利用SNS上的用户进行商品口碑的研究也逐渐吸引了市场营销者的注意力。在ERGM的交互网络上仿真建模,研究SNS中的信息传播、口碑效果将更加具有实际意义。
比起SNS“好友”网络,SNS交互网络是一个更有影响力的网络,驱动SNS使用和发展[48]。对于SNS的设计者来说,需要理解深入理解交互,设计新的更具有吸引的社会交互机制,刺激商业成功。我们的发现对此也有帮助。用户在级别较高,参与SNS程度比较高,就更容易浏览别人的日志状态,评论他人的日志、留下留言等;也因为经常登陆网站、发表日志、更新心情,就更加容易吸引别人的眼光,留下评论。因此,对于SNS平台的设计者来说,为了提高用户的交互参与,可以利用这个结果,进一步改进服务平台,使得用户更加容易更改自己的状态、写日志等活动,从而提高自己的级别,并吸引更多其他的用户。
目前,一些SNS已经开放部分API给第三方开发者,这样程序员能够在计算机平台上开发应用软件。学者已经建议在HTTP和TCP/IP协议上构建一个社会网络层,用于建立相互信任和责任[55]。比如,使用SNS中预测用户之间的关系的强弱[5-7],这些研究主要采用用户之间可见的交互信息和机器学习方法。但是,我们发现,在SNS中有些用户之间交互被设置为隐私,对于研究者是不可见的;还有的用户(如同宿舍朋友)在SNS上没有交互的线索。此时,可以利用我们的发现,在可见交互信息判断用户关系强弱的基础上,利用互惠性、三方闭合等理论预测另外一部分用户之间的关系强度。
在本次研究中,我们也注意到它的局限性。我们的研究的工作是在一个学校的同一个专业的三个班级展开的,但是,我们仍然相信,我们的主要发现适用于很多场合。在将来,我们将扩展我们的研究,收集更多学校,不同专业的数据。此外,交互网络本身是一个动态的过程,我们将进一步考虑时间因素对交互网络的影响。
标签:社会网络理论论文; 用户研究论文; 统计模型论文; 网络模型论文; 关系模型论文; 网站结构论文; 网站统计论文; 网站分析论文; 特征选择论文; 用户分析论文; 社交平台论文; 变量论文; sns论文;