网络舆论领袖测量方法初探,本文主要内容关键词为:舆论论文,领袖论文,测量方法论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号] G206 [文献标识码] A [文章编号] 1002-5685(2008)06-0070-05
所谓舆论领袖就是在政治竞选投票过程中,经常给别人提供建议的人。舆论领袖现象最早被哥伦比亚大学应用社会研究所拉扎斯菲尔德、贝雷尔森等人1940年在美国依利县有关政治选举研究中发现。(Katz,1957,p.63)。随着各个学科对舆论领袖现象的日益关注,西方产生了丰富的舆论领袖测量方法和理论成果。随着互联网在中国社会日益普及和网络言论影响力的加大,加强舆论领袖的舆论引导作用的论述逐渐增多。但是,这些文章多论述停留在表面泛泛的议论和断言,由于缺乏明确的操作性定义和测量方法,尚难以进行科学实、证的考察。本文欲对1990年代以来西方网络舆论领袖测量的两个重要研究取向,作一简单评述,为国内开展相关研究提供参考。一个是将传统舆论领袖测量方法移植到网络,另一个是采取与传统舆论领袖截然不同方法,即数据挖掘方法测量舆论领袖。前者可以称为“用传统方法研究现代问题”,后者为“用现代方法研究现代问题”。
一、网络舆论领袖测量方法——移植取向
传统舆论领袖测量方法很多,罗杰斯将这些方法归类总结为:社会计量法(Sociometric techniques)、 关键人物访谈法(interviews with key informant s)、观察法(observation)、自我报告法(self-designating techniques)。由于自我报告法实施起来简单、经济,可以进行大规模测量,因此为最常用的方法;量表在实际使用过程中也不断得到改善和更新。第一个舆论领袖测量量表由卡茨和拉扎斯菲尔德1955年创建,称为Katz and Lazarsfeld量表,在迪凯特研究中首次使用。Katz and Lazarsfeld量表之后,50多年间一系列量表相继提出,按照时间先后顺序依次为:1962年Rogers & Cartano量表、1965年Troldahl & vanDam量表、1970年King&Summers量表、1978年Levy量表、 1986年Childers量表、1994年Flynn,Goldsmith & Eastman量表。从1955年第一个测量舆论领袖Katz and Lazarsfeld量表到1994年Flynn,Goldsmith & Eastman量表,是舆论领袖测量方法形成、发展和成熟阶段。
与丰富的传统舆论领袖研究成果相比,网络舆论领袖研究颇为匮乏。仅有的网络舆论领袖研究都从营销学角度探讨网络交易型社区舆论领袖在新产品采纳过程中的说服、示范作用,与国内的关注舆论引导存在极大不同;研究方法倾向于使用量化手段来测量舆论领袖,使用最多的方法为自我报告法,其次是社会计量法。
自我报告法即数据收集依赖受访者自己判断和回答。用自我报告法测量舆论领袖经常采用量表测量。量表由一组问题构成,用以间接测量人们在某一态度或观念上的状况。因此舆论领袖测量量表就是一组测量人们舆论领袖心理素质的问题,通过累加所有问题回答得分而得出舆论领袖指数。社会计量法(也称社会网络分析法)是一种调查人们社会关系特征和群体特征的测量方法。这些特征不同于个人特征,它们必须通过人们之间的交往或互动关系来反映。社会计量法的实施程序一般为:(1)根据调查内容设计一份简单的问卷,如询问: “你和谁来往最密切?”、“你认为谁最有威望?”等问题。(2)让被调查的群体中的每个成员都填写这份问卷。(3)将每个人编号,计算每个人被选择的次数及选择他人的次数。(4)根据统计数据绘制社会图(Sociogram)、社会矩阵(Socio matrix)或进行指数分析。社会图可以直观地了解人际交往的网络。指数可用来分析个人在群体中的地位、威望等,并能了解群体的凝聚力、组织管理、社会交往等方面的情况。社会计量法特别适用于小群体研究。
将传统自我报告法运用到网络舆论领袖研究的做法通常有三种:一为网下问卷调查人们上网时的情况;二为网上发布问卷;三为网上和网下调查相结合。问卷的测量题项沿用传统舆论领袖测量量表。研究思路大多根据舆论领袖指数将网上人群二分为舆论领袖及其跟随者,对比两类人群,描述舆论领袖的特征。例如,澳大利亚Barbara Lyons,Kenneth Henderson探讨舆论领袖对电子商务的推动作用研究中,采用传统舆论领袖的定义来定义网络舆论领袖,运用Childers量表(1986)测量舆论领袖指数[1],采取网下自填式问卷方式,将使用计算机中介交流技术的人群二分为舆论领袖及其跟随者,并考察两类人群使用电子商务的差异。研究发现:采用传统舆论领袖量表测量网络舆论领袖的信度较佳(α=0.74),可以成功将网络使用者二分为网络舆论领袖与跟随者;二者在产品知识、产品卷入度、产品采纳行为、网上投入时间、网上讨论存在显著不同(Barbara Lyons et al.,2005)。Youngju Sohn在有关韩国品牌数码产品虚拟社区研究中,舆论领袖测量采用Flynn et al.(1994)量表[2]。该研究运用网上问卷和电子邮件邮寄问卷调查124名网民,请他们填答浏览韩国数码相机品牌社区时的一些行为和心理。该研究将网民网上、网下心理和行为进行相关分析,发现网络舆论领袖在网上表现与现实生活中表现有所不同,网络舆论领袖在现实生活中并不是一呼百应的舆论领袖(Youngju Sohn,2005)。
同样,运用社会计量法测量网络舆论领袖也不过是把研究的场域从现实世界搬家到虚拟空间而已。在已有的运用社会计量法测量网络舆论领袖研究中,一般采用虚拟社区成员之间提名方式。例如Nancy Baym对一个肥皂剧新闻组虚拟社区研究中,要求社区成员在问卷调查中指出社区的舆论领袖。研究发现那些社区的“常客”、发帖多的社区成员很容易被其它社区成员以及社区边缘参与者(潜水者)认可为舆论领袖(Baym,2000:p.69—83)。日本学者I.Kaneko采用社会网络法来分析一个邮件组成员之间的交往关系。通过分析电子邮件回复形成的社会网结构来界定有影响力的邮件和人物,分析这些具有影响力的人物在社区危机管理中作用(I.Kaneko,1996)。
将传统舆论领袖测量方法移植到网络面临一些局限:使用社会计量法的前提是群体成员彼此之间了解、熟悉,因此该方法适用于凝聚力较强、规模较小的群体,不适合大范围调查研究。庞大、漂移和隐秘的网络社区用户之间缺乏足够了解和互动,因此社会计量法运用到网络传播存在困难。自我报告法最大问题在于回答的主观性;极有可能一些自认为是舆论领袖的人实际并不是舆论领袖,或者一些实际上是舆论领袖的人却没有被包含在舆论领袖群体中。因此某种程度上说,自我报告法更多测量的是人们自认为的舆论领袖心理,而不是真正的舆论领袖。同时,现有网络舆论领袖研究样本全是自愿样本或便利样本,研究结论的适用面大打折扣。
二、革新取向网络舆论领袖测量方法——数据挖掘
基于文本的计算机中介交流(Text-based CMC)与面对面交流的根本不同在于交流双方并不见面,很多时候也不知对方为何许人,通过文本交流进行沟通和发展友谊。 “线索消除论”(clues filtered out theory)认为CMC消除了很多面对面交流中的必要因素,比如面部表情、目光接触、肢体语言、语音语调; “社会环境线索缺乏假设”(1ack of social context clues)认为CMC缺乏语言以外的社会环境线索(如年龄、性别、教育程度、收入、职业等),而这些是确定交流者个人特征及社会地位的重要因素(Kieler,1984)。在社会线索缺乏的虚拟空间,人们不能根据社会线索来确定社会身份,只能根据交流文本来估计写作者的社会线索。Lea & Spear指出计算机中介交流缺乏对交流对象个人情况的了解会导致人们倍加关注语言信息中所透露的个性特征(Lea & Spear,1995)。因此基于文本交流的CMC研究的重点应该放到语言交流上。而革新取向测量舆论领袖的方法则是根据计算机中介交流(CMC)的特点而研发的新方法,通常需要借助新技术、新手段。2002年以来,国外网络舆论领袖研究的最新方法是数据挖掘。
数据挖掘是二十世纪80年代以后发展起来的新研究领域,在银行、证券、保险、电信、零售、交通、航空、石化、能源等领域得到广泛应用。随着计算机的普及和数据的大量积累,数据挖掘在电子商务、快速消费品行业甚至在社会科学研究领域如语言文字大显身手。
数据挖掘指从大量数据中抽取潜在的、有价值的知识(模型或规则)的过程,就好比从一堆矿石中寻找金子。数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。随着科技的发展,数据挖掘工作可以变得易于操作,就如同随着SPSS、SALS等大型统计分析软件的出现,社会科学的统计分析变得轻松有效一样。事实上,SPSS中的因子分析、聚类分析、回归分析都是数据挖掘技术。只不过数据挖掘与统计分析和分析报告相比, “分析报告给你后见之明(hindsight),统计分析给你先机(foresight),数据挖掘给你洞察力(insight)”(Berry and Linoff,1997)。分析报告为事后亡羊补牢之举;统计分析是对研究假设进行检验以发现事物发展规律;而数据挖掘则不需要研究者事先提出研究假设,通过挖掘现有数据,抽取规则,从而能预测趋势和行为,支持人们的决策。
清华大学经济管理系毛波、尤雯雯以BBS类型虚拟社区中知识共享型版面为主要研究对象,根据社区成员所发表文章对社区整体知识形成和共享过程的贡献,利用数据挖掘技术,对虚拟社区中所发表的文章进行定量分析总结,提出了知识共享型虚拟社区的成员分类模型,将社区的成员归纳为领袖、呼应者、浏览者、共享者和学习者等5种类型,提出每种类型成员的活动特点。其成员分类模型在BBS类型虚拟社区的交易型版面和其他版面中也得到了验证,为今后深入研究虚拟社区成员的行为模式提供了必要的基础(毛波、尤雯雯,2006:p.29)。
日本学者Naohiro Matsumura、Yukio Ohsawa、Mitsuru Ishizuka运用数据挖掘技术提出“影响力扩散模型”(IDM),从文本内容和交往网络两个方面来测量网络角色类型,筛选出舆论领袖。该模型基于以下2个前提假设: (1)、在基于文本计算机中介交流环境下,人们通过发回帖子来表达观点;论坛对话链(comment-chain)体现影响力的传递结构。 (2)、词语为组成帖子的基本单位,在基于文本计算机中介交流环境中,论坛交流通过词语来表达和传播。影响力定义为词语在对话链中传播的程度,计算为有回复关系的上下游帖子的词语交集与下游帖子词语数的比值。该方法采用先进的网络数据采集技术(Pearl)下载网络论坛的交谈内容;在保持交谈内容结构(讨论串结构)基础上,将文本自动切分为词语集合,通过程序智能比对上下游帖子词语,计算机根据算法自动给出论坛每个发帖人的影响力。
图1为一个对话链示意图。实线箭头表示帖子回复关系,虚线箭头表示影响力。
图1:IDM模型解释
在图1中,C1为主帖,C2、C3分别回复C1,C4则回复C2。C1帖包含A、B、C三个词语,C2包含A、C、D三个词语,C3包含B、F两个词语,C4包含C、F词语。C1、C2词语交集为A、C,因此帖子C1对C2影响力为2/3;C1与C3词语交集为B,C1对C3影响力为1/2;C1、C3、C4词语交集为C,C1对C4影响力为1/2×2/3。
帖子在论坛中的总影响力为帖子对论坛其他所有成员的影响力之和。发帖人的影响力等于其发帖影响力之和。作者用该模型分析了日本一些论坛和邮件列组,证明模型的解释力“出乎意料的大”(Naohiro Matsumura etal.,2002)。
三、启示
网络舆论领袖研究方法的“移植”和“创新”两个不同取向事实上存在于整个新媒体研究;传播科技的发展,特别是随着网络媒体的出现和迅猛发展,传统研究方法和范式已经遇到挑战。
国际传播学界很早就关注新媒体,如1996年国际传播学界权威学术刊物《传播学杂志》出版新媒体专辑,2000年《新闻学与大众传播季刊》的春、秋季两期刊登网络传播研究方法文章,提醒学者注意互联网对传统大众传播研究方法的影响,机遇与挑战共存(Guido and Stewart,2000;McMillan,2000)。
机遇主要来自于数据收集的便捷性。在数字化、网络化浪潮一浪高过一浪背景下,“新产生的信息差不多都是与生俱来就数字化、网络化的,一切许多有意义的资料信息也在被重新数字化而且迟早会网络化。这对于社会科学来说,预示着极大幅度提高数据采集效率的潜力。庞大的上网人群也给社会科学家进行从未有过的广泛且高效的调查提供了天然的基础”(李晓明、祝建华,2006:p.43)。大规模数据收集曾经是制约大众传播研究的昂贵瓶颈之一,而在线调查、在线内容分析等可以轻松实现数据收集工作;而且如果有合适的分析工具,数据的分析工作可以在收集的同时实现。
但互联网给传播研究者带来机遇同时,也带来挑战。挑战来自于:一、研究的信度和效度。二、网络传播衍生的新问题、新领域呼唤新方法。
信度和效度是评估研究质量的两个基本原则,网络研究也不例外。将传统舆论领袖测量方法移植到网络面临的主要问题就是抽样误差,即样本是否能够代表所有网民。由于目前无法建立完备的网民抽样框,目前的网民样本很多都是便利样本。以网上问卷为例,大多操作方法为网上挂问卷或电子邮寄问卷。若把问卷放在网站上,由访问者自愿填写,面临的问题是:能否吸引足够多的人填写问卷;填写问卷的人是否符合对调查对象的要求;是否有人多次填写同一问卷。用E-mail发送问卷,必须掌握足够多的邮件地址,并应按随机原则挑选调查对象,否则不具代表性。抽样框无法确定的调查中,拒答率也难以确定。只有在抽样框和入选概率已知(即概率抽样调查)的情况下,才可以进行对拒答误差的测量或者评价。
由于缺乏足够的抽样框,有些网络调查公司创建固定网络调查小组作为调查对象,这不失为一种可行的办法。但这个方法也存在一定的问题。首先是小组成员流失率高,一般每年有30%—40%的成员流失。其次是威胁效度的因素:随着网络调查小组成员受调查经验的积累,他们对问题的回答可能与初次接触问题的被调查者存在差异,从而导致测量误差。因此,将传统研究方法移植到互联网,需要解决概率抽样这个社会科学研究进行科学推论的前提。
其次,网络传播衍生的新问题、新领域呼唤新方法。随着社会信息化、网络化进程的进一步加快,大量的社会现实以“数据”的形式存在。面对海量数据,人们迫切需要一个“去伪存真,去粗取精”的分析工具,以帮助正确预测趋势,避免决策失误。数据挖掘则正是顺应现实的需要而开发出来的新型分析工具,在商业领域已经发挥了重大的作用。现在数据挖掘技术也同样可以在网络学术研究领域发挥重大作用。互联网作为一个与传统媒体不同的新媒体,提供许多崭新领域供研究者挖掘和探索,如网络内容(网页、论坛帖子、博客文章等)、网络结构(超链接和社会网链接)和网络使用(网站访问记录和客户端访问记录)互联网挖掘(Zhu,2006)。如前文介绍的清华大学经济管理采和日本东京大学工程系、图象序列研究所、信息管理系合作研究的“IDM”影响力扩散模型都是采用数据挖掘方法来分析网页数据的规律。可以预见数据挖掘将会成为社会科学工作者一项研究“利器”。
注释:
①Childers,T.L(t986)量表1你一般与你的朋友或邻居讨论________吗?2你与朋友或邻居讨论________时,请问你是较少还是较多提供信息?3.过去半年内,你和多少人讨论过________?4.你的朋友会向你询问有关_的新信息吗?5在讨论某个新产品________时,你是倾向于接受朋友的建议还是说服别人接受你的意见?6.讨论新产品________时,你经常告诉朋友们产品信息还是朋友告诉你产品的信息?7.总体而言,你经常/很少给别人提出建议。
②Flynn et al.(1994)量表1.我对________的意见与他人不一致。2.当别人挑选________时,较少向我询问信息。3.别人很少向我询问有关________意见。4.我周围的人根据我的意见决定是否购买________。5.我经常说服别人购买我喜欢的________。6.我经常影响别人对________的看法。