在线口碑沟通中舆论领袖识别方法研究_人工神经网络论文

在线口碑传播的意见领袖识别方法研究,本文主要内容关键词为:在线论文,领袖论文,口碑论文,意见论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:C931 文献标识码:A 文章编号:1003-207(2013)02-0185-08

修订日期:2012-05-17

1 引言

根据权威咨询公司麦肯锡的最新估计,美国业务的三分之二是靠口碑驱动的,口碑可信度高、针对性强,口碑传播已逐渐成为市场决定性的力量[1]。近年来,越来越多的消费者自发地在购物网站(如amazon.com,ebay.com,taobao.com,360buy.com等)、专业点评类网站(如dianping.com,epinion.com等)和拥有数以亿计用户的社交服务类网站(如facebook.com,twitter.com,weibo.com等)上以文本的形式,发布对产品、服务、品牌或企业的评价,统称为在线口碑。在线口碑是随着互联网的出现而产生的一种新的口碑类型[2],发表与传播在线口碑已成为目前网民的主流活动[3]。而藉由在线口碑产生了新型的网络意见领袖,他们通过在线口碑传播发挥影响力,克服了传统口碑只能在有限社会边界进行传播、容易随着时间和距离增长而迅速消失的约束[4],广泛而深远地影响着其他消费者的购买决策和企业的声誉、利润[5]。这些意见领袖是企业最有价值的客户[6],识别他们有着十分重要的意义,而如何准确识别面临着很大挑战。

以往这一领域的研究,学者们大都采用关键人物法、自我报告法和社会网络法[7]。关键人物访谈法要求在社会系统中的信息接收者回答哪些人可能是意见领袖。自我报告法通常采用测量人们的意见领袖心理素质量表进行调查。而近几年使用较多的社会网络法要求人们回答通过哪些人获得建议和他们倾向于向哪些人征求建议,根据这些信息建立社会网络并分析个人在群体中的地位以确定意见领袖。以上这些方法很多采用问卷调查的方式,会受到测量时间、地点或样本的限制。而在线口碑的发布没有时空限制,且由客户主动提供,相对于问卷调查的反馈样本信息,这些原始信息更为准确和真实,并且被计算机完整保存下来,方便获取。因此,可以考虑从直接对在线口碑进行加工处理的视角来识别谁是意见领袖。在此视角下,Li等[8]对英文领域的在线口碑进行了研究,通过参照Turney等人提出的英语情感词汇集,统计在线口碑中出现的情感词汇,采用点对互信息(PMI)估计所抽取情感词汇的语义倾向来计算情感值,结合在线口碑发布频率和最新发布时间,测评发布者的影响力。而中文领域,基于此视角的研究目前十分少见,在线口碑属于自然语言,由于中英文自然语言的表达方式、语言结构和词汇语法存在很大差别,加工处理方式也存在很大不同,针对英文的研究成果无法直接应用于中文领域。

本文正是在上述背景下,研究中文领域在线口碑传播的意见领袖识别方法。通过引入营销领域RFM模型,并对其进行扩展,结合中文在线口碑加工处理技术,采用情感词自动判别方法,重点考虑情感(S)这一新的指标,提出了RFMS模型来测量在线口碑发布者的影响力,应用人工神经网络识别出意见领袖,并采用国内专业点评类网站(大众点评网,dianping.com)的数据进行了验证。本文的主要目标是希望能够丰富中文在线口碑传播理论,同时给国内企业实际监控或管理在线口碑传播提供一种方法或框架。

2 理论基础

2.1 在线口碑传播

在线口碑传播是指消费者之间以网络为媒介进行的主动发布、主动搜索或被动阅读、被动接受同特定产品或服务相关的正面或负面评价的过程[9]。在线口碑传播极大影响着消费者的购买决策和企业的声誉与经营绩效。其中,在线口碑的极性和数量是关键因素。在线口碑极性包含正面和负面两种,正面的在线口碑有助于提升企业经营绩效,而负面的在线口碑,则会给企业带来负面影响。Mudambi等[10]采用结构方程建模进行了实证分析,研究表明,在线口碑中的情感词汇与客户的感知有用性存在明显的正相关关系。Sweeney等[11]研究了负面在线口碑对客户转换行为的影响,研究结果表明,负面在线口碑强度越强烈,越显著的影响客户的品牌转换行为,造成企业更多的客户流失。Dobele等[12]通过比较分析不同产品领域的口碑传播行为发现,在成功的在线口碑传播中,在线口碑中的情感比接受者的期望具有更大影响力,相比枯燥的描述而言,人们的购买决定通常更容易被在线口碑中带有主观色彩的情感词汇所影响。一般情况下,在线口碑数量越多,表明有越多的客户投入到企业产品或服务的评价之中,便越可能吸引到更多其他客户对该企业的注意[13]。Liu[14]选取了雅虎网站上20部电影的在线口碑作为语料,结果表明无论是正面的还是负面的在线口碑,在线口碑数量的增加都会带来电影票房收入的增加。Duan等[15]的实证研究得出了类似的结论,即某电影的在线口碑数量与该电影的票房收入正相关。Clemons[16]以啤酒生产商为研究主体,收集2年的历史在线口碑数据,分析表明啤酒销量与正面在线口碑正相关,当正面在线口碑越多的时候,当期的销售量越高。

结合以上研究,本文重点考虑在线口碑的极性和数量,并将其整合为1个指标,即在线口碑中的情感词数量,其中,情感词包含了所有正面或负面的极性词汇,而情感词数则反映了在线口碑数量。

2.2 RFM模型

RFM模型在营销领域广泛应用于分析客户响应和客户价值,其分析的基础是3个重要的客户行为指标,即近度(recency)、频度(frequency)和值度(monentary)。近度表示客户最后一次购买到当前的时间间隔,频度表示客户在一定时期内购买的次数,值度表示客户在一定时期内购买的总金额。

RFM分析基于如下的假设:(1)最近有过购买行为的客户再次购买的可能性要高于最近没有购买行为的客户;(2)购买频率较高的客户比购买频率较低的客户更有可能再次购买企业的产品(服务);(3)总的购买金额较高的客户再次购买的可能性较高并且是价值较高的客户。采用RFM分析方法,企业能通过客户过去的购买行为来发现潜在的有价值客户。很明显,那些最近有购买、经常购买和花更多钱购买的客户是企业重要的目标客户[17]。Yeh等[18]扩展了RFM模型,添加了从初次购买到当前的时间间隔和流失率两个指标来进行知识发现,利用概率论中的伯努利序列,预估客户下次购买的可能性和未来可能愿意支付的购买金额。Cheng和Chen[19]综合RFM模型和粗糙集理论中的K-均值算法,挖掘客户数据中的模式和趋势,分析客户的特性和对企业的忠诚度,辅助企业改善客户关系。

本文采用RFM模型,研究在线口碑发布者的R、F、M的测量,评估在线口碑发布者的价值,从而识别出其中的意见领袖。

2.3 人工神经网络

人工神经网络(artificial neural networks,ANN),是一种模仿生物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络特有的非线性适应性信息处理能力,特别适合解决多变量的复杂问题,已在决策支持领域得到成功应用。比如,Xiao等[20]应用粗糙神经网络来进行电力系统的短期负荷预测,Erilli等[21]建立了一个人工神经网络模型来解决聚类中的最佳聚类数目确定问题,Tsai和Wu[22]通过人工神经网络建模来进行破产预测和信誉评分,以帮助人们进行财务决策。本文的研究是应用ANN来建立一个合理可行的模型,以准确识别在线口碑传播中的意见领袖。

2.4 在线口碑的情感词自动判别方法

一般而言,情感语言是指人们用来表达自己的立场、态度和感情的语言,用户的情感倾向主要是通过情感语言来表达。实现情感分析的前提是有效识别文本中表达主观感情、态度和观点的内容,对文本中的情感词进行判断。

目前这一领域针对英文在线口碑的研究成果较多。Turney[23]提出一种识别英文情感词的方法,选择两个连续的词组成词对,其中一个词是形容词或副词,另一个词是上下文词汇,如果两个连续词的词性满足给定的5种模式中的任何一种,都将被抽取,被抽取出来的词对便为情感词。Vechtomova[24]建立了一种检索博客中情感语言的模型,通过应用英文情感单词和词组的词典,采取交叉熵来判别博客中是否存在查询词的相关情感词汇。Ril和Wiebe[25]针对英文主观性形容词、名词、动词和短语的自动识别问题,提出一种不需要人工标注自动提取情感词的方法,给定主观特征,通过建立主观分类器来自动获取大量情感词,进而以查准率和查全率均很高的词语搭配来更新最初的主观特征,周而复始,最终获得的主观分类器的查准率为90.2%,查全率为40.1%。

针对中文在线口碑,国内有少数学者开始关注其情感词自动判别方法。Li和Wu[26]提出了一种自动分析文本主观情感并计算每一段文字价值的算法,通过对新浪体育论坛的实证研究表明,使用该算法较K-means聚类算法能得到更好的效果。叶强等[27]提出了一种根据连续双词词类组合模式(2-POS)自动判断句子主观性程度的方法,通过对新华网论坛主观性文本的实验分析,当采用提出的20个2-POS模式的分类器对情感句进行判断时,查准率和查全率都达到了76%左右,接近英文同类研究的结果。由于中英文语言存在很大差异,英文评论情感词的判别方法无法直接应用到中文领域,因而,本文采用叶强等提出的方法,来进行中文在线口碑的情感词自动判别。

3 方法

本文提出了集成RFM模型、中文情感词自动识别技术与人工神经网络来识别在线口碑中的意见领袖的方法,如图1所示。

在图1中,对每个发布者的在线口碑,进行RFM测量,通过分词与词性标注后,进行S测量;对每个发布者的好友数和粉丝数进行统计,进行程度中心性(degree centrality,DC)测量。接着,应用人工神经网络,获取R、F、M与S四个指标的权重,进而计算在线口碑发布者的影响力得分与排名。最后,通过将在线口碑发布者的影响力排名与DC排名进行对比,评估以RFMS模型来测量影响力的有效性。如有效,则实现意见领袖识别。以下将从RFM测量、S测量、DC测量和人工神经网络排名机制等4部分具体进行阐述。

图1 意见领袖识别方法

3.1 RFM测量

与以往研究将RFM分析方法应用于计算客户价值相类似,这里是用来测量在线口碑发布者的价值,但由于具体应用领域的差异,对传统RFM模型中的3个指标的含义进行修正。

(1)近度(recency)

(3)值度(monentary)

在线口碑能对其他人的购买行为产生重要影响,但很难准确统计在线口碑影响其他人购买的金额。实际上,许多网站在允许客户提供在线口碑的同时,也允许其他客户对在线口碑进行有用性判断,如,在每条在线口碑之后,Amazon.com会问“这条评论对你有用吗?”。Amazon.com在在线口碑旁会显示其他人的反馈信息:“63人中有26人认为评论有用”,并且最有用的信息会在产品信息页面的突出位置显示。客户投票认为在线口碑有用,意味着这条在线口碑促使或帮助客户做出了购买决定。在线口碑有用性能视为客户购买决策过程中对在线口碑的感知价值的反映[10]。因而,将认为在线口碑有用的客户数量来反映在线口碑的价值是合理、可行的。因此,本文采用值度来测量发布者在一段特定时间范围内发表的所有在线口碑获得的认可有用的总数量。如发布者

表示所有发布者值度的最小值。

3.2 情感S(sentiment)测量

本文采用C#语言和SQL Server 2005构造系统测量S值。进行S测量,首先需要对在线口碑进行分词和词性标注。已有学者将中国科学院计算机所软件室编写的中文分词工具ICTCLAS(institute of computing technology,Chinese lexical analysis system),应用到评论分词和词性标注,并取得了不错的结果[28]。本文选取该工具,在C#环境下,对在线口碑文本语料进行分词和1级词性标注,保存在SQL Server 2005数据库中。采用叶强等提出的一种根据连续双词词类组合模式(2-POS)自动判断中文在线口碑情感词的方法。其情感词类组合模式如表1所示。

3.3 程度中心性DC(degree centrality)测量

中心性常被用来衡量网络中的个体在网络中的实际权威和影响力,又进一步包含程度中心性、接近中心性和中介中心性,其中,又以程度中心性测评谁是团体中的重要人物最为有效[29]。在网络中,程度中心性可以很好的识别影响力大的权威节点[30]。程度中心性与在线口碑发布者的影响力有着密切的联系,拥有很高的程度中心性的人,可能会是领袖或者聚合者,在团队中拥有一个主要地位。

本文采用程度中心性作为评价指标来衡量RFM与S相结合的方法识别意见领袖的有效性。如果通过RFMS测量识别出来的具有较高影响力的在线口碑发布者,同时程度中心性的值也较高,这说明采用RFMS进行识别的结果与采用程度中心性方法得到的结果是趋同的,意味着本文提出的方法是合理的。此外,如进一步将该方法与网站现有方法进行比较,如果结果更好,则能证明该方法更为有效。

目前,许多网站推出了社区服务,以加强网站会员之间彼此的联系。大众点评网提供了好友和粉丝功能,如果两个会员是好友,则表示两个会员彼此之间有双向联系,a和b相互影响。如果会员b是会员a的粉丝,则表示存在从会员b到a的单向联系,a影响b。因而,可以通过统计a的所有好友数和粉丝数,来表示a的DC值。这里需要特别说明的是,更精确的计算DC值,需要进一步考虑好友的好友数和粉丝数,以及好友的好友的好友数和粉丝数,这会带来巨大的计算量,本文只计算了会员的好友数和粉丝数,因而DC值存在一定误差,但考虑到情感词识别方法以及分词工具存在的误差,DC值的计算误差是可以容许的。

3.4 人工神经网络排名机制

采用人工神经网络,可通过机器学习方法来测度在线口碑发布者的总的影响力得分,其中包括近度R、频度F、值度M和情感词S。R、F、M与S之间的关系十分复杂,4个指标涉及到不确定性的个人行为、情感和态度,这种现实世界中的错综复杂关系难以用线性或者静态的权重来准确描述。人工神经网络适合解决这种多指标的复杂问题,这些不确定性的个人行为、情感和态度能通过大量的数据训练和模拟来逐渐明晰。因而,本文将在线口碑发布者的4个指标的所有得分作为人工神经网络的输入,在线口碑的DC值作为人工神经网络的输出,进行权重自适应调整,人工神经网络的自适应加权机制能为4个指标分配合适的权重。确定权重后,进而计算不同在线口碑发布者的影响力总得分,进行发布者影响力排名。

4 实验

4.1 语料数据

本文所使用的语料数据来源于大众点评网。大众点评网是一家典型的第三方消费指南网站,成立于2003年,主要为大众提供美食及其他城市消费方面的第三方评论平台,是国内最流行的web2.0网站之一。大众点评网对部分大城市推出食神榜排行服务,美食主题发帖总数进入当地前300名的会员列入当地美食榜榜单。已有学者根据大众点评网上的评论数据做相关研究[4],网站数据的稳定性和可靠性是能被认可的。

数据的取样过程如下:首先获取了上海市美食榜300名会员的注册时间,从中选取了注册时间段最为集中的63名会员,均为2005年注册。由于早注册的会员可能比晚注册的会员更有机会发表更多的在线口碑,因而,所挑选的会员注册时间差越小,越能减少注册时间不一样对发帖数带来的影响。但同时为了保证样本量的规模,我们最终挑选出了63名会员,注册时间都超过5年,注册的最大时间差不超过1年。接着获取了这63名会员的43656条评论,包括最新发表在线口碑的时间、鲜花数以及每条在线口碑的具体内容,同时获取了63名会员各自的好友数和粉丝数。

4.2 模型建立

本文采用3层前馈人工神经网络来测量在线口碑发布者的影响力得分,实验使用的是MATLAB2007的神经网络工具。具体的训练指标如表2所示。所有的网络类型均为前馈反向传播,网络由输入层、隐含层和输出层组成。输入层有R、F、M与S等4个变量,因而节点数为4,输出层只有影响力得分的预测值,因而节点数为1,而隐含层节点数的选择则是一个复杂的问题,目前尚无很好的解决办法。本文参考经验公式>n,其中x表示隐含层节点数,n表示样本数。采用“凑试”方法,对满足公式要求的隐含层节点数,从小到大依次进行训练,如果训练次数很大,或在给定训练次数内不能收敛,即停止训练,选取新的节点数重新训练。本文先后训练的隐含层节点数依次从7个到40个,先后凑试34次,当训练节点数为22时,训练误差和训练步数均达到最小,如图2所示。故而,选择的人工神经网络模型结构为4×22×1。

本文将63名会员中的53名会员作为训练样本,10名会员作为检验样本。53名会员的R、F、M与S值作为人工神经网络的输入,53名会员的DC值作为人工神经网络的输出,得到的输入层到隐含层的权值以及隐含层到输出层的权值分别见表3和表4所示。

4.3 实验结果

在得到训练好的人工神经网络模型后,通过输入检验样本来预测10名发布者的影响力大小,进而进行影响力排行。10名在线口碑发布者的R、F、M与S的原始数据表如表5所示。

对10名在线口碑发布者的R、F、M与S的原始数据进行归一化处理后的数据如表6所示。

将R、F、M与S的归一化值输入到训练好后的人工神经网络模型进行处理,得到影响力的预测值,进而得到根据RFMS计算影响力而得出的影响力排名。大众点评网的食神榜有两种排名方式,按照会员的发帖数排名、按照会员所获得的鲜花数排名。将根据RFMS方法计算的排名与大众点评网的两种排名方法进行对比,如表7所示。

在表7中,MAPE表示平均绝对百分误差,用于衡量预测误差,用公式表示如下:

5 结语

本文提出了一种以RFMS模型进行在线口碑传播的意见领袖识别方法。数据实验的结果证明,本文所提出的方法是有效的,比大众点评网现有的方法更为准确合理,而其主要原因是本文提出的识别方法包含了4个影响在线口碑发布者影响力的关键因素,此外,人工神经网络模型通过大量的训练能更加逼近于真实情况。本文的研究成果进一步丰富了在线口碑传播理论,同时为企业实际监控和管理在线口碑提供了切实可行的思路和方法。

然而,本文所做的研究也存在一定不足。首先,本文将发布者的直接好友数、粉丝数作为DC值,并未进一步考虑发布者好友的好友数、粉丝数,这可能也会影响DC值的准确性,存在误差。其次,发布者从发布在线口碑到拥有好友和粉丝,之间存在时间差,计算连续时间单位(比如月)在线口碑的情感值,以及R、F和M值,如果能获取各个连续时间单位对应的DC值,则可训练出ANN模型系数,预测下个时间单位发布者的影响力,进而实现事前预测出意见领袖。即通过在线口碑加工,不仅可以识别当前意见领袖,而且可能做到提前预测未来意见领袖,但限于连续时间单位数据获取的难度,本文没有进一步深入研究预测效果。最后,本文采用的情感词自动判别方法虽然查准率和查全率都已达到了76%左右,但毫无疑问依然存在误差,这会对情感词的统计结果和最终排名造成影响。以上这些都是未来值得考虑的问题,将是后续进一步深入研究的方向。

标签:;  ;  ;  ;  

在线口碑沟通中舆论领袖识别方法研究_人工神经网络论文
下载Doc文档

猜你喜欢