基于情感分析和证据理论的多属性在线评论决策方法论文

基于情感分析和证据理论的多属性在线评论决策方法

尤天慧, 张瑾, 樊治平

(东北大学工商管理学院,辽宁沈阳110167

【摘要】近年来,大量的有关产品或服务的在线评论信息在众多网站涌现,如何基于在线评论进行决策分析是一个值得关注的研究问题。提出了一种基于情感分析和证据理论的多属性在线评论决策方法,在该方法中,首先针对决策者关注的备选方案及属性采集相应的在线评论;然后针对采集的多属性在线评论进行情感分析并得到在线评论针对各属性在不同情感强度等级上出现的频次;进一步,依据证据理论,将在线评论在不同情感强度等级上出现的频次转化为针对不同情感强度等级的信任度,并依据证据合成规则将备选方案各属性的信任度集结为综合信任度;在此基础上,通过计算所有备选方案的效用值,进而得到方案的排序结果用于决策者购买决策;最后,以基于汽车之家网站的在线评论信息进行汽车购买决策为例说明了该方法的可行性和有效性。

关键词：多属性在线评论决策;情感分析;证据理论;方案排序

近年来,随着互联网和电子商务的迅猛发展,在众多网站涌现大量的消费者关于产品或服务的在线评论^[1],如亚马逊、汽车之家等网站。研究表明^[2-3],在线评论对于广大消费者了解产品或服务并做出购买决策具有重要作用。需要指出的是,如何依据大量的在线评论支持决策者(如消费者)进行决策分析(如产品购买决策),这是一个需要解决的决策问题。由于方案(如产品或服务)针对属性的在线评论通常为文本数据形式,故基于文本信息的多属性决策问题与传统的基于清晰数^[4]、区间数^[5]、模糊数或语言评价短语^[6]等信息形式的多属性决策问题有着明显的区别。因此,研究多属性在线评论决策方法具有重要意义。

目前,关于多属性在线评论决策方法的研究还不多见,但可以看到一些相关的研究成果^[7-14]。Peng等^[7]通过分析产品的在线评论从中提取产品特征词并统计特征词出现频率来确定产品特征权重,再依据专家给出的产品关于特征的模糊决策矩阵,使用模糊PROMETHEE法对竞争产品进行排序。Kang等^[8]通过分析移动服务的在线评论从中提取名词短语,并由专家基于名词短语确定评价移动服务的特征(属性)词典,提取评论中的动词短语、形容词短语和副词短语构建情感词典,并将情感词依据情感强度划分为5个强度等级,每个等级赋不同的值;基于特征(属性)词在评论中出现的频次确定属性权重,并通过计算移动服务各属性情感词得分确定基于情感词得分的评价矩阵;进一步,依据权重和评价矩阵,利用VIKOR方法对备选移动服务客户满意度进行排序。Chen等^[9]利用主题建模方法从产品在线评论中提取并确定正向评论和负向评论的产品属性及属性初始权重矩阵,并利用WVAP方法获得最终产品正向评论和负向评论的属性权重矩阵,应用MDS方法绘制可视化产品市场结构图。进一步,利用TOPSIS方法对可视化产品市场结构中竞争产品进行排序。Zhang等^[10]通过将在线评论拆分为句子并标记词语判断产品在线评论语句的情感极性,依据产品评论的情感极性建立有向加权特征图确定产品排序。Zhang等^[11]通过分析产品在线报告建立产品特征集以及标注各产品特征在线评论的情感极性(正向或负向),并依据产品评论的情感极性建立有向加权特征图确定产品排序;在此基础上,Zhang等^[12]通过引入评论帮助性投票和评论发布日期等信息确定在线评论的重要性权重进而对文献[11]中的方法进行了扩展。Najmi等^[13]依据产品在线评论及产品说明书选择并确定产品特征(属性),并依据用户的优先级确定产品属性权重;采用改进Page-Rank排序算法对产品品牌排序,利用支持向量机对产品评论进行有用性分析并利用有用性分析计算结果对产品在线评论进行排序;在此基础上,根据产品品牌排序结果以及产品在线评论排序结果对产品进行排序。Wang等^[14]通过情感分析提取在线评论中产品特征-意见对,将特征-意见对作为变量构建反映在线评论和消费意向的计量经济学模型,并基于该模型确定基于在线评论的产品特征(属性)排序。上述方法的提出为解决多属性在线评论决策问题提供了较好的思路和支撑。但需要指出的是,已有的关于利用在线评论对方案(产品或服务)进行排序的方法所考虑的在线评论均是针对方案(产品或服务)的整体给出的,并没有考虑在线评论是针对方案(产品或服务)特征(属性)给出的情形。另外,已有方法较少考虑在线评论信息中评论情感词的强度(大多只分为正向情感和负向情感^[7,9-13]),即使一些方法考虑了情感词强度^[8]也是通过给各档情感词赋不同值计算各方案关于特征(属性)情感得分评价矩阵,这样处理不能体现在线评论信息在各情感强度上的评价结果,虽然文献[14]中给出了基于情感强度分析的产品特征(属性)排序,但没有给出综合产品各特征(属性)情感的总体排序。

城市动物园自身的发展一直受到资金和发展空间的制约，而立足自身的深度开发和多元化发展是实现其可持续发展的两条路径。南宁动物园在实现立足自身主业满足顾客需求的同时，通过多元化发展基本解决了自身可持续发展的问题。但更多的城市动物园的可持续发展依然面临着在立足自身公益性深度开发和多元化发展上的权衡。

基于此,本文给出一种基于情感分析和证据理论的多属性在线评论决策方法。在该方法中,首先从备选方案(产品或服务)各属性的在线评论信息中提取评论的情感词,通过情感分析确定评价各属性的情感强度等级词典,并依据属性情感强度等级词典,识别属性各条在线评论信息归属的情感强度等级或不确定性情感等级,并统计属性被评论为各情感强度等级的频次,进一步给出基于证据理论的决策方法。

1 问题描述

考虑多属性在线评论决策问题,该决策问题中所涉及的集和量如下：

A= {A ₁,A ₂,…,A_m }——决策者关注的m 个备选方案的集合,其中A_i 为决策者关注的第i 个备选方案,i= 1,2,…,m 。

城市轨道控制网的控制点成对布设在隧道壁两侧，相邻控制点横向间距与隧道的内径有关，地铁线路一般曲线段较多且曲线半径较小，自由测站观测控制点时，观测视线受到地铁隧道壁的遮挡影响，在曲线段主要是受接近曲线圆心一侧的隧道壁遮挡，因此地铁轨道控制网的测站观测控制点的数目和相邻控制点的纵向间距受到地铁隧道内测站的通视距离的限制[1]。

C= {C ₁,C ₂,…,C_n }——决策者关注的n 个属性的集合,其中C_j 为决策者关注的第j 个属性,j= 1,2,…,n 。

w= (w ₁,w ₂,…,w_n )—— 决策者关注的属性的权重向量,其中w_j 为属性C_j 的权重或重要程度,满足w_j ≥0且,j= 1,2,…,n ,属性权重向量由决策者给出。

式中,且。

本文要解决的问题是依据备选方案(产品或服R_ij= ——方案A_i 关于属性务)的在线评论和属性权重w= (w ₁,w ₂,…,w_n ),如何从备选方案集A= {A ₁,A ₂,…,A_m }中选择最佳方案或对备选方案进行排序。C_j 的在线评论的集合,其中R^g_ij 为第g 个用户给出的方案A_i 关于属性C_j 的在线评论,i= 1,2,…,m ;j= 1,2,…,n ;g= 1,2,…,G_ij 。

2 决策方法

本文给出的决策分析方法的基本思路：首先,采集备选方案关于各属性的在线评论,提取各属性在线评论中的情感词;然后,预定义各属性评论的情感强度等级参照词集,将提取的情感词与情感强度等级参照词集比对进行同义词归类来构建属性评论的情感强度等级词典,依据构建的属性评论的情感强度等级词典,识别每条在线评论归属的情感强度等级,统计属性在各情感强度等级下的评论频次;进一步,依据证据理论,将各情感强度等级下的评论频次转化为关于评论方案的情感强度等级的信任度,并基于证据合成规则计算各备选方案关于评论方案的各情感强度等级的综合信任度;在此基础上,通过计算所有备选方案的效用值来确定备选方案排序或优选方案。

2.1 在线评论的采集与预处理

利用爬虫软件从相关网站采集备选方案(产品或服务)关于各属性的在线评论。对采集的在线评论进行预处理,主要包括删除停用词、分词及词性标注两个部分。首先,利用人工收集整理的中文停用词表(无实在意义的词语,如“在”“的”“了”等)对在线评论中的停用词进行过滤并删除。例如,关于汽车属性油耗的在线评论“油耗低,个人的感觉已经是很省油了”,删除停用词“的”“了”后,该条在线评论变为“油耗低,个人感觉已经是很省油”。然后,采用NLPIR汉语分词系统^[15]作为辅助工具对删除停用词后的在线评论进行分词、词性标注等处理,例如,“油耗/n低/a,个/q人/n感觉/n已经/d是/v很/d省/v油/n”。从完成分词和词性标注后的在线评论中,依据文献[16]中给出的准则提取形容词(如低)、否定-形容词和程度副词-形容词(如很省油)作为构建各属性情感强度等级词典的情感词。

2.2 属性评论情感强度等级词典的构建

首先,基于各属性的特点预定义各属性评论的情感强度等级参照词集;然后,将从各属性在线评论中提取的情感词与预定义的属性评论情感强度等级参照词比对,依据同义词合并的规则,确定提取的情感词的归属等级进而建立各属性评论情感强度等级词典。具体构建过程：

浮盘密封材质(皮囊等)的抗腐蚀性、耐温性、耐油性、抗老化性能够与储存介质相符，密封部位所配弹性元件能够经得住油气或水汽腐蚀，弹性伸缩良好，这在浮盘安装前必须进行认真核验，确保材质符合长周期运行。在储罐定期检查、检验时一并进行必要的查验，发现问题及时予以处理。

记是由决策者预先定义由v 个奇数情感强度等级构成的评论属性C_j 的有序情感强度参照词集合,其中,L^r_j 为评论属性C_j 的第r 个情感强度等级参照词,j= 1,2,…,n ,r= 1,2,…,v 。记表示负向有序情感强度等级参照词集合,表示中性

表示正向情感强度等级参照词集合。例如,决策者关注的轿车第4个属性C ₄为性价比(j= 4),决策者预定义的由5个情感强度等级构成的有序情感强度参照词集合

其中：

记为从所有备选方案关于属性C_j 的在线评论中提取的情感词集合,其中,为评论属性C_j 的第s 个情感词,s= 1,2,…,q_j ,q_j 为从属性C_j 的在线评论中提取的情感词个数。对于任意一个情感词,依据其表达的情感强度与预先定义的情感强度等级参照词集}中情感词进行比对并归入相应的情感强度等级中。在对情感词进行情感强度等级归档时,可依据《同义词词林(扩展版)》^[17]中的同义词词群和How Net^[18]包含的评价词语集、情感词语集和程度副词词集,将情感词W^s_j 与预先定义的情感强度等级参照词进行比对,依据同义词归并的规则确定情感词W^s_j 归属的情感强度等级。这里需要指出的是,如果针对特定领域提取的情感词无法通过与文献[17-18]中同义词比对方法识别其情感强度等级时,可通过人工识别方法将该类词语归入相应的情情感强度等级参照词,感强度等级中。

记为将情感词集合中的情感词进行情感强度等级归档后建立的评论属性C_j 的情感强度等级词典,其中,表示情感词集W_j 中归属于情感强度等级的情感词集合,

记表示情感强度等级词典D_j 中负向情感强度等级的情感词集合,表示中性情感强度等级的情感词集合,

表示正向情感强度等级的情感词集合。

首先,依据方案A_i 关于属性C_j 的在线评论中情感强度等级L^r_j 的评论频次t^r_ij 和不确定情感强度等级的评论频次,计算方案A_i 关于属性C_j 的在线评论在情感强度等级、不确定情感强度等级的概率分别为：

2.3 在线评论的情感强度等级识别

(2)构建评论各属性的情感强度等级词典D_j ;

记为方案A_i 关于属性C_j 的在线评论中含有的情感词集合,其中：为方案A_i 关于属性C_j 的在线评论中含有情感词的个数;为第g 条在线评论中包含第ψ 个情感词,ψ= 1,2,…,。在线评论的情感强度等级识别过程：

记在线评论的负向情感强度等级指示向量,其中为方案A_i 关于属性C_j 的第g 条在线评论归属于情感强度等级为r 的指示值,依据准则①,指示值的确定公式为

的交集指示向量

其中,为方案A_i 关于属性C_j 的第g 条在线评论与第k 个非负情感强度等级的交集标注值,计算公式为

记在线评论的非负向情感强度等级指示向量,其中,为方案A_i 关于属性C_j 的第g 条在线评论归属于情感强度等级为r 的指示值,依据准则①,指示值的确定公式为

(2)识别并确定在线评论的负向情感强度等级。记在线评论的情感词集合与情感词典D_j 中负向情感词典的交集指示向量,其中为方案A_i 关于属性C_j 的第g 条在线评论与第k 个情感强度等级的交集标注值,计算公式为

(1)识别并确定在线评论的非负向情感强度等级。记在线评论的情感词集合与情感强度等级词典D_j 中非负向情感强度等级词典

(3)确定方案A_i 关于属性C_j 的在线评论情感强度等级指示矩阵。基于(1)、(2),记为在线评论情感强度等级指示向量,且,则方案A_i 关于属性C_j 的在线评论情感强度等级指示矩阵为。

(4)判断在线评论是否为情感不确定。若在线评论不含情感词或与属性情感强度等级词典D_j 中非负向情感强度等级词集和负向情感强度等级词集均有交集,则依据准则②,该条在线评论归入情感不确定等级集合中,记为不确定情感强度等级列指示向量,其中指示值确定公式为

(5)计算方案A_i 关于属性C_j 的在线评论情感强度等级的评论频次。记为方案A_i 关于属性C_j 的第g 条在线评论的情感强度等级为时的隶属度,其判断公式为

将情感强度等级指示矩阵中第r 列求和,得到方案A_i 关于属性C_j 的G_ij 条在线评论中情感强度等级的评论频次为

易非在想，妈到底是真糊涂还是装糊涂？她不能这么坑她吧？可房价飞涨，她是知道的啊！特别是风城，以前大城市房价疯涨的时候，没怎么动，大城市停歇了，它反而一直不停往上蹭。她买菜时也接到过几张宣传单，回来后，她坐在沙发上戴着老花镜研究了半天，然后叹息一声，说：要是在你买房时买了就好了！这……这这……

依据式(7)、(8)可得各情感强度等级的评论频次,记集合,其中,为针对方案A_i 关于属性C_j 的在线评论情感强度等级的评论频次。

2.4 基于证据理论的情感强度等级信息融合方法

由于一些在线评论的发布者对所评论方案(产品或服务)认识的局限性,其发表的关于方案(产品或服务)属性的评论可能没有表达出其情感倾向,或其发表的评论既包含正向情感倾向又包含负向情感倾向,这类评论并没有真实反映其情感倾向,具有不确定性。为了更好地处理这类既包含确定情感倾向又包含不确定情感倾向信息的多属性在线评论决策问题,本文给出一种基于证据理论的信息融合方法。证据理论是Shafer在Dempster合成法则的基础上提出的,它能够处理不知道和不确定信息^[19]。基于证据理论的情感强度等级信息融合方法的具体过程：

设L= {L ¹,L ²,…,L^v }为评论备选方案(产品或服务)的情感强度等级集合,其中,L^r 表示第r 个情感强度等级,r 越大,情感强度等级越高。将评论方案的情感强度等级集合L= {L ¹,L ²,…,L^v }视为识别框,将属性集合C= {C ₁,C ₂,…,C_n }视作证据集。

开裂事件后对行走齿轮热处理工艺进行调查，其采用渗碳后降温淬火路线，行走齿轮工艺硬化层深3.0～3.5mm，渗碳温度940℃，强渗碳势1.10%，扩散碳势0.72%，渗碳后降温到820℃均温后淬火，油温60℃，在油槽冷却时间为0.5h，回火工艺为160℃保温4h。

G_ij ——参与方案A_i 关于属性C_j 的在线评论的用户数,i= 1,2,…,m ;j= 1,2,…,n 。

然后,依据证据理论,将方案A_i 第j 个属性的在线评论关于识别框L 情感强度等级为L^r 的概率、不确定情感强度等级L^u 的概率可用分布形式分别表示为：

目前，国内外所比较常用的对石油产品的低温性能指标进行检测的方法有两种：（1）直接检测方法；（2）间接检测方法[1]。但是，直接检测方法的检测结果准确性和一致性较差，仪器的自动化程度较低；而间接检测方法需要建立大量数据库和模型库，不便于形成独立的仪器。因此，结合电学阻抗技术所具有的简单适用，方便快捷的优点，本文通过采用电学阻抗技术建立一种快速的石油产品低温性能指标检测方法。

式中,分别为方案A_i 相对于第j 个证据在情感强度等级L^r 、不确定情感强度等级L^u 的信任度,有,且。

不仅如此，今年，葡萄酒大师David Allen再度担纲金樽奖评审团主席，在颁奖典礼晚宴的致辞中，他提到了震惊业界的侍酒师大师考试泄题的丑闻，并公开为包括我们评审团副主席在内的侍酒师大师站台，表示他们并没有被牵连其中……刚开始，我还不太明白他在致辞中提及此事的用意，直到他在台上娓娓叙述这一刻的时候，我突然明白：正是他们如此珍视这一份“大师”的名誉，才有了这么多业界的牛人在孜孜以求这一个头衔。

进一步,构建方案A_i 关于属性C_j 的在线评论在情感强度等级L^r 、不确定情感强度等级L^u 上的信任度分配函数分别为：

记为方案A_i 关于属性C_j 的在线评论情感强度等级为不确定的评论频次,其计算公式为

通过对数据结构间的关联关系分析可以发现流感病毒序列数据主要由核酸、蛋白质和CDS（编码区）三个实体组成。由于一个核酸序列可能被翻译成多条蛋白质序列，所以核酸和蛋白质的关系是一对多的关系，而蛋白质和CDS则是一一对应关系。

之后,将方案A_i 针对多个证据的不同情感强度等级的信任度分配函数进行集结。记C_J (j )= {C ₁,C ₂,…,C_n }为前j (j= 1,2,…,n- 1)个证据的集合,为C_J ₍_j ₎中所有证据支持方案A_i 被评为情感强度等级L^r 的信任度分配函数,为不确定情感强度等级的信任度分配函数,则和可以通过对前j 个证据的信任度分配函数进行合成得到,具体计算公式为：

式中,K_i _,_J ₍_j+ ₁₎为归一化因子,反映了各证据间相互冲突的程度,即各属性不同时支持方案A_i 被评价为某一情感强度等级的程度。特别地,有

因此,对n 个证据下的情感强度等级信任度分配函数进行集结,可得方案A_i 关于各情感强度等级的综合信任度为

式中,表示方案A_i 被评为不确定情感强度等级的信任度。

2.5 基于效用值的方案优选(排序)方法

基于方案A_i 关于各属性情感强度等级的综合信任度,可对备选方案进行排序。首先,需要对v 个情感强度等级的效用进行评估。依据文献[20- 21],本文假设v 个情感强度等级的效用服从等距分布,记情感强度等级L^r 的效用为

式中,U (L ¹)= 0,U (L^v )= 1,且对所有评价等级的效用有U (L ¹)＜U (L ²)＜…＜U (L^v )。这里需要说明的是,关于情感强度等级的效用评估,可以认为各情感强度等级服从等距分布^[20-21],也可以依据决策者的偏好信息进行估计^[22]。

然后,依据U (L^r )和β^r_i 计算方案A_i 的总效用值为强度等级上的信任度分配函数;

显然,U (A_i )越大,方案A_i 越好。因此,依据U (A_i )值的大小,可以选择最优方案或对所有备选方案进行排序。

综上所述,基于情感分析和证据理论的多属性在线评论决策方法的计算步骤如下：

(1)采集方案A_i 各属性的在线评论,从各属性的在线评论中提取情感词;

考虑在线评论的特点：如某条在线评论不含情感词;某条在线评论既含有正向情感词又含有负向情感词;某个情感词在一条在线评论中多次出现或某个情感强度等级出现不同词语的情感词;某条在线评论含有正向或负向多个等级的情感词。本文在识别各条在线评论情感强度等级时遵循如下规则：①若某条在线评论含有正向多个等级的情感词,则将该条在线评论归入正向最高等级的情感强度集合中;若某条在线评论含有负向多个等级的情感词,则将该条在线评论归入负向最低等级的情感强度集合中。②若某条在线评论不含情感词或某条在线评论既含有非负向情感词又含有负向情感词,则将该条在线评论归入情感不确定集合中。

(3)依据属性情感强度等级词典D_j ,利用式(1)～ (6)识别方案A_i 各属性的每条在线评论归属的情感强度等级,并运用式(7)、(8)计算不同情感强度等级的评论频次;

(4)运用式(9)、(10)将方案A_i 各属性在不同情感强度等级的评论频次转化为不同情感强度等级的信任度;

(5)运用式(11)构建方案A_i 各属性不同情感

(6)运用式(12)针对不同属性的各情感强度等级的信任度分配函数进行合成;

(7)运用式(13)计算每个方案关于各情感强度等级的综合信任度;

(8)运用式(14)、(15)计算每个方案的总效用值U (A_i ),并依据U (A_i )值的大小对方案进行优选或对所有备选方案进行排序。

交叉分析①由于交叉分析的表格数据占用过多的版面，因此以下分析中删掉了有关的表格内容。发现：年度游览为1次的消费，主要通过熟人介绍获得信息；而年度游览次数2次以上的游客，主要是通过网络获取信息。小长假期间，旅游宣传册是游客获取信息的主要渠道；黄金周期间，熟人介绍则是游客获取信息的主要渠道。游览目的则不影响游客的信息获取渠道。

3 实例分析

为说明本文给出方法的可行性,下面考虑一个轿车购买的决策问题。假设某潜在消费者欲购置一辆价格在15～20万元的轿车,其关注的4款轿车分别是别克君威(A ₁)、本田雅阁(A ₂)、起亚K5(A ₃)和雪佛兰迈锐宝(A ₄),较为关注轿车的4个属性分别为动力(C ₁)、油耗(C ₂)、舒适性(C ₃)和性价比(C ₄)。该潜在消费者给出的属性权重向量w =(0.2,0.35,0.15,0.3)。为了辅助该潜在消费者购买决策,下面运用本文提出的决策方法给出部分计算过程与结果。

首先,利用爬虫软件(火车头采集器)从汽车之家(www.autohome.com.cn)网站采集潜在消费者关注的4款备选轿车关于4个属性的在线评论,采集得到的在线评论信息示例如表1所示,4款备选轿车关于4个属性的在线评论用户数如表2所示。对采集的在线评论中的停用词进行删除,并采用NLPIR汉语分词系统对删除停用词后的在线评论进行分词、词性标注。从完成分词和词性标注后的在线评论中,提取各属性评论的情感词(示例)如表3所示。

表1 采集的在线评论示例

表2 各备选轿车不同属性下的在线评论用户数

表3 各属性的在线评论提取的情感词示例

其次,根据关注的备选轿车的4个属性的特点,预定义各属性评论的情感强度等级参照词集分别为：

SUN Hao, WANG Wei-jie, ZHOU Quan, CHANG Yi-fan, HAN Jia-hao, ZHU Zhi-peng, LU Xiao-fang, SU Tong

将从各属性的在线评论中提取的情感词与预定义的各属性在线评论的情感强度等级参照词进行比对,可建立各属性在线评论的情感强度等级词典。依据构建的属性情感强度等级词典,运用式(1)～(6)可识别每款备选轿车每个属性每条在线评论的情感强度等级。进一步,运用式(7)、(8)可计算每款备选轿车关于每个属性不同情感强度等级、不确定情感强度等级的评论频次。运用式(9)可计算每款备选轿车针对每个属性在线评论分布在不同情感强度等级的概率。运用式(10)可将关于各属性在线评论在不同情感强度等级的概率转化为关于评论方案各属性的情感强度等级的信任度,结果如表4所示。

畜牧业、草产业资金投入严重不足是导致上述2个产业基础设施建设不到位的主要因素。截止到2016年，底乌拉特前旗能用于灌溉的草地面积占可利用草地面积的0.1%，标准化草地建设不足1 hm2，有户营小围栏割草地的牧户占总养殖户的10%。具有标准化养畜暖棚的养殖户仅占总养殖户的2.1%，建设有储存棚或储存架的养殖户仅占总养殖户的6%左右。在地区草地畜牧产业发展中，规模化养殖场防疫、污染物处理、生产设备投入等严重不足，大多数养殖户依然沿用原始的养殖模式。

表4 关于评论方案各属性的情感强度等级的信任度

再次,依据证据理论,运用式(11)构建每款备选轿车针对各属性的不同情感强度等级上的信任度分配函数,计算结果如表5所示。运用式(12)将每款备选轿车针对不同属性的各情感强度等级信任度分配函数进行合成。运用式(13)计算每款备选轿车关于各情感强度等级的综合信任度,计算结果如表6所示。

患者在网上预约后，按时到诊室就诊，刷卡就可以支付医生医事服务费。如果患者需要后续检查，医生在诊间就可以为其预约，同时完成扣费，患者前往检查即可。如果患者需要取药，医生也可以在诊间为其扣费，并把取药信息传送到药房，患者前往取药即可，这样就省去了患者反复排队的麻烦。

但现在不管怎么说，麻糍娶的是外乡人，而且最让人无话说的是，现在我们岭北镇的人与外乡人结亲的是越来越多，这样就更没话讲了。所以，只能讲麻糍啊，老来得子啊什么的。既算不上得罪他，也算不上恭维他。而麻糍呢，一只耳进一只耳出，你们爱怎么说怎么说。所以，大家更是叫他麻糍了——软乎么，好说话呀。

表5 各备选轿车针对各属性的信任度分配函数

表6 备选轿车关于各情感强度等级的综合信任度

最后,运用式(14)计算各情感强度等级的效用值分别为：

运用式(15)计算每款备选轿车的效用值分别为：

从而得到4款备选轿车的排序结果为：A ₄≻A ₃≻A ₁≻A ₂,最优方案为A ₄(雪佛兰迈锐宝)。

4 结语

本文给出了一种基于情感分析和证据理论的多属性在线评论决策方法。该方法首先依据方案各属性的在线评论,通过情感分析,确定方案各属性的在线评论在不同情感强度等级的评论频次;然后,依据证据理论,将各属性不同情感强度等级的评论频次转化为不同情感强度等级的信任度,并利用证据合成规则集结不同属性的信任度得到方案的综合信任度;在此基础上,计算方案的效用值进而对所有方案进行排序或优选。与已有相关方法不同的是,本文方法考虑的在线评论是针对方案(产品或服务)属性给出的情形,并着重考虑了在线评论中评论情感词的强度以及评论信息包含不确定情感(如某一条在线评论中不含情感词或某一条在线评论中既含有非负向情感词又含有负向情感词)的情况,进而运用证据理论来解决此问题。本文给出的方法具有概念清晰、计算过程简单等特点,具有较强的可操作性和实用性,对于解决现实中的多属性在线评论决策问题提供了一种途径,具有实际应用价值。

参考文献：

[1]Chen H,Chiang R H L,Storey V C.Business intelligence and analytics：From big data to big impact[J].MIS Quarterly,2012,36(4)：1165-1188.

[2]Ye Q,Law R,Gu B,et al. The influence of usergenerated content on traveler behavior：An empirical investigation on the effects of e-word-of-mouth to hotel online bookings[J].Computers in Human Behavior,2011,27(2)：634-639.

[3]张紫琼,叶强,李一军.互联网商品评论情感分析研究综述[J].管理科学学报,2010,13(6)：84-96.

[4]樊治平.多属性决策的一种新方法[J].系统工程,1994,12(1)：15-17.

[5]Sengupta A,Pal T K.On comparing interval numbers[J].European Journal of Operational Research,2000,127(1)：28-43.

[6]Herrera F,Herrera-Viedma E,Martínez L.A fusion approach for managing multi-granularity linguistic term sets in decision making[J].Fuzzy Sets and Systems,2000,114(1)：43-58.

[7]Peng Y,Kou G,Li J.A fuzzy PROMETHEE approach for mining customer reviews in Chinese[J].Arabian Journal for Science and Engineering,2014,39(6)：5245-5252.

[8]Kang D,Park Y.Review-based measurement of customer satisfaction in mobile service：Sentiment analysis and VIKOR approach[J].Expert Systems with Applications,2014,41(4)：1041-1050.

[9]Chen K,Kou G,Shang J,et al. Visualizing market structure through online product reviews：Integrate topic modeling,TOPSIS,and multi-dimensional scaling approaches[J].Electronic Commerce Research and Applications,2015,14(1)：58-74.

[10]Zhang K,Narayanan R,Choudhary A.Mining online customer reviews for ranking products[R].Technical Report,EECS(Electrical Engineering and Computer Sciences)Department.Northwestern University,2009.

[11]Zhang K,Narayanan R,Choudhary A.Voice of the customers：Mining online customer reviews for product feature-based ranking[C]//Proceedings of the 3rd Conference on Online Social Networks.[s.l.]：[s.n.],2010：11-11.

[12]Zhang K,Cheng Y,Liao W K,et al. Mining millions of reviews：A technique to rank products based on importance of reviews[C]//Proceedings of the 13th International Conference on Electronic Commerce.[s.l.]：[s.n.],2011：12-12.

[13]Najmi E,Hashmi K,Malik Z,et al. CAPRA：A comprehensive approach to product ranking using customer reviews[J].Computing,2015,97(8)：843-867.

[14]Wang W,Wang H,Song Y.Ranking product aspects through sentiment analysis of online reviews[J].Journal of Experimental&Theoretical Artificial Intelligence,2017,29(2)：227-246.

[15]中国科学院.NLPIR汉语分词系统[EB/OL].[2016-11-15].http：//ictclas.nlpir.org/.

[16]郑丽娟,王洪伟,郭恺强.基于情感词模糊统计的网络评论情感强度的研究[J].系统管理学报,2014,23(3)：324-330.

[17]哈尔滨工业大学.《同义词词林》扩展版[EB/OL].[2013-10-16].http：//www.ir-lab.org/.

[18]董振东.How Net[EB/OL].[2013-10-16].http：//www.keenage.com.

[19]Wang J,Yang J B,Sen P.Safety analysis and synthesis using fuzzy sets and evidential reasoning[J].Reliability Engineering&System Safety,1995,47(2)：103-118.

[20]Yang J B.Rule and utility based evidential reasoning approach for multiattribute decision analysis under uncertainties[J].European Journal of Operational Research,2001,131(1)：31-61.

[21]Winston W L.Operations research applications and algorithms[M].California：Duxbury Press,1994.

[22]Keeney R L,Raiffa H.Decisions with multiple objectives：Preferences and value trade-offs[M].Cambridge：Cambridge University Press,1993.

Multi-Attribute Online Review Decision Making Method Based on Sentiment Analysis and Evidence Theory

YOU Tianhui ,ZHANG Jin ,FAN Zhiping
(School of Business Administration,Northeastern University,Shenyang 110167,China

【Abstract 】In recent years,a large amount of online review information on products or services emerges on many websites.Therefore,it is worthwhile to make decision analysis based on online.A method for multi-attribute online review decision was proposed based on the sentiment analysis and evidence theory.First,online reviews with respect to each attribute of alternatives concerned by decision maker were collected.Then,the different emotional intensity level frequency of online reviews collected with respect to each attribute was obtained using the sentiment analysis.After that,according to the evidence theory,the different emotional intensity level frequency of online reviews was transformed into a degree of belief which was assigned to the different emotional intensity levels.According to the evidence synthesis rules,the comprehensive degree of belief was obtained by integrating the degree of belief with respect to each attribute of alternatives,based on which,the overall utility value of each alternative was calculated,and the ranking result of all alternatives were determined.Finally,a car purchase example based on the online review information from https：//www.autohome.com.cn was used to illustrate the feasibility and validity of the proposed method.

Key words ：multi-attribute online review decision making;sentiment analysis;evidence theory;alternative ranking

中图分类号：C 934

文献标志码： A

文章编号：1005-2542(2019)03-0536-09

收稿日期：2016-12-30

修订日期： 2017-07-04

基金项目：国家自然科学基金资助项目 (71271049,71571039);中央高校基本科研业务经费资助项目 (N140607001

作者简介：尤天慧(1967-),女,教授,博士生导师。研究方向为管理决策分析。

通信作者：张瑾(1989-),女,博士生。E-mail：zjin0709@163.com

标签：多属性在线评论决策论文; 情感分析论文; 证据理论论文; 方案排序论文; 东北大学工商管理学院论文;