基于组合赋权方法的用户购车倾向评价

王茜竹^a,b,韦青霞^a,b,杨晓雅^a,b,康璐璐^a,b

(重庆邮电大学 a.新一代信息网络与终端协同创新中心; b.电子信息与网络工程研究院,重庆 400065)

摘要：为准确快速地衡量用户的购车倾向,提出一种基于主客观组合赋权的用户购车倾向评价方法。利用多赋权法的兼容性特点保证指标权重的合理性并减少组合权重数量,根据购车倾向与已购车事件的相关性特点,基于真实购车用户数据构造理想点并修正指标权重,以提高购车倾向评价的准确性。实验结果表明,与传统理想点法和未经筛选直接加权的方法相比,该方法可在降低运算复杂度的同时,提高评价效果的准确性。

关键词：购车倾向评价;组合赋权;兼容性;事件相关性;理想点广义最小距离

0 概述

随着移动互联网技术的发展,金融服务正从以产品为中心转向以消费者为中心。金融企业迫切需要为产品寻找目标客户,分析用户的行为数据,挖掘高质量的潜在对象,从而实现产品从粗放式营销到精确化营销的转变^[1]。购车倾向是指用户在一定周期内的购车意向程度,以此为依据向金融行业提供标签,可以进行ETC信用卡、购车贷款等产品的营销。高价值的用户画像标签对金融行业的营销存在重要的现实意义。

目前购车倾向评价的相关应用较少,评价方法也相对单一,如文献[2-3]利用层次分析法建立递阶层次结构和判断矩阵,并结合定性分析和定量评价,对部分主流车型进行排序和评价,进而做出合理的选择。随着社会的发展和用户需求目标的改变,主客观组合赋权成为评价领域的研究热点,其不仅要考虑指标本身的重要性(主观权重),还要考虑指标的数据信息(客观权重)^[4]。例如,文献[5]结合主客观权重结合构建水库洪水调度优化模型,文献[6]构建基于最大平方和距离的主观权重与客观权重的最优组合,用于信息安全风险评,文献[7]采用改进的AHP法、G1法、熵权法以及标准和平均差最大法分析主客观最优组合权重,以实现电能质量灰色综合评价。文献[8]采用专家评分法、层次分析法、对比排序法3种主观赋权方法,以及熵权法、标准离差法、CRITIC法3种客观赋权方法确定评价指标综合权重。文献[9]基于AHP和TOPSIS方法,从主客观2个维度综合考虑评价指标的权重,提出网络节点重要性评价的组合赋权VIKOR(Combination Weighting VIKOR,CW-VIKOR)方法。随着组合赋权方法的发展,组合权系数目标函数的种类越来越多,出现了理想点法或最大熵原理等。文献[10-11]采用熵权法确定组合权重,根据理想点的广义最小距离以及最大熵原则构建目标函数,从而计算最优组合权系数,文献[12]提出基于相邻目标优属度和极大熵准则的指标权重确定方法,文献[13]构建基于最大熵原则的组合赋权模型,实现企业绩效的合理评价,文献[14]利用偏好比率法和熵权法进行组合赋权,以体现不同被评价对象之间的差异,构建最优组合赋权模型。在上述文献中,理想点广义距离和最大熵原则是求解组合权系数常用的方法。

组合赋权中的理想点法根据标准化后的评价对象构造理想点,通过广义最小距离目标函数修正组合赋权系数,以此得出更合理的评价标准。最大熵原则可反映不同赋权方法得出的权重之间的一致性程度,基于一致性最大思想确定组合系数,从而保证其合理性和客观性。

对于用户购车倾向评价,随着样本数据量的增多,若选择的赋权方法过多会增加运算复杂度。同时,在利用理想点广义最小距离求解组合权系数时,通过样本数据构造理想点有效范围,其并不能代表购车倾向最优样本点,无法准确衡量用户的意向程度。因此,本文基于用户购车相关指标,应用兼容性特点进行赋权方法筛选,构建基于兼容性的最优权重组合函数。在此基础上,根据事件相关性构建基于改进理想点广义最小距离和最大熵原则的组合权系数目标函数,以修正权重,从而得出更合理的用户购车倾向程度评价。

1 方法介绍和问题描述

主客观组合赋权过程主要包括赋权方法选择和组合权系数确定2个部分。

1)赋权方法选择

常用的主观赋权法有德尔菲法、古林法、层次分析法等;常用的客观赋权法有熵权法、主成分分析法、变异系数法等。虽然组合赋权中赋权方法的数量越多,组合信息就越全面,但是随着样本数据量的增大,运算复杂度也会增加。针对该问题,本文利用兼容性来筛选权重,在保证权重性能的前提下减少组合权重数量,降低计算复杂度。目前,兼容性特点已应用于权重分析的多个步骤中,且取得了较好的效果。例如,文献[15]利用兼容性特点进行事后检验,证明了基于相对熵组合赋权得出的结果更优。本文将兼容性特点扩展到主客观权重筛选中,以构建基于兼容性的最优权重组合函数。本文组合赋权方法与传统组合赋权方法的运算数据量对比如图1所示。

综上所述，口腔专业研究生规范化培训是系统工程，需要各个部门的配合与协作。可通过健全培训制度、建立过硬的师资队伍、不断完善规范化培训内容、利用丰富多样的教学手段、完善考核方式等措施，为培养合格的高素质的口腔临床医师探索更好的培训模式。

图1 运算数据量的对比

2)组合权系数确定

基于理想点广义最小距离和最大熵原则确定组合权系数。设样本数据集为X ,其中待评价对象数为n ,评价指标有m 个,X _ij 表示标准化后第i (i =1,2,…,n )个评价对象的第j (j =1,2,…,m )个指标值。令X _ij 的理想点为1(即为标准化后的最大值),则多权重加权组合的计算过程如下:

(1)

其中,α _k 表示组合系数且表示赋权方法个数。

令第i 个评价对象的理想点广义距离为:

(2)

当各评价对象组合赋权后,加权得分与理想点广义最小距离为:

(3)

结合最大熵原则构建如下目标函数:

(4)

利用以上方法构建的距离函数可能只对样本用户评价有一定的效用,本文并不仅仅针对有限的样本用户评价,而是利用样本数据制定评价标准,以实现购车倾向高价值用户挖掘。此外,传统方法的理想点仅在样本数据中有效,并不能代表真实意义上的“理想”,其无法实现购车倾向的准确评价,缺乏科学性,会影响最终的评价精度。

本文选择7种常用的赋权方法得出相对应的权重,结果如图7所示。

图2 事件关系

2 购车倾向用户评价

2.1 整体框架描述

本文利用组合赋权方法对用户购车倾向进行评价,其整体框架如图3所示。

图3 本文方法的整体框架

2.2 数据处理

1)设2个权重集合取的第j (j =1,2,…,m )个值分别用A _j 、B _j 表示,并对集合A 、B 进行排序(同为升序或降序)。其中,a _j 、b _j 分别代表在A 和B 中的排行,然后将A 、B 集合中对应的元素进行相减,即D _j =a _j -b _j ,则2种不同赋权方法之间的相关系数ρ 的计算过程如下:

1)成本型指标(指标越小越好):

上高中以后，温衡从旅行杂志上得知了一个叫做可可西里的地方，听说那里有成片的草原跟成群的藏羚羊，永远都不会有台风。她想，以后一定要跟陶小西去一趟。自从离开以后，她几乎每天都会想起陶小西，晚上也会梦见自己坐在他的自行车后座上。

(5)

本文基于购车倾向与已购车事件的相关性特点来构造理想点。取已购车用户指标数据为R =(r _st )_h×m ,由于不同数据的归一化标准不同,现将已购车用户购车前的指标数据与购车倾向评价样本的对应指标数据进行合并归一化,得到如下数据:

(6)

3)适中型指标(指标越接近某一值越好):

(7)

2.3 赋权方法筛选

本文构建基于兼容性的最优权重组合函数。不同赋权方法得出的指标权重相关程度可以利用斯皮尔曼相关系数法进行检验,通过不同赋权方法的相关性,综合分析比较兼容性大小。

2.青年价值观的含义及其构成要素。世界观给予我们对所处世界的一般性看法，人生观是人们对人生目的、意义的认识和态度。青年价值观是青年人生观的体现，是在具体的人生观的指导下形成、发展的。在我国，青年人生观一般可以分为两类：即无产阶级人生观和非无产阶级人生观。《共产党宣言》中指出：“过去的一切运动都是少数人的或者为少数人谋利益的运动。无产阶级的运动是绝大多数人的、为绝大多数人谋利益的独立的运动”［1］。“为绝大多数人谋利益”由马克思、恩格斯提出，被毛泽东凝练成“为人民服务”，这正是无产阶级政党的宗旨，也是无产阶级人生观概念的升华。

设有u 个赋权方法得出指标权重,分别选择互不相同的2个权重集合A 、B 来计算相关性,具体步骤如下:

本文通过数据规范化处理实现指标无量纲化,同时,将指标值控制在[0,1],以增加离散度。在一般情况下,对象的所有指标可划分为成本型、效益型、适中型等,可通过如下方式得到相对应的规范化矩阵X :

(8)

2)不同主客观赋权方法的兼容性是该方法与其他赋权方法之间的斯皮尔曼相关系数的算数平均值,其为赋权方法的选择提供依据,计算过程如下:

(9)

其中,μ 表示赋权方法的数量。ρ ′越大说明该赋权方法的兼容度越高,代表其性能越好。

首先，项目投入到哪个村，主要看领导对哪个地方关注得比较多。GQ村是中国历史文化名村，是省级农房改造示范村，以文化旅游开发为主，上级领导到访频繁(2003年习近平曾来参观过)。这些项目既是各部门需要完成的相关任务，也是GQ村需要的配套设施。其次，项目投到哪个村，与该村的干部是否团结有关，也与主要干部的工作能力关系很大。如SQ村主任工作能力非常强，乡干部非常器重。乡镇现在喜欢“狮子型”干部，会冲，会干，会摆平。另外，乡镇干部现在普遍急功近利，热衷于做能立竿见影的工作，如果项目三五年才会见成效，他们肯定不会感兴趣。因为他们往往热衷于见效快的、可以给他们带来政绩的项目。

本文基于主客观组合赋权,通过兼容性检验快速、高效地筛选权重,在保证指标权重性能的基础上,减少组合权重数量,并利用加法加权构建组合权重函数w :

(10)

其中,α _k 表示组合系数且

2.4 组合权系数确定

3)数据标准化

1)改进理想点构造

2)效益型指标(指标越大越好):

其中,x _ij 表示标准化后第i 个评价对象的第j 指标,i =1,2,…,n ,j =1,2,…,m ,n 表示评价对象的个数,m 表示指标个数,r _st 为标准化后第s 个理想点的第t 个指标值,s ={n +1,n +2,…,h },t =j ={1,2,…,m },h 表示理想点个数。

在本文中,若h =1,选择综合样本点中的最优点作为第i 个评价对象的第j 个指标值的理想点,则经过标准化后取得的对应指标的理想点为1,此时与改进前的思路类似。

为了使理想点发挥更大的作用,本文考虑多个理想点,即考虑h >1的情况。根据已购车用户标准化后的数据构造理想点,此时理想点可构成理想点矩阵,通过计算与对应指标理想点的累加距离值来构建距离函数。为观察不同理想点数量对性能的影响,本文选择不同数量的理想点分别进行实验,即h =1和h >1这2种情况。

基于这2种情况构造理想点,得出第i 个评价对象与理想值的广义距离。当h =1时,广义距离如式(2)所示;当h >1时,广义距离的计算公式如下:

(11)

其中,α _k 表示组合系数,表示第j 个指标值的第k 种赋权方法的权重值。因此,所有评价对象与理想点的广义距离累加和为:

(12)

2)最优组合权系数模型构建

本文结合最大熵原则构建如下目标函数:

岩棉复合型保温模板是在大力发展绿色建筑、绿色材料的背景下设计提出的，该模板设计理念为建筑行业的节能化和高效化提供了一条新的发展思路。

回忆起沈大高速公路的过往，今年75岁，曾参与沈大高速公路建设的工程师王锡岩老人五味陈杂、百感交集。“当年经济发展急需改善路况来支持，但修建高速却面临建设规范、资金来源和认识水平三大困难，最难的是人的认识问题。”

(13)

利用拉格朗日函数求解α _k ,再经过归一化处理,可得出组合系数:

(14)

3 实验结果与分析

3.1 实验数据集

3.1.1 特征描述

秦明月想，这真是一个单纯的从乡下来的孩子。秦明月说：“你做毛教授的助理有多长时间了，他失踪前有没有什么反常的、或者说在你看起来与往常不一样的地方？”

本文实验使用的数据由重庆市某运营商提供,并经过加密处理。数据字段主要包括用户属性数据、用户信令数据(包括基站数据和进出基站时间)、上网日志数据(包括APP名称和APP流量)和语音端口数据(与4S店或汽车经销商的通话记录)。本文利用移动数据对用户的购车倾向进行分析,其基本特征如表1所示。

表1 用户购车倾向评价特征信息

3.1.2 数据处理

环境影响评价会商平台主要利用互联网和云计算服务等其他先进的技术对不同级别的技术评估部门和环境管理部门进行评估和服务，环境影响评价会商平台能够提供更加标准化和系统化的评估方案和结果，在一定程度上提高了环境评估管理的能力；而环境影响评价智慧监测平台不但能够为不同级别的环评构建审批信息，还能够实现全国各个级别的环境评估审批信息相互交流；环境影响评价互联网服务平台已经为环评事业大大降低了数据处理时间和经费支出，还推进了群众对环评的公信力度。

本文数据处理过程主要包括数据清洗、数据匹配和数据标准化3个部分,具体分析如下:

本文首先将文本数据转换为数值类数据,再进行规范化处理,得到标准化的数据集。部分购车倾向评价数据如图6所示。

数据的质量是影响评价模型的关键因素,可通过数据清洗来提高数据质量。首先从原始的移动数据中过滤掉无用信息,提取关键字段,然后进行数据清洗,一般通过填充缺失值、剔除或替换离散值与极值、平滑噪声等方法来改善数据质量。例如,对于年龄类数据,一般用平均值代替。

2)数据匹配

改造518刮板机驱动系统，将其输送速度从0.55 m/s提高到0.88 m/s，运输量提高到400 t/h，满足快开压滤机最快卸料速度的要求。

对于移动端的原始数据,需要进行解析匹配。利用爬虫得到的部分4S店基站数据和部分APP数据分别如图4、图5所示。

图4 部分4S店数据

图5 部分APP数据

组合权系数的确定分为构造改进理想点和构建最优组合权系数模型2个步骤。

1)数据清洗

图6 部分标准化数据

3.2 评价指标

为了合理评价模型的综合性能,本文在用户购车倾向评价的基础上计算得分,并进行意向度分级(包括高、中、低3级)。将运算复杂度和转化率作为评价指标来对本文模型与传统模型进行比较。算法复杂度是指算法在编写成可执行程序后,运行所需的资源,包括时间资源和内存资源。转化率是指统计各意向级用户在一定周期内转化为购车用户的占比。

(15)

其中,F 表示转化率,即各意向级i 实际转化人数占该意向级总人数的比率,i =0,1,2分别表示高、中、低3个级别。p 为i 意向级的转化人数,∑p ⁱ 表示评价为i 意向级的总人数。

举例来说，在教学北师大版小学数学四年级上册“速度、时间和路程”这部分内容的时候，教师可以围绕本课时的教学目标，结合学生的实际生活，精心设计一些应用题目。通过让学生一丝不苟地完成这些应用题目，学生不仅能够更进一步地理解速度、时间和路程之间的基本关系，还能够懂得时间的重要性。由此，学生也就会在学习、工作以及生活中懂得珍惜时间、提升做事效率。如此这般，德育也就在润物无声之中渗透到了这些作业题目之中。

3.3 结果分析

3.3.1 赋权方法筛选

针对上述问题,本文利用购车倾向与已购车事件的相关性特点构造理想点。已购车用户拥有真实的购车标签,在时间上属于购车倾向用户成功转化的未来状态,具有丰富的购车行为数据,其对于购车倾向用户来讲,是很好的参考对象,也是较合理的理想点构造数据源。利用已购车用户购车前一定周期内的行为数据构造理想点并进行权重修正,可以提高购车倾向用户评价的可靠性与科学性,其事件关系如图2所示。

图7 不同赋权方法的权重比较

本文主要进行主客观组合赋权。为了在保证权重性能的基础上减轻组合赋权的计算复杂度,利用兼容性检验分别选择适用于本文应用的主客观赋权方法,再根据式(8)、式(9)计算各赋权方法的兼容性大小并得出最终选择,即主观赋权采用层次分析法,而客观赋权利用变异系数法。

3.3.2 组合权系数分析

根据式(10)～式(14)对组合权系数进行分析,通过基于改进理想点的最小广义距离和最大熵原则构建组合权系数函数。不同理想点数目得到的组合权系数如表2所示。

表2 不同数目理想点的组合权系数

从表2可以看出,不同的理想点数目得到的系数在不断变化。根据主客观权重以及组合权系数可以得出最终的组合权重值。

3.3.3 结果比较

1)运算复杂度的比较

在利用基于理想点广义最小距离和最大熵的权重目标函数进行权系数求解时,如果选择的赋权方法过多,会使运算复杂度较大。本文利用兼容性计算进行权重筛选,减少组合权重数量,以此降低组合权系数求解的复杂度。本文方法与传统未经筛选直接加权的方法求解组合权系数的运算时间对比如表3所示。

表3 组合权系数求解所需的运算时间对比 s

由表3可知,当h =1时,运算复杂度较低,其运算时间比直接加权法缩短36%,随着h 的增加,本文方法的运算复杂度增大。将理想点数目h 保持在一定范围内,可使本文方法的运算复杂度优于直接加权法。

Lienhard 1984:Siegfried Lienhard, A History of Classical Poetry: Sanskrit-Pali-Prakrit,Wiesbaden: Otto Harrassowitz.

2)转化率的比较

由图11可见，直流正极接地故障发生时，故障极直流电压降至零，非故障极电压升高至极间电压，即直流零电位参考点发生偏移；但直流极间电压保持不变。同时导致三端换流器发生交流电压偏置、出现中性点故障电流。故障电流经故障线路两端向故障点流入，故障电流的大小与接地电阻值成反比。

利用转化率作为模型评价指标,对本文方法和传统理想点法进行对比,得出各模型不同购车倾向意向级的转化率,具体如表4所示。

表4 不同方法的转化率对比 %

本文选取的转化率是指分析用户评价后一个月内的行为转化率,且高意向级的转化率越高、低意向级的转化率越低,说明评价分析的效果越好。可以看出,与传统理想点法相比,本文方法的综合性能较好。

由运算复杂度以及转化率的综合对比可以看出,与传统组合赋权方法相比,本文组合赋权方法具有较大优势。虽然当h 增大时,本文方法的运算复杂度增加,但是只要将h 保持在一定范围内,本文方法仍具有更低的运算复杂度和更准确的评价结果。

若桐，90后一枚，正值青春期，最大的梦想是拥有脸上痘痘一般多的钻石。留学IT，程序员里最屌丝的文青，爱敲代码，主要敲些理想。喜音乐，自封“唱作人”，金牌浴室歌手，擅长吵醒室友。闲暇时，啃指甲望天花板，过着今天，想着明天，记录昨天。

4 结束语

本文提出一种组合赋权的购车倾向用户评价方法。结合用户移动端多行为数据进行购车倾向指标评价,通过兼容性和事件相关性特点分析购车倾向评价指标权重,从而得到合理的用户购车倾向程度评价。实验结果表明,该方法的运算复杂度较低,评价结果较准确。下一步将结合机器学习和深度学习对该方法进行改进,形成用户自动识别机制,并增加用户支付行为、通信行为等以充分描述用户的特征,获得更加全面准确的评价结果。

参考文献

[1] 林丽金.数据挖掘技术在识别潜在目标用户模型中的应用研究[J].宁德师范学院学报(自然科学版),2012,24(2):197-200.

[2] 杨七九.基于购车决策的层次分析模型研究[J].中国市场,2015(24):37-38.

[3] 徐洪香,刘秀娟.基于层次分析法的家庭购车决策[J].辽宁工业大学学报(自然科学版),2011,31(3):202-206.

[4] 李刚,李建平,孙晓蕾,等.主客观权重的组合方式及其合理性研究[J].管理评论,2017,29(12):17-26,61.

[5] XI Shufei,YUAN Jingxuan,LIU Ji.Optimal model of reservoir flood operation considering objective and subjective weight and its application[C]//Proceedings of the 5th International Conference on Fuzzy Systems and Knowledge Discovery.Washington D.C.,USA:IEEE Computer Society,2008:381-385.

[6] TAO Liangliang,LIN He,SHEN Yongjun,et al.Optimal combination between subjective weighting and objective weighting based on maximum square sum of distance for information security risk assessment[C]//Proceedings of the 7th IEEE International Conference on Software Engineering and Service Science.Washington D.C.,USA:IEEE Press,2016:471-474.

[7] 沈阳武,彭晓涛,施通勤,等.基于最优组合权重的电能质量灰色综合评价方法[J].电力系统自动化,2012,36(10):67-73.

[8] 郭晓晶,何倩,张冬梅,等.综合运用主客观方法确定科技评价指标权重[J].科技管理研究,2012,32(20):64-67,71.

[9] 刘欣,徐桂琼,杨平乐.基于组合赋权VIKOR方法的网络节点重要性评价[J].计算机应用研究,2019,36(8):2368-2371,2377.

[10] 迟国泰,齐菲,张楠.基于最优组合赋权的城市生态评价模型及应用[J].运筹与管理,2012,21(2):183-191.

[11] 姜昱汐,迟国泰,严丽俊.基于最大熵原理的线性组合赋权方法[J].运筹与管理,2011,20(1):53-59.

[12] 钱吴永,董扬兵.基于改进向量相似度的区间数动态多指标决策模型及应用[J].控制与决策,2019,34(1):25-30.

[13] 王阿娜.基于最大熵原理的第三方物流企业绩效评价分析[J].社会科学辑刊,2012(1):135-138.

[14] 张以晨,佴磊,孟凡奇,等.基于最优组合赋权理论的可拓学评价模型的应用[J].吉林大学学报(地球科学版),2011,41(4):1110-1115,1135.

[15] 李杰,赵子铱,陈毅俊.基于相对熵的组合赋权法在农户信用评价中的应用[C]//中国企业运筹学第八届学术年会论文集.北京:中国运筹学会,2013:29-40.

Evaluation on Car Purchase Tendency for Users Based on Combination Weighting Method

WANG Qianzhu^a,b,WEI Qingxia^a,b,YANG Xiaoya^a,b,KANG Lulu^a,b

(a.Collaborative Innovation Center for Information Communication Technology; b.Electronic Information and Networking Institute,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

【Abstract 】In order to accurately evaluate the user’s car purchase tendency,an evaluation method on car purchase tendency based on the subjective and objective combination weighting is proposed.The compatibility of multi-weighting method is used to ensure the rationality of index weights and reduce the number of combined weights.According to the correlation characteristics between the car purchase tendency and the purchased car event,the real car user data is used to construct the ideal point,and the index weight is corrected to improve the car purchase tendency evaluation performance.Experimental results show that compared with traditional ideal point method and unscreened direct weighting method,the computational complexity of the method is reduced and the accuracy of the evaluation effect is improved.

【Key words 】evaluation on car purchase tendency;combination weighting;compatibility;event correlation;generalized minimum distance of ideal point

开放科学(资源服务)标志码( OSID):

中文引用格式：王茜竹,韦青霞,杨晓雅,等.基于组合赋权方法的用户购车倾向评价[J].计算机工程,2019,45(11):303-308.

英文引用格式： WANG Qianzhu,WEI Qingxia,YANG Xiaoya,et al.Evaluation on car purchase tendency for users based on combination weighting method[J].Computer Engineering,2019,45(11):303-308.

文章编号： 1000-3428(2019)11-0303-06

文献标志码: A

中图分类号: TP391

基金项目：教育部-中国移动科研基金(MCM20170203);重庆市自然科学基金(cstc2018jcyjAX0587)。

作者简介：王茜竹(1975—),女,高级工程师、硕士,主研方向为移动物联网通信标准、传输关键技术和移动大数据应用;韦青霞、杨晓雅、康璐璐,硕士研究生。

收稿日期： 2018-10-18

修回日期： 2018-11-21E-mail： wqxgirl@163.com

DOI :10.19678/j.issn.1000-3428.0052925

编辑樊丽娜

标签：购车倾向评价论文; 组合赋权论文; 兼容性论文; 事件相关性论文; 理想点广义最小距离论文; 重庆邮电大学新一代信息网络与终端协同创新中心论文; 重庆邮电大学电子信息与网络工程研究院论文;

基于组合赋权方法的用户购车倾向评价论文