基于聚类——神经网络的客户价值分类方法及应用,本文主要内容关键词为:神经网络论文,价值论文,客户论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F247 文献标志码:A 文章编号:1002-5766(2008)08-0078-07
一、引言
在激烈竞争环境下,企业一味奉承与献媚的待客之道并非最佳策略。相对于不加细分地向所有客户投入相同的成本和资源,企业更应在细分盈利等级的客户基础上合理配置资源,开展“创造客户价值”的一系列客户关系管理和营销策略,积极地从传统营销策略拓展为创造“供需”双方价值的策略,才是企业生存发展之道。认同该观点的企业必然面临两个基本问题:(1)客户价值评价指标体系设计及评测方法;(2)建立基于客户价值评价的分类模型。本文运用客户价值理论,结合实际背景,设计实用性、操作性较强的客户价值贡献指标。采用“聚类与神经网络”组合技术,建立客户价值评价方法,并以某地区电信小灵通客户应用背景,阐述了建模过程及分析结果,并针对不同价值类客户提出营销策略建议。
二、相关理论及方法
1、客户价值评价维度
客户价值研究从供应商的角度出发,研究如何衡量客户对于供应商的相对重要性和价值贡献,支持供应商针对不同价值客户,在长期盈利最大化目的下为客户提供产品、服务和问题解决方案。
回顾客户价值评价维度的研究文献,2000年以前的价值评价主要集中于客户当前产生的净利润,即当前货币价值是构成客户价值的唯一因素。1980~1993年间所有发表在Harvard Business Review上的有关客户关系管理的文章中,客户价值被定义为客户所支付的价格与企业为之投入的成本之间的差值,即客户利润,并以客户所支付的价格减去企业所付出成本作为评价指标度量客户价值;Hughes(1994)所提出的RFM(最近购买日期、重复购买频率、购买金额3个参量)客户价值模型,以客户消费行为数据为基础,使评价过程更具实用性和可操作性,成为衡量客户价值贡献的常用工具;Frederick Reichheld(1996)认为,客户价值包括客户所带来的净现金流的大小和忠诚度两方面,而基础利润、增加购买、成本节约、推荐效应、价格溢价是主要衡量因素。2000年以后,客户价值的非货币化因素开始受到学术界的重视,认为非货币价值是客户价值不可或缺的重要方面。Achim Walter,Thomas Ritter & Hans Georg Gemttnden(2001)研究指出,客户价值为企业从客户关系中所获得收益与所投入成本之间的权衡,这种收益和成本既包括货币因素也包括非货币因素,可划分为直接价值、间接价值和社会价值。
尽管界定客户价值和衡量货币价值与非货币价值尚无统一,但典型的客户价值研究成果奠定了本研究基础。即客户价值的总体评价应包括当前价值(NV)和未来价值(PV)两个价值维度。其中,当前价值可以反映客户当前对企业盈利的贡献情况,如企业从客户那里所获得的收益和企业为吸引、管理、营销、服务客户的成本相比较,收益超过成本的部分就是客户当前对收入的贡献情况。而未来价值指客户对企业的潜在价值,即在未来的一段时间客户将会为企业带来的盈利。当前价值主要以货币化的利润水平和成本支出衡量,反映客户对企业当前盈利的贡献水平。而未来价值则主要以非货币化的忠诚度、信用度等因素衡量,预期客户对企业的长远利润的贡献水平,并且是影响企业是否继续以及如何投资于该客户关系的重要因素。在具体操作层面,必须结合具体行业、经营模式、产品及服务的消费特点等因素,从可操作、可衡量、获得成本低等方面综合考虑,将两个价值维度分解设计为一组结构化指标项集。
2、客户价值分类方法
客户价值的分类是客户关系管理的基础,按照客户价值的评价和分类技术划分,主要方法有预定义分类、统计分类和复合分类。
(1)基于经验预定义的评价与分类。分析员根据实际管理经验和知识,设定一组评价指标,采用算术平均法或加权平均法进行评判,划分常采用“20/80”原则。
(2)基于统计技术的评价与分类。以客户数据、交易数据等为基础,选择一组属性变量,直接或间接反映出客户贡献于企业的价值。在数据转换、统计等操作基础上,按一定比例关系划分客户类的数目。
(3)基于管理理论、经验与数据挖掘技术结合的评价与分类。该方法致力于将管理理论和实践经验用于指导分类变量、评价指标的设计,运用数据挖掘技术,对历史数据分析和挖掘基础上,形成分类知识和模型,使客户价值类划分及预测更加科学合理和可操作。本文将采用该思路,进行客户价值分类模型研究。
三、基于聚类——神经网络的客户价值分类模型
1、研究方法与过程
以“客户价值”为分类论题,运用客户价值理论,结合实际应用背景,设计客户价值贡献指标,采取聚类和神经网络两种数据挖掘技术的融合,提出一种客户价值分类建模方法,步骤如图1所示。
图1 基于聚类——神经网络的客户价值分类建模框架及应用方法
(1)设计具体应用领域的客户价值贡献指标。设计原则:①能够客观表征客户对于企业的价值贡献;②借助指标实施,可促进客户消费模式向客户价值提升的方向转变。
(2)样本数据组织与预处理。数据来源于企业经营系统数据库,记录了客户在一定历史时期内的基本特征、消费行为、产品选择等数据。数据预处理包括数据过滤筛选和分析数据的规范化处理。
(3)建模前导处理。基于聚类技术对客户样本分群,并对分群客户样本的类属性赋予类“标识”。
(4)建立客户价值分类模型。将客户样本划分为学习和检验两个样本集(两个集中均含各类客户价值群样本)。基于BP神经网络技术,以学习训练样本集,训练并生成BP神经网络模型。再用验证样本集对模型进行符合性检验,得到符合精度要求的客户价值分类模型。
建立“客户价值分类预测模型”的意义在于,通过使用已构造的“客户价值分类”模型,对待分析的无类标记的客户(如新客户或潜在盈利性客户)进行价值评估和归类,并得出其可能具有的价值评价等级或区间值。例如成长型、稳定型、波动型和流失型等,以及归类客户的价值贡献等级或结果值。
2、建模关键技术
(1)基于聚类分析的前导处理。BP神经网络的分类预测建模是有监督(指导)下的学习技术,要求训练样本是一批输入“值”与输出“值”有已知相互关系的样本数据。(实例中输入为价值属性“值”,输出为价值类“标识”)。因此,在建模初期需要首先进行客户价值的聚类分析,对客户进行“类标识”。同时,这样对样本进行事前分群,也可避免因大样本情况引起的网络结构复杂、收敛性和泛化能力差的问题。聚类分析属于无指导学习,通过分析、创造一个分群方式,使得群内的样本彼此间在指定的若干属性值上具有某种程度的相似性,群间具有高度的异质性。在实际决策分析中,聚类分析往往作为前导预处理,其他分析则在聚类分群基础上,进行后续工作。如聚类分析与群特征分析、群模型分析,主因子分析等组合运用。因此,本文设计以价值贡献评价指标为的为聚类变量,采用K均值聚类方法,完成分类模型的前导处理,即对客户样本数据进行价值聚类分析,得到k类客户,每类客户的价值属性具有相似性,并对分群客户样本的类属性赋予类“标识”。该聚类分析原理及步骤可参见本文实例及文献。
(2)基于BP神经网络的客户价值分类学习模型。基于数据挖掘技术的分类与预测方法(如神经网络、决策树、遗传算法、粗糙集)受到广泛运用。其中,神经网络技术已在实际分类问题领域得到有效利用。神经网络建模技术可根据历史的、已知类别的数据样本,构造学习模型,经过样本学习和检验的测试过程,获得具有一定准确率的分类模型。该模型具有较强自学习和自适应的能力,以及高度非线性的表达能力,最终得到的分类模型,可反映出具有内在不良结构、难以线性化描述的客观事实,即对象“属性”值与对象“类”值之间对应关系(规律)。根据这些关系(规律)模型,用新的输入数据来推算输出结果。
BP神经网络模型是典型的多层前向网络,分为输入层、隐含层和输出层,层之间神经元采用有权重的有向线全连方式,层内神经元之间无连接。它运用一批对应输入—输出的样本数据(包括训练和验证两个样本子集),首先将训练样本输入网络模型,将分类结果与已知的类标号比较来进行学习,确定并不断调整连接神经元的权值,反复迭代,使网络分类与已知类之间误差平方最小,权值收敛时,学习过程终止,得到分类模型。然后用验证样本子集检验分类预测模型,必要时做调整,得到最终分类模型,如图2所示。
图2 BP神经网络训练流程图
四、实例:某区小灵通客户价值分类预测建模与运用
1、价值观察变量设计
以小灵通业务为应用背景,在通信需求目标驱动下,需求对象群主要有两大类:基本产品(服务)和附加(增值)产品(服务)。对于供应商在相同需求目标驱动下,客户需求群“荷包”的占有率和结构特性可间接地反映其给企业带来的利润空间。因此,依据数据库中客户交易数据,选择客户平均月消费支出、基本消费支出、增值消费支出等项目组合结构,计算客户当前价值;选择重复购买(消费)次数、持续购买(消费)增量趋势、消费量稳定性等,计算客户未来价值。为此,价值观察变量设计3组:
(1)基本产品消费。定义:通信需求目标驱动下,在一个观察期内,客户基本产品项目数及消费费用总和。说明:在企业投入资源的成本平均分担的前提下,当客户基本产品项目数及消费费用总和越高,则反映出该客户对企业当前价值贡献会越大,反之,对企业当前价值贡献越小。
(2)增值产品消费。定义:通信需求目标驱动下,在一个观察期内,客户围绕基本产品所选择的增值产品的项目数及消费费用总和。说明:在企业投入资源的成本平均分担的前提下,若客户在基本消费的同时,选择围绕着基本服务产品的多项附加服务产品,则说明该客户对企业产品具有一定的信赖和偏好,具有一定忠诚表征,而且当企业推出新的增值产品时,该客户再度购买的机率较高。同时,增值产品消费费用总和增加,反映出该客户对企业当前和潜在价值贡献都增大。
(3)消费相对波动幅度。定义:客户在最近一段观察时间内消费费用的变化幅度。公式如下:消费相对波动幅度=(|观察期内消费均值?观察期内消费中值|)/观察期内消费均值。说明:通信行业一般用客户一个观察期内消费中值与均值的差的绝对值表示波动,衡量一个客户消费的稳定情况。但考虑到各客户消费金额大小不一,高消费客户相对于原消费额较小的消费变化产生的波动,可能大于低消费客户相对于原消费额较大的消费变化产生的波动。因此,本文用波动除以客户一个观察周期内消费的均值,得到客户相对波动幅度来衡量各客户消费变化的稳定程度。消费相对波动幅度反映出客户在持续消费过程中价值贡献的稳定性,在企业投入资源的成本平均分担的前提下,相对波动幅度小反映出客户重复消费稳定,间接表征该客户一定的忠诚度及潜在价值;反之,该客户价值贡献存在流失可能性。
2、样本数据及与处理
分析数据来源于某地区小灵通1111位客户,在2007年1月至4月,关于基本特征、基本产品、增值产品的消费数据,主要包括区内通话费、区间通话费、传统国内长话费、IP长话、古城热线费用、短信sp(分成)费用、彩铃sp(分成)费用、电信信息台费用、来电显示费、短消息费用、其他增值业务、总费用等。
以3组价值变量为依据,产生分析数据的宽表,表中每个记录的数据项,包括客户ID,以及基本产品消费,增值产品消费,消费相对波动幅度3组价值属性(具体数据表略)。并对属性变量值进行归一化处理,排除各价值变量因数量级差别而造成的影响。公式如下:调整后的值=(调整前的值—min)/(max-min)。
3、分析客户价值与聚类
运用SPSS12.0统计软件中K-means聚类分析工具。
(1)聚类变量的独立性检验。由于聚类分析要求输入变量彼此间相互独立。因此,对聚类变量进行相关分析,检验结果表明基本产品消费,增值产品消费同消费相对波动幅度间的相关系数分别为0.008和0.003,均通过独立性检验,而基本产品费用和增值费用间的相关系数为0.107,虽然有一定的相关关系,但由于二者相关性较弱,对聚类结果影响较小,可以认为三者之间相互独立。
(2)聚类分析。在确定聚类个数的过程中,尝试不同聚类个数的聚类分析。分析发现,当聚类个数小于3(实验的聚类个数为2)时,聚类输入变量的区分度不明显,并未通过sig值检验。当聚类个数大于3(实验的聚类个数为4,5,6)时,会出现规模很小的聚类群体。当聚类个数为3时,t显著性检验sig值均小于0.001,3个聚类变量对应的F值分别为829.849、1006.000和16.598,对应的sig值均小于0.001,变量能够清晰的区分分群客户间的特征,故确定聚类个数为3(见表1)。
(3)聚类群体命名。聚类将客户群体分为3个群体,结合表2,命名如下:第一类:基本通信消费费用较高,对增值产品的接受程度最低,相对波动幅度很高。这类客户具有较大的潜在价值提升空间,同时也是容易流失的群体。对该类客户命名为稳定——发展类客户;第二类:基本通信消费费用最低,对增值产品消费的接受程度也相应最低,相对波动幅度最低。这类客户尽管消费稳定,但价值较低。对该类客户命名为交叉——培养类客户;第三类:基本通信消费总费用和增值产品消费费用均最高,相对波动幅度次高,从当前和未来两个方面考虑均属于高价值客户群体。这类客户不仅有最高当前价值,而且具有一定忠诚度,对该类客户命名为关怀——保持类客户。
4、建立客户价值分类预测模型
采用Neuro Solutions 4.0软件,建立客户价值分类预测模型,具体分为模型的学习训练和模型的检验两个阶段。
(1)模型输入输出层节点数的选择。输入层起缓冲存储器的作用,把数据源加到网络上。其节点数目取决于数据源的维数,本文经过神经网络的前导处理后,数据为3维,故输入节点数为3。输出层的节点数根据BP网络的用途来确定,结合本研究目的,确定输出节点数为1,如图3所示。
图3 BP网络结构图
(2)模型各种参数的设定。在BP模型算法中,学习步长η为无限小量,这意味着学习的时间无限长。但在实际学习中,为了加快收敛速度,η取[0,1]间的值。在同一隐层节点下,学习步长越大,学习速度越快,但容易产生振荡现象,导致计算结果不稳。减小学习步长,有利于提高网络结构的稳定性和系统精度,但计算时间长,且容易陷入局部极小,得不到分析结果。综合考虑,本文尝试多种取值后,学习步长确定为1。
神经元的信息处理特性是决定人工神经网络整体性能的3大要素之一,神经元的转移函数反映了神经元输出与其激活状态之间的关系,本文设转移函数为TanhAxon。学习方式为Momentum,该方法加入的动量项相当于阻尼项,它减小了学习过程的振荡趋势,改善了收敛性。但动量项因子过小起不了平滑作用,过大则会使修正远离梯度最大的方向。根据以往文献的经验,本文确定动力要素为0.7。
通常,制约训练次数的因素是事先给定的网络训练精度,但实际应用中经常出现同样的训练次数,模型的输出对于学习样本误差小且收敛快,而对于测试样本的误差却可能偏大。为此,在确定网络训练次数时,必须研究它们的变化规律,以实现同时控制训练误差及预测误差。综合考虑训练误差与预测误差的影响,取训练次数为1000次。
(3)模型的检验与评价。分析表明,训练和校验误差的变化均下降迅速,并逐渐稳定在较小的误差范围内,表明训练得到了较好的结果。并且训练混合矩阵和交叉检验混合矩阵中的各分量表明,预测准确度最低为90%,即该神经网络有较好的检验效果。分类结果预测图表示通过训练和检验后的BP神经网络对未知客户进行分类预测的结果,研究表明,期望结果和实际输出结果相差不大,85%以上的输出结果可以近似地、准确地反映期望结果,即预测偏差控制在可以接受的范围之内。以上内容说明,得到的客户价值分类预测模型通过检验。
5、运用模型对新客户进行分类
使用已构造的客户价值分类预测的价值分类预测模型,对给定客户进行价值归类,主要步骤:
(1)将来源于基本特征、基本产品、增值产品的消费的不同数据库中数据,进行提取和转换处理,生成该客户(ID)的基本产品消费、增值产品、相对波动幅度3组价值属性值。
(2)将处理后的数据作为模型输入变量对应的数据值,经过模型归类,得到该客户隶属的价值类别。
(3)针对客户隶属于价值类别,采取不同的营销策略的建议。对第一类客户(稳定——发展),这类客户具有较大的潜在价值提升空间,同时也是容易流失的群体,根据该客户群体的消费特征,建议采用的客户策略包括特殊高值优惠、推广优惠幅度大的阶梯优惠服务、其他特殊优惠策略等,例如11808服务等,以提高此类客户的消费金额和稳定性;对第二类客户(交叉——培养),这类客户消费稳定但额度不高,依据该客户群体的消费特征,建议开发和推出针对性增值产品,并通过引导和体验,培养客户的消费价值感知,以刺激消费为主要目的,提高其消费金额。可以采用的客户策略包括推广套餐、捆绑相应业务、采用刺激消费的一系列优惠策略等;对第三类客户(关怀——保持),从当前和未来两个方面考虑这类客户属于高价值客户群体,具有一定忠诚度。针对此类客户,应以客户关怀为主要策略,保证其消费稳定发展。可以采用的客户策略包括话费回馈(在较低的消费标准下即给予花费优惠)、新产品免费试用体验、组合产品回馈等。
五、结语
科学的客户价值评价不仅能够客观表征客户对于企业的价值贡献,而且借助指标实施可以促进客户消费模式向客户价值提升的方向转变。随着客户数据量的不断增长,客户信息能够帮助企业更多地了解客户的特点,更好地满足客户需求,从而为客户提供个性化的服务,企业也可获得更多收益。
以此为导向,提出了基于“聚类和神经网络”技术的客户价值分类预测建模方法,并应用于小灵通客户价值分类。该建模方法能有效降低网络学习的难度,提高趋势准确率,降低时间代价,减少模型的复杂度。
通过建立“客户价值分类预测”可使用数据库中的客户信息,获知现有客户、新客户或潜在客户的当前价值、潜在价值和消费稳定性,有效划分客户群,解决类似于“那些宣传对哪类客户是最有效的?哪类客户会对附加产品感兴趣?”等问题,帮助企业更好地理解客户需求、态度和愿望,从而更好地策划市场营销活动以保留客户,提升客户价值,提高活动的响应率。例如,在本文小灵通的实例中,推出科学合理的资费套餐,一方面降低了移动通信的运营成,最大化电信运营商的收益;另一方面可以满足不同客户群体对通信服务的多样性需求,同时既让老客户受惠,又吸引了新客户。这对电信运营商至关重要。
在设计客户价值评价指标考虑到两个方面:一能够客观表征客户对于企业的价值贡献(当前价值NV和未来价值PV两个价值维度)实用、简便;二能借助指标实施,可促进客户消费模式向客户价值提升的方向转变。如基于消费显性变量,设计的衍生变量“消费相对波动幅度”,可以帮助企业预测哪类客户在未来很短的时间内会离开,如果分析得知该类客户价值很高,但稳定性不好,企业可以投入更多资金和进行更集中的营销活动来挽留客户;如果分析得知该类客户的当前价值和潜在价值均不高,不如放弃在该类客户上的投入。对于分析得知的已离开的高价值客户,企业通过分析结果,提供激励、个性化的服务或产品等,仍有可能挽留有价值的客户。
本文提出的方法与研究框架,为企业客户价值管理决策系统开发提供了模型依据。但是,不同的行业有各自的特点,如何使其更具有普适性,将是今后研究的主要方向。
收稿日期:2008-01-18
标签:客户价值论文; 聚类论文; 市场营销论文; 神经网络模型论文; 预测模型论文; 客户分类论文; 分类变量论文; 数据建模论文; 产品价值论文; 客户分析论文; 成本分析论文; 分类数据论文; 建模软件论文; 成本预测论文; 无监督学习论文; 产品属性论文;