基于广义计算和分类回归树的电信业异动客户识别

基于广义计算和分类回归树的电信业异动客户识别

李明芳[1]2003年在《基于广义计算和分类回归树的电信业异动客户识别》文中提出基于广义计算和分类回归树异动客户识别系统这个项目,是在数据仓库技术和数据挖掘技术迅速发展的基础上,针对企业客户关系管理的迫切需要而提出的。为进行客户关系管理,本文基于广义计算思想,将多准则神经网络和一种决策树——分类回归树相结合,提出了一种新的异动客户识别模型。该模型能够有效提高分类精度和识别效率,充分利用多准则神经网络和分类回归树各自的优点,一定程度上避免各自的缺陷。 为完成这个项目,本人所做的工作具体如下: 首先研究了数据挖掘技术中的决策树技术和基于广义计算的多准则神经网络理论以及两种理论的优缺点。分析了多准则神经网络和决策树相结合的可能性及优势,并深入了解目前该方向的发展情况。 然后,通过深入研究多准则神经网络和决策树的特点,论文提出了将多准则神经网络应用于决策树的建模方法——基于多准则神经网络和分类回归树的异动客户识别系统。该系统包括多准则神经网络属性约简和分类回归树异动客户识别两大模块。多准则神经网络部分对客户属性集进行维数约简,重点介绍了以模糊熵准则为基础的多准则学习方法,同时提出了网络输入层、隐含层及输出层的构造方法。在分类回归树部分,介绍了分类回归树的生长算法、最小代价—复杂性剪枝算法以及最优树选择等算法。 提出了系统设计之后,论文详细介绍了该系统的开发,用以解决异动客户的识别问题。通过在实际领域的应用,体现了本文提出的新模型与传统分类回归树模型相比具有的优势,并用具体数据说明了这一点。 最后,论文总结了作者所展开的研究工作,提出了存在的问题,并对今后的工作进行了展望。 本文把广义计算理论和数据挖掘技术相结合,具有很强的理论创新意义。把最终实现的系统应用于异动客户识别,体现了巨大的应用价值。本文的价值在于: ①提出了融符号计算、神经计算、模糊计算和演化计算于一体的广义计算理论。 ②提出了基于广义计算思想的多准则神经网络学习方法。 ③对分类回归树数据挖掘技术进行了改进,使之具有更高的分类精度。 ④基于广义计算思想,把多准则神经网络和分类回归树技术相结合,实现异动客 ③ 浙江大学硕士学位沦义 缀 _③ 户识别系统。③ 该系统与传统分类回归树识别系统相比,具有如下优点:①基于模糊嫡卅则 缀 D’…中经网络学习方法分类精度更高、收敛速度更快、训练时间史短。②上外了儿 菱 余信息,使属性集得到约简,减少了计算时问。③多准则神经网络和分类口山树 缀 @ 伯结合的分类识别系统分类精度高、简单直观、容易理解。④多准则神经网络。> 篡 习方法和分类口归树技术两者相_五补充,相得益彰。

夏国恩[2]2007年在《基于商务智能的客户流失预测模型与算法研究》文中研究说明客户流失管理是许多行业关注的一个重要问题,近年来,以传统统计学方法和人工智能方法为基础,客户流失预测研究取得了丰富的研究成果,但尚存许多值得研究的问题。商务智能的崛起为客户流失预测的研究提供了新的思路。本文在商务智能理论和客户关系理论框架下,对现有客户流失预测模型结构进行修订,提出了新的预测模型结构。然后,以新的预测模型结构为基础建立了客户流失策略管理模型、客户流失特征提取与属性选择方法、客户流失预测模型,对电信业的客户流失预测问题进行了实证考察,从一个新的角度加深了对客户流失的规律理解。最后,对控制客户流失的策略进行了研究。现总结如下一、提出一种新的客户流失预测模型结构,以一种崭新的思路研究客户流失问题。根据客户数据的特点和现用预测方式的不足,采用特征提取、属性选择、预测模型设计的预测新思路来研究客户流失问题。通过对新模型结构实现算法和实证的研究,证明了新模型结构比现用模型结构更加有效。二、应用基于企业竞争的Delta策略模型,提出一种用于电信业的客户流失管理策略模型(CMSM)。通过使用某电信企业客户流失数据集,对CMSM进行了验证。其结果表明,该模型描述了客户流失的原因且包含了与企业竞争策略相关的主要预测因子,从而使其实际应用更易控制。叁、利用特征提取和指标属性选择方法,对电信业客户流失预测进行实证分析。主要结论是1、将核主成分分析(KPCA)引入到客户流失预测中,提出了相应的特征提取算法,将KPCA与Logistic回归结合,设计了预测模型。对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于原始属性集和主成分分析(PCA)特征提取法。这表明KPCA能提取客户数据的非线性特征,是研究客户流失预测问题的有效方法。2、将信息增益(IG)引入到客户流失预测中,提出了相应的属性选择算法,将IG与神经网络(NN)结合,设计信息增益神经网络(IGNN)预测模型。对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于属性相关性选择法、一致性选择法、实例选择法和对称不确定性选择法,这表明IGNN具有比NN更好的预测能力和泛化能力,从而证实了该方法的有效性、可行性和可靠性。3、客户流失预测中的属性选择是一个满意优化问题。针对已有属性选择方法较少考虑属性获取代价和属性集维数的自动确定问题,提出一种满意属性选择方法(SASM),将样本分类性能、属性集维数和属性提取复杂性等多种因素综合考虑。给出属性满意度和属性集满意度定义,设计出满意度函数,导出满意属性集评价准则,详细描述了属性选择算法。对某电信公司客户流失预测的实证结果显示,SASM获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于属性相关性选择法、一致性选择法、实例选择法和对称不确定性选择法。证实了SASM的有效性、可靠性和实用性。4、随着时间跨度增加,利用特征提取和属性选择方法所建立的预测模型,需重新训练,才可能得到满意的结果。四、利用基于结构风险最小化准则的SVM方法,对电信业客户流失预测进行实证分析。主要结论是1、应用标准SVM,研究了电信业客户流失预测问题,并以某电信公司客户流失预测为实例,与人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现,除模型整体准确率、整体准确率置信度区间略低于决策树C4.5外,该方法能获得最好的命中率、覆盖率、提升系数、命中率置信度区间、覆盖率置信度区间、Kappa,是研究客户流失预测问题的有效方法。2、针对目前客户流失预测方法的不足,在利用训练样本中不同类个数比值来确定各类惩罚参数的基础上,改进标准的C支持向量分类机(SVC)。通过以某电信公司客户流失预测为实例,与标准C-SVC、人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现,除模型整体准确率、整体准确率置信度区间略低于ANN,Logistic回归和贝叶斯分类器外,该方法能获得较好的正确率、命中率、覆盖率、提升系数、命中率置信度区间、覆盖率置信度区间、Kappa,是研究客户流失预测问题的有效方法;3、利用简易SVM方法所建的客户流失预测模型,在模型评价结果相当的条件下,其运算花费的时间较小:4、通过对“拒真纳伪”两类错误在客户流失预测中不同影响分析比较,采用SVM作为预测模型,并利用某电信公司实际数据对两类错误的平衡控制进行了研究。实验结果表明,选取一个适当的损失比例系数,预测模型能在控制两类错误的前提下,有效地减少期望损失函数值,这在实际应用中具有反映问题本质的现实意义。5、随时间跨度的增加,预测模型应该重新训练才能得到满意的效果。五、结合客户关系管理理论,从客户价值和客户满意的角度提出了客户流失分类表;然后通过对客户流失进行受力分析,发现导致客户流失的为推力和引力;最后通过引入拉力策略和阻力策略来控制客户流失。

参考文献:

[1]. 基于广义计算和分类回归树的电信业异动客户识别[D]. 李明芳. 浙江大学. 2003

[2]. 基于商务智能的客户流失预测模型与算法研究[D]. 夏国恩. 西南交通大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  

基于广义计算和分类回归树的电信业异动客户识别
下载Doc文档

猜你喜欢