(北京交通大学海滨学院 061100)
摘要:
本次论文,首先采用熵值法原理对所提供的数据确定各个指标的熵,根据信息熵的大小确定信息的无序度,信息的效用值以及指标的权重。其次,利用K-means算法,找出样本所聚集的类个数并找出每一个样本点归属的类,对续保数据中的车辆类型、用途、车龄、客户类型、NCD、风险类别进行数据合并优化,进行图形画像表示。
最后,采用逐步回归统计方法针对出险次数、车龄、使用性质、车辆品牌以及购买价进行量化处理,利用数据拟合得出各个因子的权重,分析影响因素。主要针对车辆驾驶员的驾驶行为对保险价格的影响,设计关于驾驶行为的优惠政策。对同价位车型与车辆价格对保险价格的影响,求得续保客户的续保权重及在续保人的中各个方面所占的比例,用现有的因素进行权重计算,得到新的影响因数的分配比例,在对不同客户进行保费计算时,灵活分配符合其权重。
关键词:车险续保 逐步回归 拟合优化 续保率因素
一、问题背景
由于居民收入和消费水平的不断提高,汽车的拥有量也在不断提高,车险自然受到越来越多的关注。连续多年,汽车保险稳居国内产险业第一大险种,对于财产保险公司来说,得车险者得天下,就目前的情况来看,各财险公司之间的竞争也日趋激烈。为了提高利润率,车险公司对于承保车辆的重视程度也在不断提高。
二、问题重述
(1)首先需要根据附件一中的数据,采用熵值法原理确定评价指标的最大及最小值,将k-means算法得出聚类中心,通过Origin仿真进行精准画像,得出客户的续保概率。
(2)基于问题一,采用逐步回归选择重要变量,将剩余标准差最小作为衡量变量选择的一个数据标准。利用仿真结果得出,最后为提高续保概率进而根据不同客户的不同需求设计不同的优惠和福利方案。
三、问题分析
汽车保险公司作为一个企业,追求的是尽可能多的利润。但是这不能仅仅依靠增加保险费用来实现。从实际情况出发,如果保险费越高,投保人数就会相应减少。此外,客源还会受到多种因素的影响,如社会风险意识、社会汽车拥有量、国民经济发展状况、公司广告宣传等众多因素。汽车保险公司的支出主要是索赔费,让利和正常支出,虽然车祸对于个人来说是随机的,但对于整个社会来说,它是趋于一个稳定值。
四、模型的建立与求解
4.1问题一模型的建立与求解
熵值法原理: 熵的概念源于热力学,是对系统状态不确定性的一种度量。在信息论中,信息是系统有序程度的一种度量。而熵是系统无序程度的一种度量,两者绝对值相等,但符号相反。根据此性质,可以利用评价中各方案的固有信息,通过熵值法得到各个指标的信息熵,信息熵越小,信息的无序度越低,其信息的效用值越大,指标的权重越大。我们应用机器学习--无监督学习之K-means聚类方法。
4.2模型求解
4.2.1车辆类型画像
对续保的数据中的车辆类型进行图形表示,发现续保的车辆中最多的是6座以下的客车,其他车辆数目大多相同。
4.2.9续保率计算
以目标客户数据为最终选择标准,以上面8个数据源为计算依据,即
续保的客户数=目标客户数*目标客户续保率,由于风险类别里面的数据严重不足,所以舍掉。
通过处理,得到剩下7个影响因数的熵值(),差异系数(),和权重()。结论:所以按模型一得到的各项熵值的比重,为了能够提高销售效率,降低客户等待时间,每次销售能搜集客户三个方面的驾驶习惯信息为车辆用途,车辆价格,NCD。
4.2问题二模型的建立与求解
根据模型一,观察部分车险续保数据:各项乘以权重相加除以总续保数。
结论:出险次数、使用性质、年龄、承保渠道、购买价格对续保率存在影响,但是影响效果逐渐降低
五、参考文献
[1] 谢启南,韩兆洲,《统计学原理(第六版)》,暨南大学出版社,2006-9-1。
[2] 李玉泉,《责任保险与索赔理赔》,人民法院出版社,2002。
[3] 吴建国,《数学建模案例精编》,中国水利水电出版社,2005。
[4] 姚壬云,《保险公司竞争力评价指标体系的构建》,金融教学与研究[J].2004(1)62-64。
论文作者:张序杰,李宏波
论文发表刊物:《工程管理前沿》2019年11期
论文发表时间:2019/9/30
标签:权重论文; 车辆论文; 客户论文; 数据论文; 信息论文; 车险论文; 模型论文; 《工程管理前沿》2019年11期论文;