基于Adaboost-BP神经网络的个人信用评估研究论文_高泽斌1,2,白倬宁1,2,刘帅1,2,刘秋梅1,3

基于Adaboost-BP神经网络的个人信用评估研究论文_高泽斌1,2,白倬宁1,2,刘帅1,2,刘秋梅1,3

1.华北理工大学数学建模创新实验室 河北省唐山市 063210

2.华北理工大学以升创新教育基地 河北省唐山市 063210

3.华北理工大学理学院 河北省唐山市 063210

摘要:随着我国社会主义经济转型,国内各大商业银行积极扩展个人信贷业务。同时为了符合银行风控的要求,个人信用评估体系的建立变得尤为重要。为保证银行和借贷人员双方的利益,根据所给信息以及相关数据,建立对应评估模型至关重要。

关键词:Adaboost-BP神经网络;个人信用评估;研究

引言

伴随着全球市场化,金融自由化的迅猛发展,国内银行业竞争加剧,借贷业务得到大面积推广,个人信贷业务种类也越来越丰富,银行自身对风控评估也愈发重视。

1 课题研究现状

由于我国的个人信用评估系统刚刚起步,且没有统一体系,所以大部分商业银行仍然靠人为审查和人民银行征信系统来进行对借款人优劣的判定。少数大型商业银行则引进国外个人信用评估体系,如招行银行采用了Fairsaac公司的信贷审核决策系统,浦发银行则引入SAS的风险审批系统,这些都对掌握客户基本信息,了解客户还贷能力和风控方面有积极作用,但仍有其自身在某方面与我国国情不符的缺陷。

2 模型建立与求解

2.1 基于BP神经网络的个人信用评估模型的建立

首先,运用MATLAB将数据标准化并随机抽取560名优质客户和240名不良客户作为训练集,其余140名优质客户和60名不良客户作为测试集。基于这些数据,利用基础BP神经网络法和Adaboost改进BP神经网络算法构建模型并进行测试。

(1)权重的修改方式

一般情况下,权重的修改有两种方式:意识对于每个训练集样本,只调整一次权重,称为On-line处理;另一种是输入全部训练集样本之后才修改一次权重,称为Batch处理。本文将采用第二种方式。

期刊文章分类查询,尽在期刊图书馆

(2)初始权重与初始输入的确定

由于输入初始值和初始权重对训练是否达到局部最小和是否收敛的关系很大,有必要对输入的初始值进行归一化处理。

(3)网络层次的选择

网络层次的增加可使各隐层神经元个数减少,同时使训练过程变得更容易,但有可能增加网络的训练时间。本文所建立的模型是用于模式分类的判别函数的神经网络,因此将采用三层BP网络。

(4)隐层神经元个数的确定

对于三层BP网络,确定隐层节点的主要原则是:隐层节点既不是各层中节点数最少的,也不是最多的,隐层节点数介于输入输出节点数之和的53%-70%之间;隐层节点数应小于训练样本数,若节点数大于样本数,则必有多余的节点可归并,若节点数等于样本数,则网络为插值网络,其泛化能力相对较差。

(5)权重的调整公式及训练参数的确定

采用最速下降法调整权重,对那些严重缠绕的非凸函数效果欠佳,往往不易收敛,即使能够收敛也将花费很长时间,这里采用改进BP算法。

(6)训练过程与结果

在训练过程中,在数据集中分别随机抽取80%的数据(560个优质客户和240个不良客户)作为训练集,并进行拟合;将剩余的数据作为测试集,包含140个优质客户和60个不良客户。使用train函数来训练创建的BP神经网络,设置训练步长值为1200,预期误差目标,0.165,根据题中规定,设定最优隐层节点数为20。其运算结果可以看出,经过3次迭代后,达到达到预期误差目标,且训练时间较短,模型较优。

模型训练运算结果可以看出,BP神经网络模型在训练过程中的误差比预期要大,拟合情况一般。

通过计算,得出模型测试正确率为79.50%。然而,此方法虽然运行速度快,而精度并不让人满意,所以本文拟在其基础上加入其他算法,对模型进行改进。

2.2 基于Adaboost的改进算法

通过以上结果可以看出,仅凭BP神经网络算法虽能够建立相应模型,但其性能还不能达到预期,本文将把BP神经网络与Adaboost算法相结合,来对模型进行改进。

2.2.1 Adaboost算法简介

Adaboost算法通过对同一个训练集训练不同的弱分类器,然后将这些弱分类器组合形成强分类器,使弱分类器间能得到互补,从而使组合后得到的强分类器有较强的泛化能力。其核心思想是重视预测误差大的样本和性能较好的弱分类器,即提高训练集中训练效果差的样本权重和学习能力强的弱分类器权重,而训练效果好的样本权重和学习能力弱的弱分类器权重将被降低。初始状态时,每个样本的权重都是相同的,在此样本分布下训练一个基本分类器。根据该分类器对训练集的预测误差来确定来确定该分类器的权重和训练集中各样本的权重,对于预测误差较大的样本,则增加其对应的样本权重;而对于预测误差较小的样本,则降低其权重。在新的样本分布下,再次对得到基本分类器以及其对应的权重。依次经过次循环,可得到个基本分类器和对应的权重向量。最后根据权重向量将个基本分类器组合起来得到强分类器。

2.2.2 对Ada-BP个人信用评估模型的测试及评价

为了根据问题二中的测试结果来对模型做出合理的评价,本文选择了利用模型的预测功能来对误差进行预测,即从测试集中训练不同的弱预测器,然后将这些弱预测器组合成强预测器,再分别用弱预测器和强预测器对误差进行预测。

弱预测器进行预测时样本误差绝对值大多集中在0附近,但有一部分误差其绝对值集中在0.1和0.2周围,而强预测器进行预测时样本误差绝对值多为0,且仅有的个别样本误差绝对值较大,其值也保持在0.2以上,甚至高达0.7。强预测器通过将弱预测器预测时的较大误差的绝对值放大,使研究人员能轻易判断出样本的可靠性,即宁愿把好客户归为坏客户,也不把坏客户归为好客户。

本预测模型将BP神经网络结构设定为21*5*1*1,设置训练步长为14,预期误差目标为0.977,设定最优隐层节点个数为20。观察结果,可以发现在第4次迭代中,得到的模型验证结果最佳。

由模型预测运算结果可以看出,BP神经网络模型在预测过程中拟合度高达95.866%,测试时拟合度也达到了96.137%,综合拟合度为96.152%。再结合上文中误差预测的结果,可评价改进后的模型性能优良。

3 结论

本文基于Adaboost法构造BP神经网络,最终建立了个人评估模型,通过测试结果可明显看出,Ada-BP算法对不同测试集具有良好的适应性,且预测精度也很理想。而缺点在于其步骤较其他方法如Logisitic回归法有些复杂。

参考文献

[1] 陈哲贇,统计方法在个人信用评估体系上的应用[D],华东师范大学,2012.

[2] Kim.DH, Sohn.SY etal Fuzzy analytic hierarchy process applied to technology credit scorecard considering entrepreneurs' psychological and behavioral attributes[J]. Science Citation Index, 2016, 10.3233/IFS-152005.

论文作者:高泽斌1,2,白倬宁1,2,刘帅1,2,刘秋梅1,3

论文发表刊物:《建筑科技》2017年第14期

论文发表时间:2017/12/20

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于Adaboost-BP神经网络的个人信用评估研究论文_高泽斌1,2,白倬宁1,2,刘帅1,2,刘秋梅1,3
下载Doc文档

猜你喜欢