基于多分类器动态集成的P2P违约风险评估

胡忠义¹王超群¹ 陈远^1,2 吴江¹鲍玉昆³

(1.武汉大学信息管理学院； 2.武汉大学信息资源研究中心； 3.华中科技大学管理学院)

摘要：针对P2P违约风险评估问题，构建基于K均值聚类的多分类器动态集成模型。通过K均值聚类将P2P借贷样本集划分为多个区域，并在每个区域分别构建多个基分类器模型，进行多分类器集成；在给定新的测试样本时，基于样本特征动态选择样本归属区域的基分类器，进行模型集成与违约风险评估。以Lending Club借款数据为例，对网贷违约风险评估进行实证分析表明，基于多分类器动态集成的P2P违约评估模型，比单一模型和静态集成模型的准确性更好，且基于神经网络的动态集成模型效果最好。

关键词： P2P网络借贷；多分类器集成；动态选择； K均值聚类

随着互联网的快速发展，P2P网络借贷(peer-to-peer online lending)迅速兴起。在这一模式下，电子商务技术、互联网技术、金融服务模式和民间借贷等实现了有效融合，通过网络可直接促成借贷行为的实现。和传统金融模式相比，P2P借贷收益高、速度快、方便灵活、交易对象范围广，不仅能为中小型投资者提供高收益的便捷投资机会，同时还能改善我国小微企业融资难的困境。

P2P网贷行业在飞速发展中遇到了信用风险、技术风险、合规风险等一系列风险防范的挑战。其中，借款人的信用风险是P2P平台面临的最突出的风险与挑战之一^[1,2]。一方面，P2P网贷因网络环境的特殊性导致信息不对称现象严重，虚假信息难以甄别^[3]；另一方面，随着P2P网贷行业的快速发展和信息技术的提高，网贷平台每天产生大量繁杂的网贷交易数据、借贷信息与用户信息^[4]，这些海量数据在为综合评估P2P用户信用与违约风险提供便捷性的同时，也增加了高效评估P2P借贷违约风险的难度。由此，利用P2P网贷中的繁杂数据构建更为有效的P2P用户违约风险评估模型，有效识别网贷用户的违约风险，对P2P平台保护投资者利益、控制运营风险及保障平台健康发展有重要的现实意义。

新课程改革以来，评价问题出现在了每一个课程教学的过程中，体育教学也不例外。其主要的问题体现在对体育课程的尺度把握上。虽然在新课改的背景下，更为科学、系统的理念、形式出现，使得教学评价有所转变，但是转变的力度却不是很大。因此，就必须对教学评价进行深入的了解，并采取应对措施。

本研究针对P2P个人违约风险评估问题，构建了基于K均值聚类的多分类器动态集成模型。该模型首先依据样本相似性将样本数据划分为多个区域样本子集，然后在各区域样本上构建基于多种基分类器的集成模型；在给定新的测试样本时，基于样本特征，动态地选择区域子集训练的多分类器，并进行集成预测，以提高P2P违约风险评估模型的准确性，为P2P借贷平台准确识别个人借贷风险、保护投资者和平台利益提供一种新的思路和方法。

1 文献回顾

为了有效识别P2P网贷中借款用户的违约风险，国内外学者主要从影响因素和评估模型两个方面对P2P个人违约风险评估问题进行研究。

在影响因素方面，相关学者采用统计方法，量化地研究了借款人的身份信息、社交信息、标的信息等因素对借款人贷款违约的影响。如，JEFFERSON等^[5]基于Prosper网站用户的照片信息，研究用户的外貌与违约的关系。LIN等^[6]通过分析社交网络，得出借款人朋友的身份是否认证以及是否参与平台借款对于借款人是否违约有显著影响。利用Logistic 回归模型，李杰等^[7]认为，借款人的还款能力、还款意愿和线上浏览行为，在一定程度上可以反映借款人是否有违约的风险。另外，借款金额、借款期限、借款利率、借款人的收入、学历和信用评级等，对违约行为也有显著影响^[3,8,9]。

很多学者研究发现冬小麦免耕可以增产，但也有学者指出冬小麦季的免耕措施虽然对土壤物理性状改良、有机碳和氮储量增加、土壤动物多样性有益，但其对作物生产产生了负面效应。一些学者研究发现免耕造成冬小麦产量显著减少，出现减产的原因可能一是因为土壤较高的机械阻力和土壤通气不良，影响作物根系的生长，从而限制了作物对水分和养分的吸收，导致冬小麦出苗困难或麦苗长势较弱；二是冬小麦苗期和返青期的“低温效应”对冬小麦早期生长影响很大，推迟了返青期，最终导致产量下降［8-10］。

(2·Recall ·Precision )/(Recall +Precision ) 。

2.2.1基分类器模型构建

多分类器动态选择是利用新样本自身特征，动态地选择一个或者一组最适合该样本特征、分类效果最好的分类器，因此具有较高的准确率和稳定性，在多分类器系统研究领域已经引起了学者们的广泛关注，并且被认为是最有前途的方法之一^[22]。

2 多分类器动态集成模型构建

为了对P2P个人违约风险进行有效评估，本研究提出基于多分类器动态集成的违约风险评估模型(见图1)。由图1可知，构建的多分类器动态集成模型包括两个重要阶段：多分类器动态选择和多分类器集成。

图1 基于多分类器动态集成的 P2P违约风险评估模型

2.1 多分类器动态选择

我们将数据发布到本文所述系统并进行展现，操作中我们发现，切片读取耗时大约为120～180毫秒，虽然略慢于Arcgis Server，但用户体验已足够良好。在服务端，我们只需开辟几十GB的磁盘空间给切片缓存队列使用，且可以方便快速地更新航拍数据。

为了实现多分类器的动态选择，本研究首先采用高效的K均值聚类技术，将样本集合划分为多个区域。给定P2P借贷样本集D ={x _i },i ∈{1,2,…,N }，K均值聚类将该样本集划分为K 个样本区域C ∈{C _k }，k ∈{1,2,…，K }，其中C _k 表示第k 个样本子集。每个区域的中心(即聚类中心)由区域内所有样本的各变量的均值表示为其中|C _k |表示聚类区域C _k 中的样本个数。K均值聚类的具体步骤如下：①初始化聚类中心，从借贷样本集D 中任意选择K 个借贷样本作为初始聚类中心，即{μ _k }，k ∈{1,2,…,K }；②更新聚类区域的样本，计算各样本x _i 与各聚类中心μ _k 的欧氏距离d _ik =‖x _i -μ _k ‖₂，依据距离最近的聚类中心确定x _i 所属的聚类区域标记将样本x _i 划入到相应的聚类区域，C _λ_i =C _λ_i ∪{x _i }；③更新聚类中心，针对每个区域，采用区域内所有样本变量的均值更新聚类中心，即④重复步骤②③，直至每个聚类中心不再发生变化，算法结束。

判断借款人将来是否会违约是典型的二分类问题。在现实生活中，按时还款的比例远多于违约的比例，违约更容易出现错分；另外，违约的错分代价更大, 因此违约的识别率更重要。本研究基于二分类问题的混淆矩阵(见表2)，采用4种评价指标评价构建模型的违约风险评估性能。表2中, 违约借款样本数目为P ，按时还款样本数目为N ，FP 表示将按时还款样本错分成违约借款的数目，FN 表示将违约借款样本错分成按时还款的数目，TP 和TN 分别表示违约借款和按时还款样本被正确分类的数目。

2.2 多分类器集成

针对前面划分的多个样本区域，分别在每个区域构建多个基分类器，并遵循一定规则，将各自的基分类器集成为最终的违约风险评估模型。图1中的“集成”部分展示了多分类器集成的框架，主要分为基分类器模型构建与基分类器模型集成两个阶段。

传统的财务管理体系，难以应对企业合并重组过程中所产生的财务风险。因此财务部门应统一各环节的财务管理目标，以降低财务风险。例如，财务部门首先要建立起财务交接制度，在该制度中物资变化都应得到责任人的确认。当盘点中出现物资缺失的情况时，责任人将承担赔偿责任。其次，财务部门应在合并重组的过程中，成立闲置资产处置小组。该小组可对企业的产能进行有效评估，从而确定出闲置设备。同时该小组也应当在市场中了解这部分设备的公允价值，并依据市场环境设置浮动范围。若出售价格高出公允价值，处置人应当得到相应的奖励。

上述文献回顾表明，P2P个人违约风险评估受许多因素的影响，基于机器学习技术可以构建有效的违约风险评估模型，且集成模型往往比单一模型更有效。然而，现有基于集成模型的P2P违约风险评估研究中，对所有样本均使用同一个集成模型进行风险评估，属于静态集成模型；没有考虑P2P网络借贷中借贷数据多、样本特征繁杂的情况，限制了集成模型的性能。依据样本特征构建不同的基分类器，并在此基础上实现动态的集成模型(dynamic ensemble model，DEM)^[22]，可以有效弥补传统静态集成模型的缺陷。基于此，本研究提出基于多分类器动态集成的P2P个人违约风险评估模型，将P2P平台借贷样本数据依据样本特征划分成不同的区域，并在每个区域分别构建集成模型；在对样本进行风险评估时，可以动态选择与待测样本最相似区域的集成模型，从而提高P2P个人违约风险评估的准确性。

北京市高等学校师资培训中心（以下简称北京市中心）成立于1992年，受北京市教委和首都师范大学双重领导。中心下设行政办公室、岗前培训办公室、管理干部培训办公室等7个业务科室，现承担的培训项目分为国内培训、国外培训、对外培训三类。其中，国内培训项目包含高校教师岗前培训、教育技术（考试）培训、教师发展基地研修、青年教师教学能力培训、管理干部培训等9项；国外培训项目包含英语教学培训、国外访问学者项目、双语教学及深化培训等，中心国际教育交流办公室负责国外培训和对外项目。

为了构建基分类器模型，本研究选择常用的决策树算法(decision tree，DT)、人工神经网络算法(artificial neural network，ANN)、最邻近分类算法(K-nearest neighbor，KNN)、支持向量机(support vector machine, SVM)、逻辑回归(logistic regression，LR)作为基分类器。考虑到DT、ANN、KNN、SVM和LR是数据挖掘与机器学习领域中常用的建模技术，且本研究的重点是构建多分类器动态集成模型，因此，本研究不对这些基分类器的算法做深入介绍，感兴趣的读者可以参考相关资料^[23]。

基于以上基分类器，通过调整模型结构和参数，在采用K均值聚类划分得到的各区域借贷样本集上，分别训练得到各自区域的违约风险基分类器模型。

2.2.2基分类器模型集成

不同于投票法直接采用计数的方式投票产生集成模型的最终评估结果，学习法基于基分类器模型的评估结果和样本的原始类别标签，构造新的数据集。该数据集中，基分类器模型的预测结果作为变量，样本的原始类别标签作为新数据集的类别标签。以该新数据集为样本数据，重新训练一个次学习器模型，用以预测最终结果。为了实现对基分类器进行非线性集成，本研究分别采用SVM和ANN进行集成模型的训练，以构建不同类型的动态集成模型。基本流程如下：①给定某聚类区域的样本数据，采用DT、ANN、KNN、SVM、LR这5个基分类器训练，得到5个基分类器模型{h _m }，m ∈{1,2,…，5}。②把5个基分类器模型对样本的违约风险预测和样本的真实违约情况作为次级训练集，记为D ′={(h ₁(x _i ),h ₂(x _i ),h ₃(x _i ),h ₄(x _i ),h ₅(x _i ),c _i )}，i ∈{1,2,…，N }，其中，c _i 表示第i 个样本的类别标签。基于该数据集，采用次级分类器(如支持向量机、神经网络等)训练次级分类器模型，用以集成基分类器模型的预测结果。③以次级分类器模型预测的违约风险结果作为动态集成模型的结果。

在本研究所考虑的P2P个人违约风险评估中，模型的输出结果为违约或按时还款两种类别，分别记为1和0，用变量c 表示。假定基于各基分类器训练的模型表示为{h _m }，m ∈{1,2,…,5}，模型h _m 在样本上的评估结果为h _m (x )∈{0,1}。为了将这些基分类器模型集成为最终的集成模型，本研究分别采用投票法和学习法两类方式实现。

投票法采用相对多数投票的方式集成各基分类器模型，即

其中，count (·)表示对c 类别进行计数。该式表明，基分类器结果中票数最多的类别即为样本x 基于集成模型的违约风险评估结果。

对相应的研究过程进行检验发现，结果显示符合构建模型的要求，此外，利用A-MOS17.0将理论转化为具体的结构模型。通过该种方式进行产业扶贫影响的探究，看扶贫参与人员是否对产业扶贫有间接的影响。

3 实证分析

3.1 数据收集和处理

本研究选取Lending Club公开的P2P个人借款数据为研究对象。Lending Club是全球最大的 P2P 网络借贷公司，自2007年创立以来，标准贷款项目放款量的增长趋势迅猛。截至2016年底，该平台已发放了近250亿美元的贷款，拥有超过180万的借款人。该平台公布了大量脱敏的个人借款数据，在已有P2P违约风险研究中引起广泛关注。

表1 P2 P违约风险评估指标

首先，从该平台收集了2007～2015年的个人借款记录，并对数据做初步清洗，删除缺失值过多的样本与指标变量，对离散型指标进行重新编码。然后，通过参考以往文献中指标的选取^[3,20,24]，并结合数据集中可获取的指标，构建了包括借款人基本信息、借款情况、信用记录、个人资产和其他借款比率/费用5个维度的指标体系，包括借款数量、借款利率、年收入、信用等级等26个违约风险评估指标(见表1)。为便于高效地验证评估模型，从数十万条个人借款数据中，随机选取了无违约记录和有违约记录的样本数据各5 000条，共计10 000条P2P借款数据。此外，为了进一步筛选有效的指标变量，降低变量维度，进而提高模型效率与准确性，本研究还采用经典的后向特征选择算法进行特征筛选。最终，剔除掉了V ₁、V ₄、V ₁₁、V ₁₃4个评估指标，仅保留剩余的22个评估指标，用于构建P2P违约风险评估模型。

3.2 模型评价准则

基于K均值聚类，可以将借贷样本划分成K 个区域，每个区域内的样本具有较大的相似性，而区域间的样本相似性较弱。在后续的集成阶段，针对不同区域分别构建该区域违约风险评估的基分类器与集成模型。由此，在给定新的样本数据时，可以依据样本特征的相似性，动态选择样本的归属区域，并采用该区域内的基分类器和集成模型进行预测。

表2 二分类的混淆矩阵

据此得到4类性能评价指标，分别如以下公式所示：算法的准确率为

Accuracy =(TP +TN )/(TP +TN +FP +FN )；

(1)

违约借款样本的查全率(召回率)为

Recall =TP /(TP +FN ) ；

(2)

违约借款样本的查准率为

SVD法所得到的矩阵奇异值,具有唯一性、稳定性和比例不变性等性质.奇异值降噪的关键因素是确定重构相空间的阶数和矩阵重机分离阶数.

Precision =TP /(TP +FP ) ；

(3)

违约借款样本的查全率与查准率的调和平均值(F 值)为

F -measure =

另一方面，随着P2P借贷平台海量数据的产生及机器学习技术的快速发展，基于先进的机器学习构建有效的P2P违约风险评估模型的研究得到较广泛关注。国内外学者先后构建了基于Logistic回归、神经网络、贝叶斯网络、支持向量机等机器学习技术的P2P违约风险评估模型。肖会敏等^[10]基于P2P 网络借贷中借款人的信用评估指标体系，构建了BP 神经网络模型，提高了评估的准确性和可靠性。裴平等^[11]发现，基于贪婪搜索法的贝叶斯网络模型，能够较为准确地进行信用评价。阮素梅等^[12]则运用决策树和支持向量机，构建了违约风险评估模型。但这些基于单一算法构建的违约风险评估模型，泛化能力和稳定性较差^[13]。通过融合若干个基分类器构建集成学习模型(ensemble model，EM)，可以有效提升模型的准确率和稳定性^{[14, 15]}，因此有不少学者提出了基于集成学习的违约风险评估模型。XIA等^[16]基于Bagging和Stacking提出了异构集成评估模型，研究表明，所提模型的效果显著优于单个模型和同质集成模型。HE等^[17]扩展了BalanceCascade方法，研究表明，该方法有效提升了基分类器的综合表现。操玮等^[18]则根据中国网贷数据的实际情况，对比分析了几种常见的集成方法, 探究适合中国P2P个人信用风险预警的方法。MA等^[19]利用用户的电话使用数据(包括通信信息、位置信息和APP信息)，基于Adaboost算法构建了P2P违约预测模型。作为常用的集成学习模型，随机森林的识别效果也显著优于单分类器模型^[4,20,21]。由于能够使用一系列基分类器进行二次学习，集成模型在以上研究中均得到了比单一模型更好的效果。

(4)

由式(4)可知，性能指标F -measure 既考虑违约借款样本的查全率，又考虑其查准率, 只有在查全率和查准率的值都比较大的前提下，F -measure 值才会大，因此能综合地体现出评估模型对按时还款和违约借款的分类效果，而且侧重于体现违约借款样本的分类效果。不同于准确率和F 值对分类模型的性能进行综合评价，查准率与查全率从正类(违约类)的角度评价一个模型的性能。其中，查准率(又名精确率)表示被正确识别出来的违约类占所有被识别为违约类的比例，而查全率(又名召回率)表示违约类被正确识别出来的比例。

4 结果分析

为了有效检验本研究构建的基于K均值聚类的多分类器动态集成模型在P2P违约借款识别中的有效性，采用10折交叉验证的方法进行训练和测试，每组实验均独立重复40次，最后计算40次实验结果的平均值。数据处理、模型训练及结果分析等所有实验均在R语言环境下进行。实验结果与分析如下。

4.1 基于 K均值的聚类

在本研究构建的基于K均值聚类的多分类器动态集成中，首先采用K均值聚类对样本进行区域划分，将具有相似特征的样本归为一类。在进行K均值聚类时，数据的取值范围和K 的取值对聚类结果有较大影响，因此，为了找到最佳K 值，本研究首先对数据进行了z-score标准化处理，然后基于轮廓系数(衡量一个对象与集群的相似程度，轮廓系数的取值范围为-1～1，值越高表明聚类效果越好^[25])筛选最优的K 值。设定K 的范围为2～10，在每个K 值上重复进行50次K均值聚类，以避免局部最优，并计算该K 的平均轮廓系数，结果表明K 取2时轮廓系数最大，聚类效果最佳，因此本实验将样本分为两个区域。进一步计算两个聚类中心的欧氏距离，并由此计算出区域相似度为0.21，远小于1，再次表明这两个区域存在较大差异，有必要进行聚类。各区域违约记录与按时还款记录的样本数见表3。由表3可知，采用K均值聚类划分得到的两个区域，违约记录与按时还款记录的数量是近乎均衡的。

表3 各区域样本分布

4.2 多分类器的动态集成与实验对比

采用DT、ANN、KNN、SVM和LR作为基分类器，分别在区域1和区域2构建分类模型，并分别使用投票法和学习法对基分类器进行动态集成。其中，使用学习法时，分别将SVM和ANN作为次分类器，对基分类器的结果进行集成。根据测试样本与区域1、区域2聚类中心欧氏距离的远近，动态地确定测试样本所属区域和基分类器模型，并分别进行多数投票动态集成模型(DEM-Voting)、支持向量机动态集成模型(DEM-SVM)、神经网络动态集成模型(DEM-ANN)。其中，采用支持向量机动态集成时，对几个常用核函数进行了反复试验，最终确定分别采用线性核函数和高斯核函数，构建线性支持向量机动态集成模型(DEM-lSVM)和非线性支持向量机动态集成模型(DEM-nSVM)。

通过不同形式的专题性质的内容学习，学生可以更全面、更深入地认识和体会课内单篇文本。为了实现教学的有效性，教师应根据教学目标或者学生情况的不同，在教学内容设计时，或选择单篇教学，或选择不同形式的专题教学，这样也会形成同课异构中“异构”的不同精彩。

翻模施工中，混凝土浇筑是最重要的环节。混凝土的拌和生产、浇筑等工序应由专人负责，浇筑前应认真检查模板，将模板表面清理干净，严格按照对称、均匀的原则进行混凝土浇筑。分层振捣，确保浇筑稳固。

另外，为了验证本研究提出的动态集成模型的有效性，将该模型与单一模型、静态集成模型进行了对比。对比模型简要介绍如下：①单一模型是只用一个分类器对所有待测样本进行预测，本次对比实验中选择了本研究使用的基分类器，即DT、ANN、KNN、SVM和LR作为单一模型；②不同于本研究提出的基于聚类的动态集成模型，静态集成模型不考虑样本的特征，而是对所有样本构建相同的基分类器模型和集成模型，本研究选择了几种常见的静态集成模型，包括Bagging、Adaboost、随机森林(random forest，RF)、多数投票法静态集成模型(EM-Voting)、线性支持向量机静态集成模型(EM-lSVM)、非线性支持向量机静态集成模型(EM-nSVM)和神经网络静态集成模型(EM-ANN)。其中，Bagging是采用随机有放回的抽样方法选择训练数据，获得N 个训练集，然后对每个子集采用决策树算法，构造分类器，最终结果为N 个分类器结果的多数投票；Adaboost与Bagging类似，但是抽样和投票的方式与Bagging有所不同，即在这两个过程中考虑了各样本和各分类器的权重；RF是Bagging的扩展，将Bagging和随机特征选择结合起来，引入了随机属性选择；多数投票法采用本研究使用的5个基分类器训练模型，并投票产生最后的预测结果；与动态集成类似，支持向量机静态集成和神经网络静态集成对5个基分类器的结果进行再次学习，获得最后的预测结果。为了保证实验结果的公平性和可比较性，在进行集成的时候，参数的选择和本研究构建的动态集成的参数保持一致。各模型的实验结果见表4。

表4 各模型结果对比

从表4可以看出：①5个单一模型中，分类效果最好的是ANN，准确率为0.849，F 值为0.838，而KNN效果最差，其准确率仅为0.770，F 值为0.762。②静态集成模型中，表现最好的模型是EM-Voting，其准确率为0.865，F 值为0.845；RF和Adaboost的整体表现也不错，其F 值分别为0.838和0.837，比EM-Voting略低；其余4个静态集成模型的F 值相差不是很大，都在0.810左右；EM-lSVM表现相对较差，F 值最小，为0.808。另外，与单一模型相比，静态集成模型的表现整体上要优于单一模型，再次反映出集成模型的优势。③动态集成模型中，DEM-ANN效果最优，准确率为0.868，F 值为0.856；DEM-Voting排名第二，F 值为0.854；DEM-nSVM排名第三，DEM-lSVM的F 值最低，为0.845。④动态集成模型与单一模型、静态集成模型相比，可以看出动态集成模型整体表现要优于单一模型和静态集成模型。尽管动态集成中DEM-lSVM的F 值最低(0.845)，其仍然明显优于所有单一模型的表现；与静态集成模型相比，除了和EM-Voting基本一样外，均明显高于其他静态集成模型。

但是，如果认真审视这些关于工匠精神的研究，不难发现，必须细致分析“工匠精神”的内涵，精确把握工匠精神的要求，才有助于进一步阐发高职业教育如何培育“工匠精神”。“虽然目前学者对‘工匠精神’尚无标准权威的定义，但对其已达成基本一致的共识：工匠精神是对所从事的工作追求精益求精、勇于创新、一丝不苟的精神理念。”[4]143在笔者看来，工匠精神应该从如下四个层次做进一步的阐发：

由表4可知，4种动态集成模型的查全率整体上优于大部分单一模型和静态集成模型。尽管在静态集成模型中，EM-nSVM和EM-ANN的查全率较高(分别为0.827和0.826)，但这两个模型的准确率和查准率很低；特别是它们的查准率(均为0.795)远低于本研究构建的动态集成模型(介于0.930～0.972之间)，这说明有很多按时还款的用户也被误判为违约用户，一定程度上影响了结果的可信度。由此，综合来看，基于多分类器动态集成的P2P违约风险评估模型是有优势的，能够比较准确地判断P2P借款用户的违约风险。

5 统计检验分析

为了进一步验证基于多分类器动态集成的违约风险评估模型取得的效果同单一模型和静态集成模型的显著差异，本研究对结果进行了非参数检验——Wilcoxon符号秩检验。具体地，首先对所有模型独立重复40次试验，获得了每个模型的40个F -measure 值，然后基于F -measure 值对两两模型进行Wilcoxon符号秩检验，结果见表5。在表5中，小于显著性水平0.05的p 值已加粗标注。由表5可知：①单一模型中，ANN的表现显著优于DT、KNN、SVM和LR，且ANN和静态集成模型Adaboost、RF没有显著差异，但是所有动态集成模型的表现都显著优于单一模型；②静态集成模型中，EM-Voting的表现显著优于其他静态集成模型，与动态集成模型相比，除EM-Voting与DEM-lSVM无显著差异外，其余所有动态集成模型的表现都优于静态集成模型；③动态集成模型中，各个模型之间均存在显著差异，其中DEM-ANN效果最好，显著优于其余3个动态集成模型。由统计检验结果可以看出，基于多分类器动态集成的违约风险评估模型，尤其是DEM-ANN能够准确有效地进行P2P个人违约风险评估。

表5 Wilcoxon符号秩检验结果

注：为便于展示，小于10^-8的p 值用0表示。

6 结语

为了有效评估P2P平台借款用户的违约风险，提高违约借款识别准确性，本研究构建了基于多分类器动态集成的P2P 违约风险评估模型。以Lending Club提供的用户借款数据为测试样本，采用基于K均值聚类的多分类器动态集成方法进行违约风险评估模型的构建，并与多个单一模型和静态集成模型进行实验对比与统计检验。研究结果表明：①单一模型中神经网络的分类性能最好，但是整体来看，单一模型的准确性较差；②静态集成模型表现优于单一模型，其中基于多数投票的静态集成模型表现最好；③动态集成模型优于单一模型和静态集成模型，有较高的准确率和稳定性，并且采用神经网络集成的动态集成模型取得的识别效果最优。综上所述，本研究构建的多分类器动态集成模型能够较为准确地识别违约用户，对后续P2P个人违约风险与信用评估模型的研究具有借鉴意义。

然而，本研究在实证研究中，仅采用了来自Lending Club的部分个人借款数据，未来将尝试收集更多国内外P2P网贷平台的借款数据，以验证构建的P2P个人违约风险评估模型的识别性能。此外，未来还将考虑违约还款与按时还款样本数量失衡的问题，进一步改进与提高基于多分类器动态集成的违约风险评估模型。

参考文献

[1] 涂艳, 王翔宇. 基于机器学习的P2P网络借贷违约风险预警研究——来自“拍拍贷”的借贷交易证据[J]. 统计与信息论坛, 2018, 33(6): 69-76.

[2] 董纪昌, 王国梁, 沙思颖, 等. P2P网贷平台信任形成机制研究[J]. 管理学报, 2017, 14(10): 1 532-1 537.

[3] SERRANO-CINCA C, GUTIERREZ-NIETO B, LOPEZ-PALACIOS L. Determinants of Default in P2P Lending[EB/OL].(2015-10-01)[2018-10-23]. https://doi.org/10.1371/journal.pone.0139427.

[4] 柳向东,李凤. 大数据背景下网络借贷的信用风险评估——以人人贷为例[J]. 统计与信息论坛, 2016, 31(5): 41-48.

[5] JEFFERSON D, SIEGEL S, YOUNG L. Trust and Credit: The Role of Appearance in Peer-to-Peer Lending[J]. Review of Financial Studies, 2012, 25(8): 2 455-2 483.

[6] LIN M F, PRABHALA N R, VISWANATHAN S. Judging Borrowers by the Company They Keep: Friendship Networks and Information Asymmetry in Online Peer-to-Peer Lending[J]. Management Science, 2013, 59(1): 17-35.

[7] 李杰, 刘露, CHU C H. P2P网络借贷借款人违约风险影响因素研究[J]. 商业研究, 2018(9): 45-54.

[8] 吕勇斌, 姜艺伟, 张小青. 我国P2P平台网络借贷逾期行为和羊群行为研究[J]. 统计与决策, 2016(4): 162-165.

[9] 李思瑶, 王积田, 柳立超. 基于生存分析的P2P网络借贷违约风险影响因素研究[J]. 经济体制改革, 2016(6): 156-160.

[10] 肖会敏, 侯宇,崔春生. 基于BP神经网络的P2P网贷借款人信用评估[J]. 运筹与管理, 2018, 27(9): 112-118.

[11] 裴平, 郭永济. 基于贝叶斯网络的P2P网贷借款人信用评价模型[J]. 中国经济问题, 2017(2): 29-41.

[12] 阮素梅, 何浩然, 李敬明. P2P借贷中借款人的违约风险评估——基于“人人贷”数据的实证分析[J]. 经济问题, 2017(12): 45-50，99.

[13] LIM M K, SOHN S Y. Cluster-Based Dynamic Scoring Model[J]. Expert Systems with Applications, 2007, 32(2): 427-431.

[14] KO A H R, SABOURIN R, BRITTO A S. From Dynamic Classifier Selection to Dynamic Ensemble Selection[J]. Pattern Recognition, 2008, 41(5): 1 718-1 731.

[15] TSYMBAL A, PECHENIZKIY M, CUNNINGHAM P. Diversity in Search Strategies for Ensemble Feature Selection[J]. Information Fusion, 2005, 6(1): 83-98.

[16] XIA Y F, LIU C Z, DA B, et al. A Novel Heterogeneous Ensemble Credit Scoring Model Based on Bstacking Approach[J]. Expert Systems with Applications, 2018, 93:182-199.

[17] HE H L, ZHANG W Y, ZHANG S. A Novel Ensemble Method for Credit Scoring: Adaption of Different Imbalance Ratios[J]. Expert Systems with Applications, 2018, 98: 105-117.

[18] 操玮, 李灿, 贺婷婷, 等. 基于集成学习的中国P2P网络借贷信用风险预警模型的对比研究[J]. 数据分析与知识发现, 2018,2(10): 65-76.

[19] MA L, ZHAO X, ZHOU Z L, et al. A New Aspect on P2P Online Lending Default Prediction Using Meta-Level Phone Usage Data in China[J]. Decision Support Systems, 2018, 111: 60-71.

[20] MALEKIPIRBAZARI M, AKSAKALLI V. Risk Assessment in Social Lending via Random Forests[J]. Expert Systems with Applications, 2015, 42(10): 4 621-4 631.

[21] 李毅, 姜天英, 刘亚茹. 基于不平衡样本的互联网个人信用评估研究[J]. 统计与信息论坛, 2017, 32(2): 84-90.

[22] CRUZ R M O, SABOURIN R, CAVALCANTI G D C. Dynamic Classifier Selection: Recent Advances and Perspectives[J]. Information Fusion, 2018, 41: 195-216.

[23] 周志华. 机器学习[M]. 北京：清华大学出版社, 2016:73-145.

[24] 张卫国, 卢媛媛,刘勇军. 基于非均衡模糊近似支持向量机的P2P网贷借款人信用风险评估及应用[J]. 系统工程理论与实践, 2018, 38(10): 2 466-2 478.

[25] ROUSSEEUW P J. Silhouettes: A Graphical Aid to the Interpretation and Validation of Cluster Analysis[J]. Journal of Computational & Applied Mathematics, 1987, 20:53-65.

P2P Default Risk Assessment Based on the Dynamic Aggregation of Multiple Classifiers

HU Zhongyi¹ WANG Chaoqun¹ CHEN Yuan¹ WU Jiang¹ BAO Yukun²

(1. Wuhan University, Wuhan, China; 2. Huazhong University of Science and Technology, Wuhan, China)

Abstract ： To evaluate the personal default risk on P2P lending platforms, this study proposes a multiple classifier dynamic aggregation model based on K-means clustering. The samples of P2P lending are divided into several subgroups by means of K-means clustering, and multiple classifiers are built for model aggregation in each subgroup. Given new testing samples, the corresponding multiple classifiers and aggregated model are dynamically selected based on the similarity between the testing samples and subgroups to assess the default risk. Taking dataset from Lending Club as a case of P2P personal credit scoring, the experimental results show that the proposed dynamic aggregation model outperforms both single and static aggregation models; additionally, dynamic aggregation model based on neural network is the best amongst examined models.

Key words ： P2P online lending; multiple classifier aggregation; dynamic selection; K-means clustering

DOI编码： 10.3969/j.issn.1672-884x.2019.06.014

中图法分类号： C93

文献标志码： A

文章编号： 1672- 884X( 2019) 06- 0915- 08

收稿日期：2018-11-15

基金项目：国家自然科学基金资助重大项目(91646206)；国家自然科学基金资助项目(71573197)；国家自然科学基金资助青年项目(71601147)

(编辑桂林)

通讯作者：胡忠义 (1987～)，男，山东泰安人。武汉大学(武汉市 430072)信息管理学院讲师，博士。研究方向为数据挖掘、互联网金融等。E-mail：zhongyi.hu@whu.edu.cn

标签：p2p网络借贷论文; 多分类器集成论文; 动态选择论文; K均值聚类论文; 武汉大学信息管理学院论文; 武汉大学信息资源研究中心论文; 华中科技大学管理学院论文;

基于多分类器动态集成的P2P违约风险评估论文