我国商业银行信用风险识别的多模型比较研究,本文主要内容关键词为:商业银行论文,多模论文,信用风险论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、学术综述 目前,流行的信用风险识别方法主要可以分为三类:第一类是偏重定性分析的模糊判别法;第二类是偏重计量分析的定量方法;第三类是采用现代计算技术的高级人工智能方法。在模糊判别法方面,周春喜等(2004)运用模糊数学理论对银行信用风险进行综合评价;刘澄等(2012)采用可信性理论识别和度量商业银行对中小企业的信贷风险。这些方法虽然加深了人们对信用风险构成要素的理解,但由于更偏重于定性的方式,个人的主观判断对最终结果产生较大影响,因而并未发展成为信用风险识别的主流方法。在此背景下,采用计量分析识别信用风险逐渐成为该领域的主流,近年诞生了一些有价值的成果。如利用贝叶斯判别及其相关的改进方法识别信用风险(陆静等,2012);采用KMV模型及其改进方法识别信用风险(张玲等,2004);利用Logistic回归模型及相关的改进方法识别银行信用风险等(于立勇等,2004)。计量风险方法由于更侧重于基础数据的实证结果,撇开了过多的人为主观因素干扰,因而在业界获得一定的应用和推广。伴随着计算机技术的快速发展,利用人工智能的方法识别信用风险为该领域的研究开辟了新的方向。有学者采用神经网络及相关的改进算法识别信用风险(庞素琳等,2005);还有学者采用支持向量机及相关的改进算法识别信用风险(沈沛龙,2010)。人工智能算法以高效、智能而著称,尤其得到了发达国家金融机构的一致认可。 然而我国商业银行信用风险管理和识别手段仍然处于初级发展阶段,与发达国家相比还存在一定差距,并且相关信用基础数据的缺失,为该领域的研究制造了屏障。鉴于此,本文利用可得的企业财务数据,建立全面系统的信用风险识别指标体系,针对目前国际流行的计量分析和人工智能的信用风险识别技术,选取贝叶斯判别分析法、Logistic回归模型和BP神经网络模型进行系统分析和比较研究,以期为我国商业银行选择和使用合适的信用风险识别技术提供有意义的参考。 二、商业银行信用风险识别指标体系与样本选取 笔者提出对企业客户进行信用风险识别指标体系,包括短期偿债指标等7个一级指标,并进一步把这些一级指标分解为29个二级指标,具体内容如下页表1所示。 由于国内目前还没有建立公开的信用贷款数据库,考虑到财务数据的可得性,学者通常选取上市公司作为研究样本,以ST和*ST公司代表有违约风险的公司,即非健康公司;以非ST来代表无违约风险的公司,即健康公司。在此,笔者利用一般性的研究经验,选取截至2013年3月沪深A股主板中ST及*ST股票共计78只作为非健康公司样本。首先对这78个样本进行数据预处理,对财务指标及其他指标不全的样本进行剔除,共剔除12个样本,获得有效数据66个。 按照ST及*ST公司的分布,在每一大类行业中按照1:4的比例随机选取264家非ST公司,作为低风险公司样本,即健康公司样本。经数据预处理后,剔除5家公司,剩余259家。最终共得到有效样本325个,其中非健康公司66家(以1表示)、健康公司259家(以0表示)。选取该325家公司2011年年报的数据作为模型训练样本,2012年年报数据作为模型预测样本。 本文选取的各财务指标数据均来自上市公司公布的年报,其他数据来源于锐思金融数据库。 三、商业银行信用风险识别的多模型实证 笔者将分别通过贝叶斯判别分析、Logistic回归判别分析、BP人工神经网络三种方法对选取的健康公司和非健康公司的信用风险进行识别。假定将非健康公司判为健康公司,称为犯第一类错误,即“纳伪”;将健康公司判为非健康公司,称为犯第二类错误,即“拒真”。利用三类模型识别企业信用风险时,将统计各个模型犯两类错误的概率。 (一)基于贝叶斯判别分析法的实证分析 1.逐步剔除法筛选变量 由于变量之间较强的相关性,这里采取Wilks' Lambda逐步剔出的方法,其中进入判别函数的最小F值为3.84,剔出判别函数的最大F值为2.71,当F≥3.84时进入模型,当F≤2.71时从模型中移出,检验结果如第97页表2所示。 2.贝叶斯判别法的实证检验 贝叶斯判别函数就是计算每个样本的后验概率和错判率,用最大后验概率来划分样本的分类使得期望损失最小,即期望损失最小原则或期望错判率最小原则。首先对判别函数的有效性进行检验,检验结果如下页表3所示。 从表3可以看出,在0.05的显著性水平下,不同组的平均Fisher判别函数值存在显著差异,这意味着判别函数是有效的。进而计算各自的协方差矩阵,最终得到两类公司的贝叶斯判别函数如下: 非健康公司的贝叶斯判别函数: 健康公司的贝叶斯判别函数: 然后,应用上述贝叶斯判别函数对训练样本内个体进行检验,得到识别的结果如表4所示。 表4显示,在贝叶斯判别分析中,犯第一类错误的概率过高,超过40%;模型总的判别正确率小于90%,整体识别率仍然不高。进一步,应用测试样本,检验贝叶斯判别模型的预测能力,得到结果如表5所示。 表5表明,判别模型对于测试样本,犯第一类错误的概率超过60%,较训练样本判断准确率有大幅增加;总的判断识别正确率为略低于训练样本判定的准确率,模型对两类公司信用风险的识别能力一般。 总体而言,无论对于训练样本或是测试样本,贝叶斯判别分析法能够较好地分辨出健康公司,但是对非健康公司的判别力较差。然而,将非健康公司误判为健康公司会给商业银行带来更大的信用风险,使银行其蒙受更大的损失。因此,对银行而言,判别分析模型不是一个很合适的方法,而银行一旦采用该方法,首先需要严格控制犯第一类错误的可能性。 (二)基于Logisitic回归分析模型的实证分析 利用这7个指标,构建的Logistic回归模型结果如表6所示。 回归结果显示,除常数项外,其余变量的置信度达到95%以上,模型的7个变量都是显著的。其中,企业短期偿债能力、企业长期偿债能力、企业盈利能力、企业营运能力、企业规模5个方面因素对企业信用状况具有较大影响。各变量的Wald统计量的比较结果表明,总资产报酬率()对模型影响最大,其次就是每股收益()和现金流动负债比(),这3个变量对企业信用风险的影响较大。总体上,在Logistic回归模型中,表征企业盈利能力和短期偿债能力的指标对信用风险的大小具有解释力。此外,从模型的回归系数符合可以看出,解释变量与企业信用风险的概率呈负相关关系,这表明企业的盈利能力、偿债能力、运营能力越强,企业规模越大,违约的可能性就会越小。 根据表6的回归结果,可以得到信用风险识别Logistic模型表达式: 选择临界值为0.5,对训练样本中的325家公司应用上述Logisitic回归进行判别分析,最终得到判错和判对结果如表7所示。 对于训练样本Logistic回归结果显示,犯第一、二类错误的概率大约分别在40%和4%左右,都略低于贝叶斯判别法的错误率;并且模型总的判别正确率接近90%,这一结果也要优于贝叶斯判别法。 应用测试样本,检验Logistic回归模型的预测能力。表8显示,检验模型犯第一类错误的概率超过60%,较训练样本的准确率有所下降,与贝叶斯判别方法的准确率持平;检验模型犯第二类错误的概率较训练样本的准确率有所提升,也要高于贝叶斯判别方法的准确率;识别总正确率仍然低于90%,并且还略低于对训练样本的准确率,但要高于贝叶斯判别方法的准确率。 (三)基于BP人工神经网络模型的实证分析 运用mapmaxmin函数对于训练样本、预测样本进行数据归一化处理。再利用Matlab软件中BP神经网络工具箱,建立BP神经网络模型对处理后的训练样本进行信用风险识别。 根据前文指标筛选结果,利用筛选出的17个财务指标表征公司的健康状况,作为输入指标,公司健康作为输出指标。目标误差设定为0.00001,最大迭代次数为10000次,对325个样本进行训练以构建优化的模型。通过对不同隐含层节点信用风险识别的比较,最终发现当隐含层节点数为16时,模型识别的正确率最高,具体结果如表9所示。 识别结果表明,BP神经网络模型对训练样本信用风险的判断,无论是总体的识别率,还是对健康组合非健康组的识别率都要远高于贝叶斯方法和Logistic回归模型的方法。 因此,利用训练样本得出的训练模型,对325个测试样本进行检测,以考察模型的识别能力。最终,在训练迭代1925次时,迭代停止,得到最佳的识别结果,具体内容如表10所示。 识别的结果显示,BP神经网络模型对测试样本信用风险的判断无论是总体的识别率,还是对健康组合非健康组的识别率都要远高于贝叶斯方法和Logistic回归模型的方法。尤其是在对健康组信用风险的识别中,错误率几近于零,而对非健康组信用风险的识别中,仍然保有较小的错误概率,但识别的效果已经完胜贝叶斯方法和Logistic回归模型。 四、实证结果比较分析 (一)模型变量解释力的比较 贝叶斯判别方法的结果表明,影响信用风险的四方面因素由强到弱排列分别为:盈利能力、现金流量状况、成长性和短期偿债能力。而Logistic回归模型的结果表明,显著影响信用风险共包含企业的五方面能力,由强到弱排列分别为盈利能力、短期偿债能力、营运能力、规模和长期偿债能力。贝叶斯判别模型和Logistic回归模型中各个指标的系数代表其对信贷安全的解释能力,两类模型中各个财务指标的解释能力排名如表11所示。 由于体现企业盈利能力的财务指标在两类模型中均对信贷安全具有最强的解释能力,因此它们是银行放贷时最应关注的重要指标。 比较而言,BP神经网络模型是一种黑箱技术,它可以根据样本不断调整模型,提高预测准确率,但却没有解释能力,人们无法根据网络的权值得到输入变量的贡献度,这是神经网络模型的主要缺陷。 (二)模型预测能力的比较 三类模型对训练样本和测试样本信用风险识别准确率如下页图1所示,其中贝叶斯判别法和Logistic回归模型的识别准确率都在90%以下,而BP神经网络模型的识别准确率大幅提升,达到98%左右。从对信用风险的识别率的角度来看,BP神经网络模型应该是银行的首选。尽管如此,三类模型犯第一类错误的概率都相当高,即便是BP神经网络模型的识别结果也不尽如人意,这意味着银行在采用这些模型识别信用风险时,有一定的可能将非健康公司判定为健康公司,从而给银行带来潜在的风险。 (三)模型稳定性的比较 比较三类模型的总误判率,发现BP神经网络模型的总误判率最低,Logistic回归模型次之,贝叶斯判别模型最高。三类模型对测试样本的误判率和对训练样本的误判比相当,表明三模型的泛化能力和稳定性均较强。三类模型综合性能的比较结果如表12所示。 根据以上分析,三类模型在判别银行信用风险上各具特点,其中BP神经网络模型对信用风险的识别正确率较高,但对指标的解释能力较差,不易于工作人员的定性分析;而另外两种模型对信用风险识别的正确率稍低,但模型的指标解释能力较强,便于工作人员对信贷企业财务状况进行定性分析。因此,结合这三类模型的特点,如果综合采用BP神经网络模型和Logistic回归模型进行信用风险识别,将取得更好的效果。 本文以我国A股主板市场中66家ST及*ST公司、259家非ST公司分别作为非健康公司和健康公司样本进行实证研究。以上述325家公司2011年和2012年的财务数据作为训练样本和测试样本,分别利用贝叶斯判别法、Logistic回归模型和BP神经网络模型对信用风险进行识别,进而比较三类模型的准确性、预测能力和稳定性,主要得到如下结论: 1.贝叶斯判别法、Logistic回归模型和BP模型神经网络模型对企业信用风险识别的准确率依次增高,尤其是BP神经网络模型对风险识别的正确率超过95%,而其他两类模型对风险识别的正确率均在90%以下。三类模型犯第一类错误的概率均较高,均存在稍大的可能性将非健康公司识别为健康公司。 2.贝叶斯判别法和Logistic回归模型对判别结果具有很好的解释能力,能够通过具体的财务指标解释企业的信用状况。其中,体现企业盈利能力和短期偿债能力的指标最能反映企业的信用状况,而BP神经网络模型的识别过程是一个黑箱,模型缺乏对识别结果的解释能力。 因此,在对企业进行信用风险识别时,银行如果能够综合采用BP神经网络模型和Logistic回归模型来共同判断企业的信用状况,将会取得更好的信用风险识别效果。任何一类模型识别出企业可能存在违约的风险,银行都需要谨慎对待。定量分析与定性分析相结合的方法将帮助商业银行提升信用风险识别成功的概率。根据贝叶斯判别法和Logistic回归模型识别出来的影响企业信用状况的几类重要指标,可以视为体现企业信用状况的关键指标。通过对这些定性的财务指标的严格审查,配合定量模型的判断,将能够有效提升银行信用风险识别的成功概率。标签:信用风险论文; 贝叶斯论文; 神经网络模型论文; 贝叶斯分类算法论文; 回归模型论文; 判别分析论文; 银行风险论文; 概率计算论文; 能力模型论文; 风险模型论文; 银行论文; 模型公司论文; 商业银行论文; bp神经网络论文;