基于多元线性回归的企业信用违约率度量模型构建研究_线性回归论文

基于多元线性回归的企业信用违约率测度模型的构建研究,本文主要内容关键词为:线性论文,企业信用论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、研究背景及意义

1988年,巴塞尔委员会提出了旨在加强银行信用风险监管的巴塞尔协议,要求成员国 银行满足8%的最低资本充足率。尽管如此,由于巴林银行,大和银行的倒闭,亚洲金融 危机和金融创新的迅速发展,人们认识到金融业存在的问题不仅仅是信用风险或市场风 险等单一风险的问题,而是由信用风险、市场风险外加操作风险互相交织、共同作用造 成的。于是巴塞尔委员会在1999年提出了修订框架征求意见第一稿,接着2001年,2003 年又分别提出第二稿,第三稿,并于2004年6月发布了新巴塞尔协议(以下简称新协议) 。新协议框架包括三大支柱:一、最低资本要求;二、监督检查;三、市场约束。而第 一支柱是新协议的核心。新协议要求各商业银行建立自己的内部风险评估机制——内部 评级法来确定资本充足率,要求其至少要实现内部评级法中的初级法;初级法中要求各 个商业银行自己测度违约率。对于国际性大银行,要求他们运用自己的内部评级系统, 决定本行对资本的需求。目前有些银行已经做到了这一点,但更多的银行并没有类似的 体制;另外,委员会提出了一个统一的方案,即“标准化方案”,建议各银行借用外部 评级机构特别是专业评级机构对贷款企业进行评级,根据评级结果决定银行面临的风险 有多大,并为此准备多少的风险准备金。新协议将内部评级法定为银行设置资本充足率 、降低信用风险的基础。而在内部评级法实施的过程中,违约率是核心指标,企业的违 约率测度是关键问题;同时违约率也是银行控制风险,开发信用衍生品,计算资本充足 率的基础。

从国内银行业来看,一方面,我国四大国有商业银行的资产质量较差,资产利润率低 ,不良贷款比率一直较高:2000年为29.12%,2001年为25.14%,2002年为20.19%。我国 国有银行的不良资产比例大大高于国际警戒线水平(国际警戒线一般为10%左右),远远 高于1997年东南亚金融危机前主要受冲击各国银行的不良贷款比率。另一方面,我国已 经加入世界贸易组织并且承诺2006年全面开放金融业,这意味着中国商业银行已经不再 有以前的垄断特权,必须参与同国外银行平等的竞争。因此需要完善自己的内控机制, 增强自身的竞争力,在新的环境和机遇面前求得生存。尽管由于主客观原因,中国银行 业监督管理委员会明确提出中国暂不实施新协议,但银行特别是国内大银行必须提早做 准备以应对国外银行的挑战。因此研究和探讨更加科学、更加有效的违约率测度方法, 为实施内部评级法做准备,是当前信用风险研究的重大课题。

目前国内的研究都只是针对企业是否违约进行的预测,并没有提升或聚焦到违约概率 这个核心指标上来。众所周知,是否违约是个事件,违约率则是这个事件发生的可能性 ,研究未来事件和研究事件发生的可能性是一个问题两个不同的层面。对应信用违约或 财务危机预测,目前大多数研究建立的都是确定性模型,而我们对未来的预测只可能是 建立在事件发生可能性的基础上的。如何将定性指标(违约)转化为定量指标(违约率)在 现有研究中鲜少有人提及,也缺乏专门针对违约率的测度模型研究。针对这一存在的问 题和研究的不足,本文提出一个基于多元线性回归的违约率测度模型,并应用于某商业 银行的违约率测度实践环节。

二、理论综述

目前学术界对借款人信用违约率测度还只是初级阶段,基本都是统计方法,如Moody公 司KMV模型的EDF(Expected Default Frequency)。而大多数模型都针对违约预测,而不 是违约率测度。违约预测的思想来源于模式识别,即把信用违约预测看成是模式识别中 的模式分类问题——根据贷款企业的财务、非财务状况,将其分为正常和违约两类,或 根据已评级结果分为多类,这样信用违约预测就转化为分类问题。从每个类别(两类或 多类)历史样本的数据中找出规律,总结出分类的规则,建立预测模型,然后用于对新 样本的判别。在确定性模型中,它可能是最有效的方法。

国外关于违约预测研究,类似于国外财务困境或危机预测的研究,主要集中于定量方 法的探索,从最简单的单项财务变量,到多个财务变量共同组成一个多变量模型,再到 其它类型的变量逐步纳入进来。

最早的破产预测研究是Fitzpatrick(1932)进行单变量破产预测研究,他选择19家公司 作为样本,运用单个财务比率指标将样本划分为破产和非破产两组,发现判别能力最高 的是净利润/股东权益和股东权益/负债两个比率。尽管Fitzpatrick研究的结果很不错 ,但直到三十多年后的1966年才由Beaver沿着他这条思路继续研究。Beaver(1966)应用 统计方法研究公司失败,并以单变量分析法建立财务危机预测模型。Beaver发现有些财 务比率在两组公司间确有显著不同,其中“现金流量/负债总额”是预测经营失败的最 佳指标,其次为“负债占总资产的比重”以及“资产报酬率”。但是Beaver用单一的财 务指标变量来判别企业的违约概率这样的复杂层面分类,会有很大的问题,因为企业违 约概率的影响因素是多层面,仅用一个指标来判断未免偏颇。

多元线性判别分析模型的典型代表要数Altman著名的Z—score模型和ZETA信用风险模 型。Altman(1968)是率先将多变量分析用于预测财务困境公司,提出了著名的Z—score 模型。他先后使用4个过程,包括(1)各种可选函数(包括每个自由变量的相对贡献的判 决)的统计显著性的观测;(2)相关变量的相关关系评价;(3)各种变量组合预测精度的 观测;(4)专家的意见。最后选出了最具解释力的5个财务指标,分别是营运资金/总负 债、保留利润/总资产、息税前利润/总资产、权益市价/总负债、销售收入/总资产财务 比率。根据比率对借款还本付息的影响程度确定变量权重,最后将每一个比率乘以相应 权重,然后相加,最后结合成一个线性模型,被定名为Z—score模型。同时Altman经过 统计分析和计算最后确定了借款人违约的临界值及区域如下:违约的临界值:Z0 = 2.6 75,判别准则为:如果Z<2.675,为违约组,Z>2.675,为非违约组,当1.81<Z<2.9 9,此时的判断失误较大,称为灰色区域。还发现这5个比率指标构成的线性判别模型在 短期内较为有效,缺点是判别值是一个综合指标,本身意义不大且不受宏观经济环境变 化的影响。于是1977年Altman对此模型进行了修正和扩展,建立了ZETA信用风险模型, 模型变量由5个变为7个。对于此种不同期间导致模型的差异,Altman认为是由于企业环 境的改变而需要使用不同的财务变量,且财务预警模型也可能因使用不同期间的财务报 表而有差异。

利用多元回归模型来判别企业违约的代表是Horrigan(1966)。他使用多元回归模型预 测Moody与S&P的评级,对各个不同的等级赋予主观数值,如Aaa为9,Aa为8,最低为C, 数值为1,依次类推,最后的回归模型包括6个变数:总资产,债券顺位、营运资金/营 运收入、净值/负债,净值周转率与净利率等。其预测的正确率对Moody为58%,S&P为52 %。其次West也使用多元回归模型,利用其预测Moody与S&P的投资级债信评级,将

Fisher(1959)用以估计风险溢价的自变量拿来建立一个多元回归模型,针对Moody评级 在B级以上的公司建立等级决定模型,其变数包括9年的获利变异性、偿债期间、负债权 益比率与在外流通的债券总额等四个,正确率为62%。相对前面的危机预测,两者的准 确率均不算高,原因之一是前面的预测只有两类,非高即低,债信等级预测却可能多达 9个等级,在其他条件固定下,预测正确率下降,事属必然。

Ohlson(1980)首度试图利用假设条件比较宽松的Logistic分析来建立预测模型,并拉 大违约公司与正常对照公司的样本数差异,用1970—1976年间105家破产公司及2058家 正常公司为研究对象。采取9个财务变量来估计模型,实证结果表明,其中4项财务资料 对评估破产概率具有统计显著性,依次是规模(总资产/GNP物价指数后取对数);资本结 构(总负债/总资产);资产报酬率或来自经营的资金/总负债;短期流动性(营运资金/总 资产、流动负债/流动资产),判别正确率也高达92%以上。但也只是2分类问题,对应的 是判别概率而不是真正的违约率。

Altman,Marco(1994)对意大利公司财务危机预测中应用了神经网络分析法。Altman在 对神经网络法和判别分析法的比较研究中得出结论“神经网络分析方法在信用风险识别 和预测中的应用,并没有实质性的优于线性判别模型”。

国内学者针对企业违约与否所做的预测,大致也是遵循国外学者的研究模式进行,所 不同的是对于违约或企业困境的定义。限于国内资料的取得困难,国内学者对企业违约 的预测一般可分为两类:一类是上市公司的财务困境预测(属于违约的一种),主要因为 上市公司的资料容易获得;另一类是商业银行内部客户的违约预测,通过内部渠道获取 银行内部客户资料。

王春峰、万海晖、张维(1998)应用多元线性判别模型对某国有商业银行的企业客户短 期贷款的偿还情况进行了分类分析,最后经过主成分分析确定了5个关键财务比率,分 别为营运资金/资产总额、保留盈余/资产总额、息税前利润/资产总额、普通股、优先 股市场价值总额/负债帐面价值、销售收入/资产总额。研究样本数为129家,违约有65 家,这些样本分为训练样本74家,测试样本55家。把结果与LOGIT模型进行了预测精度 比较,结果显示,在满足判别分析假设的条件下,两种方法各有优劣,判别分析在训练 样本误判要高,而在检验样本准确率要比LOGIT方法高,两种方法在检验样本的准确率 都比训练样本低的多,判别分析在第一类错误率方面要高于LOGIT,在第二类错误率方 面要低。但最终的准确率为90%,是有效的。

王春峰、万海晖、张维(1999)对统计方法(MDA)、神经网络与两者结合的组合预测方法 进行信用风险判别结果的比较。取有效样本为87个企业,选取指标为(现金 + 可售证券 )/资产总额、销售净收入/(现金 + 可售证券)/资产总额)、息税前收益/资产总额、负 债总额/资产总额、固定资产净额/净资本、运营资产/销售净收入等6个,结果表明,神 经网络的误判率几乎在所有情况下都低于统计模型(除了一个测试样本),而组合预测在 所有的情况下的误判率都低于统计方法和神经网络方法,显著提高了判别的准确率,也 证明了在理论上组合预测会提高精度的结果。

管七海、冯宗宪(2004)通过对中国制造业企业信用评级的实证测试,得出资产规模, 地区分布对企业违约有重要影响,并得出多元线性判别,Logistic和神经网络模型针对 不同的样本,模型不同,所选的变量也各不相同的结论。

三、技术路线、数据预处理与指标选取

针对上面的问题,我们考虑使用概率的经验定义(Damodar N.Guigrati,2000),即频 率,把上述判定企业违约的问题转化为测定企业违约率的问题,并且提出一个违约率测 度模型。

1.技术路线

首先,我们假设:(1)违约率在[0,1]的区间上是连续分布的。(2)所有对违约有影响 的因素也必然对违约率有影响。(3)总体企业信用违约率呈正态分布。

假设(1)的合理性在于:a.违约率是个概率,必然满足定义域在[0,1]中;b.我们需要 违约率是个定量指标,而且还是定比尺度,即各个违约率之间是可比的。假设(2)的合 理性显而易见。当在大样本条件下,假设(3)也比较合理。

然后,应用多元线性回归建立模型并进行检验。我们应用多元线性回归的理由如下:a .我们所要做的工作是数据拟合;b.建立模型应由浅入深,遵循简单、明了、实用的原 则;c.模型的解释力较强,并且解析度较高(解析度指自变量对应变量影响的可分解性) 。

具体做法上,我们将某商业银行内部信贷台帐系统中的所有企业作为研究对象,提取 全部财务报表、信贷记录和信用等级资料,将对企业违约有影响的定量因素作为测度企 业违约率的自变量,统计出每一信用等级的违约频率,作为这一等级所有企业违约率的 观察值,即应变量。由此,从等级违约率过渡到企业违约率,然后运用多元线性回归, 建立企业的违约率测度模型,并进一步得到预测违约率。

2.数据预处理

本文提取了全部2001年有短期信贷业务的企业2000年末财务数据包括资产负债表和利 润分配表(由于银行会计制度的变化,银行现金流量表还不完整,所以没有提取)。然后 进行逻辑关系检验和空值处理,删除财务数据不合格的样点。

3.指标选取和模型确定

在洗选的基础上,我们提取所有合规企业2000年末的信用等级数据,记录2001年中实 际短期贷款发生情况。用每一信用等级的违约企业数除以同等级所有企业数,得到这个 等级的违约率,即PD,作为因变量。参照国内外学者们对违约的影响因素的研究成果, 同时结合国内贷款企业的实际情况,选取了29个能够直接从财务报表中计算出来的对企 业违约有影响的指标;根据假设(2),本文认为这29个指标也是对违约率有影响的指标 ,因此可以选作自变量。具体如下表:

注:括号内是实证中指标的表示符号。

四、实证分析

笔者用SPSS软件对2000年样本容量为6535的样本进行逐步多元线性回归(茆诗松等,20 03)得到模型1。本文选取进入指标的F的概率为0.05,删除指标的F的概率为0.1,经过7 步最终获得7个指标依次是资产负债率、成本费用利润率、主营业务利润率、全部资本 化比率、经营活动净现金流量/总债务、净利润率、资本增长率。笔者用dffits统计量 检测样点的有影响的观察(其中p为所选指标数,n为样本容量),认为此样点 为影响点。结果发现存在76个有影响的观察点。剔除这些样点后对容量为6459的新样本 再进行逐步多元线性回归得到模型2,经过5步最终获得依次是资产负债率,成本费用利 润率,主营业务利润率,全部资本化比率,行业债务结构的特征值这5个指标。模型的 描述性检验结果如下:

表2 模型的检验结果

模型 平方和自由度 F值

显著性p值

R[2]

调整后的R[2]

回归24.647

7 2479.906 0.000* 0.727

0.726

1 残差 9.2696528

总体33.9166535

回归23.937

5 3810.607 0.000* 0.747

0.747

2 残差 8.1086454

总体32.0456459

*表示这个系数小于0.0005。

*表示这个系数小于0.0005。

表2中模型的F检验显著说明5个自变量整体对因变量有明显影响,调整后的R[2]为0.74 7,说明方程的拟合优度较好。由表3可看出最后入选的5个指标在0.05的显著性水平下 都是显著的。由于VIF<10(表3的共线性统计量),所以不存在共线性。这样,就得到整 理后的违约率测度模型如下:

预测PD = 0.08773×ri01 + 0.00131×ri05 + 0.00171×ri07 + 0.00941×ri17 - 0.05241×ri19 (1)

从公式(1)可看到,本文使用的是无截距的回归方程,这是因为信用违约率测度模型中 ,当其它指标都为0时,pd也应该为0。

根据公式(1)本文计算出了所有企业预测违约率,并且根据预测违约率画出直方图如下 :

从图1中可以看出,预测违约率呈稍向右偏的分布,这表明如果银行预期某企业的违约 率越高,银行贷款就会越谨慎。为了降低风险,银行自然会减少贷款笔数和降低授信额 度。由于我们的样本容量足够大,因此预测违约率的分布接近正态分布(见图1),并且 我们经由PP图(见图2)也可以得出这个结论。从图1中看到预测违约率中,有些值是小于 0的,我们由模型得到预测违约率的区间是[-0.01141,0.22946],显然这与概率的定义 矛盾,这是因为异常值的影响(经统计,小于0的预测值共有9个),而多元线性回归方法 对此无能为力(多元回归方法对于应变量的定义域是(-∞,∞))。因此,需要进行修正 ,把这些值转换成通常意义上的概率。经过对实际样本的统计发现,企业客户的违约率 区间是[1%,30%],由此根据我国实际,我们把违约率小于1%的样点的违约率设定为1% ,把大于30%的社定为30%(违约率值越小越好,因此如果实际违约率最低值是1%,就可 以把预测违约率按1%看待)。国际上著名的穆迪公司使用KMV模型给出的违约率的参考区 间[0.02%,20%],即违约率的上限为20%,下限为0.02%。如果按照这一标准衡量,中国 企业的信用状况确实令人堪忧,而作为债权人的商业银行的资产自然质量低劣,不良贷 款率高,市场竞争力孱弱。

五、结论

由于金融全球化的发展,新巴塞尔协议无疑将成为业界的规范。因此精确测度违约率 将提高银行自身抗风险的能力,大大地提升银行的市场竞争力。我们对某商业银行的信 贷台帐系统运用了多元线性回归来拟合企业的违约率,在目前文献中还未见有用模型方 法测度企业信用违约率的研究,从统计检验得知模型是有效的,应用多元线性回归测度 违约率的结果比较理想。这为今后更精确的测度违约率和违约损失率提供了全新的视角 ,为实施新巴塞尔协议奠定了基础。

当然,还存在下面一些问题值得继续研究:

首先,从方法上来看,在我国目前条件下,商业银行只是简单的运用模型来进行内部 评级是很不够的。这是因为:第一,某些风险因素主观性非常强;第二,模型需要的数 据有时不能完全取得;第三,模型的适用性还有待于压力测试;第四,由于现实中存在 信用等级分类,模型的假设(3)是否合理值得商榷,是总体服从正态分布,还是各个等 级内服从正态分布?所以我们在内部评级中,应该使用定量、定性相结合的方法,既避 免定性因素的主观性又可以减少定量分析的片面性。

其次,从指标变量上看,由于需要考虑行业,规模,地区因素的影响,可以分行业, 分规模,分地区的进行线性回归,这样模型精度可能会更高。

再次,企业信用风险分析仅仅以财务指标为主是远远不够的,因为财务指标虽然客观 ,但是能够说明的企业特征是有限的。所以还应该考虑非财务因素分析,即在定量分析 的基础上对影响债务人信用风险的非财务因素进行定性分析,以全面、真实、动态的反 映债务人的信用风险程度。比如一个企业的规模会影响到该企业的信用度:规模大的企 业经营、融资、投资活动自然就稳定,企业抗风险能力要比规模小的企业抗风险能力强 。一个企业所处的行业同样会影响企业的信用等级和违约状况:处于夕阳产业的企业肯 定要比同规模的朝阳产业的企业面临的风险大。因此可以考虑将一些定性的因素用变量 的形式在模型中表示出来。

最后,从样本数据的真实性上看,虽然数据进行了逻辑检验和异常值的剔除,但是还 需从根本上设法对通过了会计审核的财务数据的真伪性进行科学的鉴定。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于多元线性回归的企业信用违约率度量模型构建研究_线性回归论文
下载Doc文档

猜你喜欢