非极端回收不良贷款的回收率预测研究,本文主要内容关键词为:回收率论文,不良贷款论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
入世以后,我国银行体系进行了一系列市场化改革,风险管理体制逐步走向完善,但目前我国依然有着世界上数量最大的不良贷款(non-performing loan)总额。中国四大资产管理公司除了对口接收了国家政策性剥离的1.4万亿元不良资产外,还在中国银行、建设银行、工商银行上市前商业化收购了数千亿不良资产。如何对总量庞大的不良贷款进行管理、风险预警和商业上的收购是当前我国金融改革和发展的关键一环。当前我国商业银行正面临巴塞尔新资本协议广泛实施的压力,不良贷款的信用风险管理是巴塞尔新资本协议(Basel Ⅱ)中的核心内容之一。在巴塞尔新资本协议的内部评级法(IRB)中,提出用违约概率(PD)、违约损失率(LGD)、违约风险暴露(EAD)和有效期限(M)等风险要素来确定风险资本要求。因此不良资产回收率的计量既是巴塞尔新资本协议监管下的重点,也成为资产公司管理及处置不良资产的最基本参照。
鉴于违约损失率或回收率(1-LGD)度量的重要性和复杂性,国外学者对此进行了广泛的研究。Ahman和Kishore(1996)[1]分析了不同行业的违约债务回收率特征。Frye(2000)[2]研究了宏观经济因素在经济衰退阶段对债券和贷款回收率的影响。Frye(2000)[3]分析了影响回收率的重要因素:抵质押品对回收率的影响。Hu和Perraudin(2002)[4]穆迪的数据库建立了预测回收率的简单线性回归模型。Araten和Jacobs(2004)[5]根据JPMorgan Chase的数据分析了美国国内时间跨度18年的商业银行贷款回收率在各行业、各担保级别等方面的差异。Francesca(2005)[7]利用意大利1980至2004年上半年银行贷款回收率考察了影响意大利银行贷款回收率的各种因素。MiXu(2005)[8]比较了中国和东南亚各国不良贷款的处置方法。标准普尔公司和穆迪KMV等在违约损失率的研究领域也取得了重要的成果,得到了研究美国债券和贷款回收率的基本框架。
国内由于债券市场起步晚及贷款数据的不可获得性,对回收率的分析仍处于比较初级的阶段。随着巴塞尔新资本协议的提出,国内学术界和银行界也日益重视回收率的研究。陈忠阳(2004)[12]介绍了LGD的量化方法和主要难点。武剑(2005)[13]探讨了初级和高级评级法下的违约损失率参数估计方法。刘志刚(2007)[14]依托东方资产管理公司旗下的东和数据公司的数据对不良贷款回收率影响因素进行了分析,并对建模提出了初步构造方法。但到目前为止,国内对不良贷款回收率的研究都还仅限于对模型的初步描述和一些影响不良贷款回收率因素的比较分析,尚未建立依托在实证数据上的具体回收率模型,也没有具体提出具有中国特色的影响不良贷款回收率的变量。
针对我国不良贷款的回收率预测模型研究,由于国内与国外贷款方式、法律环境、经济结构,特别是回收规定和运作方式等存在较大的差异,不能照搬照套国外贷款或债券建模的方法。对于运作方式的差异,本文考虑是否能快速变现、提升价值等多个中国特色的运作方式变量;并且引入内资、外资以及合资等企业性质变量来区分不良贷款债务人的经济结构和法律水平差异等;针对最明显的差异,不良贷款回收不以每笔贷款,而以不良贷款债务人为清收单位的回收规定,且我国不良贷款的现状是不良贷款债务人往往涉及二、三十甚至更多笔贷款,影响因素复杂,本文从简单的仅贷单笔贷款的债务人出发,建立可靠的模型,进而引申建立多笔不良贷款债务人的模型,最终预测出以债务人为单位清收的回收率;
2 数据预处理和建模方法描述
2.1 数据预处理
LossMetrics数据库是国内最大的不良贷款回收状况数据库,对我国不良贷款状况有着很高的代表性。本文针对的是数据库中以债务人为单位,而非以资产包组合清收的不良贷款。通过筛选共有3000左右的债务人是非打包方式清收的,而其中有1000余个债务人只涉及单笔贷款。通过数据分析发现我国不良贷款回收与国外有很大差别。最为突出的两个差异是:其一,我国不良贷款的回收中,完全无回收和完全回收(指回收率为0和1的不良贷款,本文称为极端回收不良贷款。对于回收率处于0和1之间的不良贷款,本文称为非极端回收不良贷款)占将近四成(见图1),而国外回收率双峰则为0.2和0.8,且极端回收与非极端回收不良贷款在属性上存在很大差异。
图1 LossMetrics数据库中回收率分布直方图
对于极端回收可用数据挖掘中的分类技术有效的辨别。唐跃(2008)[15]、陈浩(2008)[16]等在Loss-Metrics数据库基础上已经建立了判别率很高的极端回收判别模型。本文研究对象是非极端回收的不良贷款。
其二,由于我国商业银行的信贷政策以及政府指令性信贷等原因,我国不良贷款债务人集合中,存在相当数量的债务人个体涉及二、三十笔贷款数量。而资产管理公司不是以单笔贷款进行清收,而是以相关债务人来清收,因此回收率不应针对单笔贷款回收率,应以债务人单位的回收率为关键。但同一债务人的每笔贷款性质在贷款合约规定、抵押担保性质、到期日等方面因素存在很大差异,因此对有多笔不良贷款债务人的属性描述异常复杂,回收率建模的难度十分大,难以分析各因素对回收率的影响。
针对此种特殊的清收方式,为更好的区分各因素对回收率的影响,本文采用化繁为简的方法:从简单的单笔贷款债务人出发,利用单笔贷款债务人所涉变量的单一和独立性,建立可靠模型,并可清楚分析各因素对不良贷款回收率的影响,再以单笔贷款债务人的模型为基础,分析多笔贷款的债务人,这不仅可得多笔贷款债务人的回收率预测,也可作为对原模型精确度和可靠性的检验,并分析了多笔贷款债务人回收率估计产生的误差,最终建立完整的不良贷款回收率预测模型。
综上两点,根据化繁为简、由少到多的建模思想,以及非极端回收率的范围约束,从仅涉及单笔贷款债务人回收率的模型出发,最终目的是对单多笔贷款债务人的非极端回收不良贷款建立稳定可靠的回收率预测模型。图2为非极端回收的贷款债务人的回收率分布。
图2 (0,1)回收率分布直方图
为模型的实用和可操作性,希望建立某种意义的线性预测模型。而建立线性模型对因变量的一个要求是无值域限制,否则模型预测结果极可能超出值域范围,因此对回收率在(0,1)值域的数据建模,需对数据进行变换,使数据值域为(-∞,+∞);另一要求是因变量的分布需近似正态分布,图2分布显然不满足要求。为达到上述两个目的,通常采用Beta-正态变换或Logit变换。这两种变换都只针对(0,1)开区间才可用,这也是我们建模需要把极端回收排除在外的一个原因。
Beta分布是描述取值为(0,1)的常见分布。利用Beta分布拟合该直方图,可得Beta(α,β)中的参数α=0.834592,β=1.407684。通过Beta-正态变换可把Beta分布转换为常见的正态分布:,这里是标准正态分布函数的逆函数(分位数函数)。数据变换后的直方图分布如图3所示。从转换结果可见新数据基本符合正态分布,数据的值域也大大扩大,可作为线性建模的牢固数据基础。
变换后的数据值
从图4可见,数据经Logit转换结果也接近正态分布,数据变换后的延展性强,更符合线性模型对数据值域无限制的要求。
2.2 建模方法描述
在数据预处理基础上针对变化后服从正态分布的数据建立线性模型来预测不良贷款回收率,尽管线性模型在描述回收率和各个因变量间存在一定局限性,但线性模型中易分析各变量与回收率的增减变化关系、检验和估计也较为准确且稳定性也比较强。
(3)模型异方差和共线性检验对(1)、(2)建立的模型进行是否存在异方差和共线性检验,是检验模型可靠性的一个重要手段。模型是否存在异方差利用White检验,是否存在共线性检验利用方差膨胀因子(VIF)检验。
3 建模过程
本节首先对各类影响因素进行单变量分析,给出中国特色的影响变量,然后以这些变量为基础,利用Logit变换和正态逆变换的回收率数据,建立单笔贷款债务人模型,并校验的模型的合理性;进一步把单笔贷款债务人模型推广到多笔贷款债务人回收率计算上,通过结果的残差分析,证明了由单笔贷款债务人数据建立模型的可靠。
3.1 非极端不良贷款回收率预测模型变量选择
不良贷款的回收率预测模型的关键之一是变量的选择。国际上研究不良资产回收考虑的因素主要是债券的类型和等级、债务人的资产结构、行业因素和宏观经济因素。本节的建模过程不仅考虑了这些因素,更重要考虑了一些具有中国特色的关键变量,包括运作方式、企业性质、经营状况和转让不良贷款银行等多个变量的选择,这些都是国际上从来没有考虑过的因素。
3.1.1 债务人因素
债务人的相关信息直接影响贷款回收率,在国内外的文献中被广泛关注。通过历史平均法发现在不同的债务人条件下,回收率有很大变化。
(1)债务人所属行业、地区:这两个因素是被最广泛关注,不仅体现了各个债务人的信息,且在某种程度上体现了某个地区和行业的宏观表现,不同地区和行业回收率均值变化的二维直方图分布如图5所示。
从图5可见随着地区和行业的变换,不良贷款的回收率波动较大。特别地本文在引入地区和行业变量时,不是以示性变量来表示是否某行业或某地区,而是利用了各行业和各地区平均回收率作为变量。
图5 行业地区回收率均值三维直方图
(2)债务人经营状况:不良贷款债务人的财务状况很大程度上区别于正常贷款债务人,其经营状况相当多的数量是处于经营不善的情况,图6是不良贷款债务人不同经营状况下的贷款回收率图。
图6 不良贷款债务人不同经营状况下的回收率图
从图6可见不同经营状况水平下债务人的债务回收率均值相差较大,在模型中以示性变量来区分经营状况对回收率的影响。而除经营状况不明的企业,随着经营状况从好到差,回收率呈明显递减。
(3)债务人企业性质:通过债务人的企业性质是属于内资企业、外资企业、合资企业和事业单位等,区分债务人经济结构的差异对回收率的影响。
3.1.2 贷款本身因素
(1)贷款的抵质押状况:贷款的抵质押状况是一笔贷款回收状态的基础,由代太山(2008)[17]的文章中可以看到,抵押状况对贷款回收影响重大。本文引入抵质押变量主要划分为三类:贷款是否有抵质押品;贷款是否有保证,且无抵质押品;贷款既无保证也无抵质押品。
(2)贷款的转让和运作方式:贷款是否政策性剥离,包括贷款从哪个银行剥离给资产公司,既是区别于国外通常贷款的中国特色的影响因素,同时也是区分商业性不良贷款和政策性剥离贷款的重要指标;贷款的回收方式则是指快速变现,提升价值等,这也是区别国外的中国特色变量。
(3)贷款五级分类情况:该指标也是区别于正常贷款的重要变量,对不良贷款而言大部分贷款都是次级、可疑、甚至是损失类贷款。贷款分级指标的引入,既是对不良贷款回收率的一个很好的划分,同时也是银行的五级分类很好的反馈。五级分类贷款的回收率如图7所示,从正常到损失类贷款回收率均值基本表现为线性单调下降的关系。
图7 五级分类贷款的回收率图
通过上图贷款五级分类回收率单调下降的关系可以看出,银行业通过五级分类从一定程度上来对贷款进行风险控制是行之有效的。
3.2 单笔贷款债务人模型
3.2.1 模型参数逐步回归分析
由3.1的分析可知,回收率模型采用线性模型不仅简洁、稳定,且不少变量与回收率确实存在线性关系。通过逐步回归的分析方法研究了利用Beta-正态变换和Logit变换下建立的模型影响变量的显著性和差异性,具体结果见下页表1。通过对逐步回归入选变量的对比和归类,既可为多贷款债务人的模型打下基础,也得到对影响回收率的各因素的初步结论:
(1)地区行业因素人选模型。地区、行业作为预测回收率的重要因素与外国文献一致,既说明了模型的可靠,也表现出我国不良贷款的回收率与国外正常和不良贷款部分特征的相同。个体债务人回收率与所在地区、所属行业的平均回收率成正相关,即该地区的经济发展越强,所属行业的前景越好,个体债务人的回收率有增加,一定程度反映出回收率与宏观地区行业经济的关联。注意到地区因素在变量选择中比行业因素更早引入模型,系数也更为显著,地区因素对不良贷款回收率的影响更甚于行业因素,即一个地区总体的经济情况对贷款回收率的影响强于行业周期对回收率的影响。
表1 模型回归结果和模型比较
注:表中括号内的符号表示变量的系数与回收率模型的取值正负情况,具体系数结果可以见表1、表2;(*),*,**,***分别表示的是在逐步回归最后一步中该变量显著性p值小于0.1,0.05,0.01,0.001。
(2)债务人的财务状况是模型的重要指标。是否有财务报表、是否上市公司也是企业财务状况的一个衡量,可见债务人的经营和财务状况对回收率的影响之大。债务人的经营状况水平是债务人是否能还款的信用追踪指标,大量人选的债务人经营状况水平的变量可知,建立系统、完善的债务人信用评级体系是对不良贷款乃至正常贷款回收情况监控的重要手段。
(3)不良贷款是否来自银行1或银行2。由于模型建立在Loss Metric数据库上,来自银行3的贷款基本为政策性剥离的不良贷款,而银行1和银行2的不良贷款是商业性收购的。从系数的相关性来看,相对于银行3的政策性剥离的不良贷款,来自银行1和银行2的商业性收购不良贷款回收率明显更高。
3.2.2 模型可靠性检验和残差分析
(1)模型异方差和共线性检验:利用(6)、(7)式可以对模型进行是否存在异方差和共线性的检验,表2给出White检验和各变量对应的膨胀因子结果。
表2 模型可靠性检验结果
表2的结果可见模型White检验的F统计量不显著,没有线性关系的异方差情况,膨胀因子也普遍比较小,选择的变量间不存在明显的共线性。以上两个检验说明选择的变量对模型有较好的解释力度,选择的变量中也没有明显的共线性,模型的估计和检验都有良好的基础。
(2)残差分析:通过模型估计值变换后得到的预测回收率与真实回收率的比较可以更直观的判断模型的预测精度,利用两种不同的方法建模后再通过式(3)、(4)转换得到预测回收率,用真实回收率减去预测回收率得到的残差结果如图8所示。
图中白色表示正态逆变换的残差,灰色表示Logit变换的残差。从图8可见,两种变换的残差都基本接近正态,且估计误差在0.1内的数据超过五成,为模型的真实可靠性提供了依据,但灰色Logit变换残差在零偏差的频数比白色Beta-正态变换残差的零偏差的频数最大,且对比残差绝对值小于0.1的频数,Logit变换下的结果也略高于Beta-正态变换,整体估计回收率的精度Logit变换的方法更优。
图8 Beta—正态变换和Logit变换下模型残差分布图
3.3 多笔不良贷款债务人回收率预测
本节主要是把单笔贷款债务人模型推广到多笔贷款的债务人,这不仅可推广模型结果,而且可从另一角度检验单笔贷款债务人模型的稳定和可靠性,进一步说明模型从简单到复杂推广的合理性。利用单笔贷款债务人模型计算多笔贷款回收率如下:
(1)以单笔贷款债务人的模型预测出每笔贷款的回收率。
(2)利用每笔贷款的回收率和每笔不良贷款在剥离时的转让金额,计算出每笔贷款预测回收金额。
(3)最终以债务人总的不良贷款金额为单位,利用公式(5)计算出以债务人为个体的预测回收率。
利用前文所述的方法计算出以债务人为单位的预测回收率值,再用真实数值的回收率减去预测回收率值得到数据的残差,Beta-正态变换和Logit变换下涉及多笔贷款的债务人的数据残差如图9所示。
图9 Beta-正态变换和Logit变换下涉及多笔贷款的债务人的数据残差
从图9的数据残差可知,结果基本保持了稳定,残差图基本在-0.1保持了峰值,尾部的概率堆积较小,但分布相对零的左边的概率堆积明显增加了,主要是残差为-0.1的频数大大增加,超过偏差为零的频数,达到近三成,而右尾则明显变轻。从残差图中可以得到如下结论:
(1)从模型由少到多、从简到繁的推广可知,虽然不良贷款的监管和回收是以债务人为单位进行的,但本质是建立在每笔贷款基础上的,因此对多笔贷款的债务人不仅应当监管债务人本身的经营和财务情况,对债务人涉及的每笔贷款,特别是贷款的抵质押品等会随时间变化的因素更应重点监管。
(2)残差=真实值-预测值,残差为-0.1成为直方图的峰值,相对零均值正态分布呈现整体左偏的现象,这说明了预测值一定程度上高估了真实回收率。和仅贷单笔贷款的债务人相比残差图的左偏现象,既是由于模型仅建立在单笔贷款债务人基础上的,而对多笔贷款债务人在回收贷款过程中,往往存在对债务人的整体让利回收,多笔贷款的债务人整体回收率应该比每笔贷款回收加总的情况偏低,这与残差分布左偏的现象相吻合;同时也可能存在债务人的某些因素在多笔贷款间存在相关性,从而影响债务人多笔贷款的回收情况。
(3)模型可靠性由模型外推的残差图可以看出,直方图主要改变是峰值左偏到-0.1,尾部误差较大的频数依然很低,说明模型即使存在高估现象,基本也都控制在10%以内的偏差,可见利用单笔贷款债务人模型来预测多笔贷款债务人回收率的可行性。
4 结语
金融不良资产的处置是我国经济的核心问题之一,在巴塞尔新资本协议在中国即将全面推行和次资金融海啸日益深重的今天显得尤为重要。本文依托LossMetric数据库对我国包括政策性剥离和部分商业转让的非极端回收不良贷款回收率进行了预测模型研究,得到如下结果:
(1)基于我国不良贷款U型Beta分布特征,在极端回收分布达四成的情况和已有的准确判别模型基础上,区分极端回收和非极端回收,针对非极端回收不良贷款数据进行建模。
(2)文章通过从复杂众多的影响因素中筛选出合适准确的变量,首次给出了我国不良贷款模型中具体涉及的预测变量以及变量与不良贷款回收率的相关关系。
(3)结合回收率的Beta-正态变换和Logit变换,采取了一种从简到繁,从少到多方法的建立回收率预测模型,即首先建立逐步回归的单笔不良贷款的回收率预测模型,然后推广到多笔贷款债务人的回收率预测模型。实证结果显示,以上的方法有着较高的可靠性。
本文的建模思想是普适的,即模型的选择需要建立在对数据的深入分析和认识上,然后选择与数据相适应的模型形式和估计方法。本文所建立的预测模型,主要适用于我们资产管理公司所持有的不良贷款。本文的建模思想、流程和所得到的模型还可为银行违约贷款LGD的估计提供借鉴。