基于FC和VPRS的信用风险评估研究_信用风险论文

基于FC和VPRS的信用风险评价研究,本文主要内容关键词为:信用风险论文,评价论文,FC论文,VPRS论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

信用风险评价是商业银行贷款的重要依据。世界银行对全球银行业危机的研究表明,导致银行破产的主要原因就是信用风险[1]。随着2007年我国银行业的全面放开,我国商业银行面临的竞争更加剧烈,如何科学、合理地对企业做出正确的信用风险评价,是一个值得研究的问题。传统的信用评价方法存在某些不足,必须引入新的理论,对信用评价方法加以改进。粗糙集理论作为研究不确定知识表达、学习、归纳的新型数学工具,其重要特点是不需要预先给定某些特征或属性的数量描述,而直接从给定问题的描述集合出发,在信息不确定情况下,仍可挖掘出大量对决策有帮助的知识信息[2]。粗糙集理论提供了一整套比较成熟的样本学习式决策方法。由于标准粗糙集理论在某些条件下具有一定的局限性,缺乏对复杂系统的处理机制,对于不确定性概念的边界区域,刻画过于简单,缺乏对噪音数据的适应能力。而在实际应用中,噪音是难免的,因此Ziarko提出了变精度粗糙集(Variable Precision Rough Set,简称VPRS)模型[3],增强粗糙集合模型的抗干扰能力。本文利用变精度粗糙集理论,根据2007年我国部分上市公司公布的年报数据,以部分财务指标作为基本属性,从中筛选出能反映评价指标本质关系的重要属性,从而挖掘出数据间的关系而形成信用评价决策规则。通过这些由训练数据抽取的决策规则对测试数据进行判别表明,该方法具有良好的分类判别能力。

2 文献回顾

在信用风险评价的文献中,主要存在三类不同的方法。第一类是统计分类方法,第二类是神经网络方法,另一类是支持向量机方法。

2.1 统计分类方法

早在1966年,Beaver[4]首次运用单变量判定分析法来研究公司财务危机问题,但该方法因财务比例的选取不同而观测结果相差很大,所以很快被多变量分析法所取代。1968年,Altman率先将判别分析法应用于财务危机、公司破产及违约风险的分析,建立了Z-Score模型[5],该模型只适用于短期的预测。Altman在1977年及1983年又在Z-Score模型基础上进行了改进,建立了ZETA模型[6,7],研究结果表明ZETA模型优于Z-Score模型。Martin、Ohlson、Maddala[8~10]等人分别在1980年前后将Logistic模型应用于信用风险分析,并认为Logistic模型优于Z-Score模型和ZETA模型。

国内学者在统计分类方法应用于信用风险评价的研究上也做出了具大贡献。陈静[11]、张玲[12]分别利用线性判别分析法对企业信用风险进行了研究。唐晓岸、孟庆福[13]、姜天、韩立岩叫、陈晓虹、戴静[15]、宋荣威[16]等人分别运用Logit模型对企业进行了财务预警分析。研究表明,线性判别分析法和Logit模型对企业信用风险评价有一定的准确性。

2.2 神经网络方法

从20世纪90年代开始,国内外学者将神经网络方法应用于信用风险的评价,方法大致有多层感知器(MLP)、BP算法网络、径向基函数(RBF)网络、概率神经网络(PNN)等几种,其中用得最多的是BP算法网络。Altman、Marco和Varetto运用MLP神经网络技术对意大利公司进行财务危机预测[17]。West分别建立MLP网络结构和RBF网络对德国和澳大利亚的银行贷款企业的财务数据进行两类模式分类[18]。Jensen、Tam、Coats等人[19~21]则分别应用BP算法针对财务状况进行了评价。Yang和Marjorie利用PNN技术建立公司破产预警模型,对美国122家石油公司进行财务困境预警研究[22]。

在国内,学者庞素琳[23~25]对神经网络的几种模型分别进行了研究。陈雄化、林成德、叶武[26]、吴德胜、梁□[27]等研究了BP算法在信用评价中的应用。从国内已有文献来看,国内研究对BP算法及其改进模型在信用评价中的应用较多。

2.3 支持向量机方法

支持向量机(SVM)方法是1995年Vapnik根据统计学习理论提出的一种学习方法,研究如何根据有限学习样本进行模式识别和回归预测等,使在对未知样本的估计过程中,期望风险达到最小[28]。该方法提出后,国内外很多学者把SVM模型应用到信用评价分析。Fan和Palaniswami利用SVM对企业破产进行预测[29]。姚奕和叶中行[30]利用SVM研究银行客户信用评估系统。钟波等[31]建立了基于LSSVM的信用评价模型。肖文兵、费奇、万虎[32]也对支持向量机的信用评价模型进行了分析。

以上各种方法各有其优缺点。线性判别分析法最大的优点是解释性强,且简单明了,但其假定条件过于严格,如要求每组数据满足:(1)服从多元正态分布。(2)协方差矩阵相同。(3)均值向量、协方差矩阵、先验概率和误判代价已知。而现实中这几个条件难以满足。Logit模型的优点是不需要假定任何概率分布,也不要求等协方差性,但当样本点完全分离时,模型参数的最大似然估计可能不存在而导致该方法完全失效。人工神经网络是一种对数据分布无任何要求的非线性技术,它能有效解决非正态分布、非线性的信用评估问题,但其结构确定困难,且解释性差。支持向量机方法的最大优点是能有效解决小样本问题,并且无须样本数据满足正态性和齐次方差的条件,但其分类准确率和预测准确率依赖于核函数的选取,其参数的选取都是通过反复的试验,人工选择出令人满意的参数,这种方法需要人的经验做指导,并且它的选取需要付出较高的时间代价,这样限制了支持向量机的发展。目前这三种方法中哪种方法的综合效果较优还存在一些争论,考虑到粗糙集理论在数据推理方面的强大功能,本文尝试引入变精度粗糙集理论构造信用评价模型,并对我国2007年部分上市公司进行分类。

3 数据选取和模型介绍

3.1 指标体系说明

企业信用风险的形成主要取决于企业财务状况,因此,企业信用评级通常将对企业信用风险的测度转化为对企业财务状况的衡量。而影响公司财务变化的主要因素包括公司的盈利能力、营运能力、偿债能力、成长能力等指标。结合已有相关文献[2~31],本文拟采取如下指标体系,见下页表1。

表1 指标体系

3.2 样本数据选择

考虑到不同行业的生产经营特点不一样,在信用评价时如果采用相同的评价方法难免有失公允,在数据选取时应尽量选取具有相同特点的行业板块。本文在沪深证券交易所2007年年报公布的按照CSRC行业分类中的所有制造业板块中随机抽取40家企业为样本,其中ST类10家,不亏损公司30家。从其中10家ST公司中随机选择5家作为训练样本,另5家作为测试样本;同理,从30家不亏损公司中随机选择15家作为训练样本,另15家作为测试样本。主要数据采自中国上市公司资讯网上市公司财务报表及《上海证券报》、《中国证券报》上刊登的上市公司相关公告。

3.3 模型说明

变精度粗糙集是对标准粗糙集理论的一种扩展,它通过设置阈值参数β,放松了标准粗糙集理论对近似边界的严格定义,允许概率分类。与标准粗糙集相比,当对象在变精度粗糙集中分类时,在它的正确分类中有一个置信度,这一方面完善了近似空间的概念,另一方面也有利于根据粗糙集理论从认为不相关的数据中发现相关信息。当对象按变精度粗糙集分类时,需定义一个正确分类的阈值β。Ziarko称β为分类误差,定义区域为0≤β<0.5,An等人将β定义为正确分类的比例,在这种情况下,近似范围为0.5<β≤1.0,并将此技术称为强化粗糙集。本文将β定义为0.5<β≤1。

(1)模糊聚类法(Fuzzy Cluster,简称FC)离散化决策表

粗糙集理论分析要求数据必须以类别的形式出现。因此,连续数据必须首先进行离散化处理,离散的结果可能会减小原始数据的精度,但将会提高它的一般性。数据离散方法一般分为专家离散与自动离散。专家离散指由某领域的专家根据他的判断或使用该领域确定的专家进行离散;自动离散方法可分为有监督离散法和无监督离散法,其中无监督离散法可视为一个简单的聚类过程,本文使用模糊聚类分析法分别对每个指标进行离散化处理。

4 实证分析

首先使用模糊聚类分析法分别对训练样本中的每个指标进行离散化处理,每个指标分为三类,产生的决策表如表2所示,其中“1”表示该指标“好”,“2”表示该指标“中等”,“3”表示该指标“差”,可表示为1>2>3。对于决策属性本文沿用国内文献的研究习惯,采用两类模式分类,即非ST类上市公司视为“信用好”企业,用“1”表示,ST企业视为“信用差”企业,用“2”表示,表中的D为决策属性。

表2 指标离散化后的决策表

由表3所述的决策规则一表明,如果上市公司每股收益至少为中等,并且主营业务利润率至少中等,同时满足主营业务增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、主营业务利润率及主营业务增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和主营业务利润率反映的是企业的赢利能力,主营业务增长率反映的是企业的发展能力,这三者分别表明了该企业的赢利能力及持续发展能力。表4所述的决策规则二表明,如果上市公司每股收益至少为中等,并且净资产收益率至少中等,同时满足净资产增长率至少中等,则该企业可视为“信用好”的企业;如果在每股收益、净资产收益率及净资产增长率之间有一个为差,则该企业视为“信用差”的企业。其中每股收益和净资产收益率反映的是企业的赢利能力,净资产增长率反映的是企业的发展能力,这三者同样表明了该企业的赢利能力及持续发展能力。这两条决策规则都反映了上市公司的赢利能力及上市公司的成长性,是企业信用评价的重要依据。

分别用表3及表4中的决策规则对测试样本中的20家公司进行判别表明,在抽取的两类决策规则中各有一例ST公司误判为信用好的公司,误判率为5%,分类准确率为95%(见表5),这充分说明了变精度粗糙集在信用风险评价上的可行性。

由生成的决策规则一和决策规则二对20个测试样本分析结果可知,变精度粗糙集方法能很好地识别样本企业的信用等级,证明了该方法的有效性。并且该方法具有一定的抗干扰能力,对偶然因素导致的异常数据也能较好地识别。比如某ST公司每股收益为0.13元,该指标虽然为“中等”,但由于其主营业务利润率为负并且呈下降趋势,故该公司仍然存在财务风险,从而信用风险较大,变精度粗糙集方法能够识别这种异常数据,排除干扰;另外两家ST公司虽然净资产增长率指标都为“好”,但这主要是因为这两家公司实施了资产注入或投资收益导致的,其主营并没发生很好的改观,所以其经营仍然存在较大的风险,存在一定的信用风险,则利用生成的决策规则能很好地排除这种异常数据的干扰,能够识别出这类公司的信用风险。

5 结束语

在当前的分类评价决策问题中,由事例导出规则是人工智能中的一个典型的方法。本文先利用模糊聚类方法对原始数据进行离散化处理,然后将变精度粗糙集理论应用于企业信用评价中,获得了一些有益的规则和知识。获取的规则能够对企业财务状况进行科学的分类评价,并且能有效地排除异常数据的干扰。这种规则数量较少、解释性较强,能够为企业信用评价提供一些指导性的决策建议。变精度粗糙集理论无需任何假定条件,避免了统计分类方法的弊端;由变精度粗糙集理论生成的决策规则解释性强,弥补了神经网络方法的不足;变精度粗糙集理论的应用也能排除支持向量机理论反复选取核函数的较大的时间代价。基于上述优点,变精度粗糙集理论在信用评价中必然具有广阔的应用前景。需要指出的是,由于本文所研究的决策表较小,所以能较容易地搜索到所有约简,并对其进行系统地分析,若决策表很大,则搜寻所有的约简是一个NP难问题,在实际应用中,只需选择其中的一个约简进行分析即可。由于β值与分类精度是逆相关的,随着β值的增大,分类精度减小,X的正域与负域将缩小,而边界将扩大,这意味着只有少数对象被分类;而随着β值的减小,分类精度增大,X的正域与负域将扩大,而边界将缩小,这意味着大多数对象被分类,但可能被误分;在实际运用中应该根据精度要求对β作合理的设置。

标签:;  ;  ;  ;  ;  

基于FC和VPRS的信用风险评估研究_信用风险论文
下载Doc文档

猜你喜欢