融资融券业务中个人客户违约概率度量研究_roc曲线论文

融资融券业务个人客户违约概率计量研究,本文主要内容关键词为:概率论文,融资论文,客户论文,业务论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       一、引言与文献综述

       2015年年初以来,A股市场经历了历史性异常波动。作为助推股市波动的重要因素,一时间证券公司融资融券业务被推上了风口浪尖,引发了监管部门与学术界的广泛关注。长期以来,得益于保证金交易制度,融资融券业务被证券公司视为“稳赚不赔”。但在本轮股市波动过程中,融资融券客户违约事件频频发生,形成了一定程度的风险暴露:从2015年下半年开始,国金、中信、安信等多家证券公司陆续发布公告,提高包括融资融券交易在内的融资类业务坏账准备计提标准。因此,证券公司融资融券业务面临着较为严峻的信用风险形势。

       作为测度客户违约可能性的指标,违约概率被用于客户准入管理、风险定价与信贷组合管理等多个方面,处于信用风险管理的基础性地位,因而对融资融券业务的信用风险管理具有重要意义。但对融资融券业务的违约概率计量方法,学术界却缺乏足够重视与研究。

       相比机构客户,个人客户风险意识薄弱,缺乏有效的风险对冲工具,其发生违约事件的可能性远大于机构客户;与此同时,在目前股市浓厚的投机氛围下,股价的剧烈波动往往导致个人客户违约事件的集中爆发,从而使证券公司产生较大的风险暴露。因此,本文将重点讨论融资融券业务个人客户的违约概率计量方法。

       正式展开讨论之前,本文首先梳理与归纳相关研究文献,从而为研究内容提供指导与借鉴。与本文相关的研究包括“违约概率计量”与“融资融券”这两个主题。

       (一)融资融券的相关研究

       关于融资融券的相关研究,主要从宏观视角下讨论其对股票市场波动性、流动性等市场效率指标的影响。从业务范畴而言,融资融券包括融资买入交易(即买空)与融券卖出交易(即卖空)两个部分。关于融券卖空交易的研究,主要讨论了限制卖空对股票市场的影响。大量理论研究认为,限制卖空降低了股票市场的定价效率。Miller(1977)指出,限制卖空使悲观投资者无法通过卖空获利,将迫使悲观投资者离场,导致股价仅片面反映积极信息,因此,限制卖空是催生资产价格泡沫的重要原因。Dimaond and Verrecchia(1987)发现,限制卖空将导致部分信息交易者离场,降低了股价对个人信息的调整速度。在Hong and Stein(2003)的理论模型,限制卖空使得坏消息不能被及时揭示,异质信念则导致投资者的过度自信,当市场迅速下跌时,负面信息将集中释放,引发股价暴跌。在实证研究方面,较多研究发现限制卖空负面影响市场定价效率的证据。例如,一些研究比较了限制卖空市场与允许卖空市场的市场效率差异(Zhao et al.,2014;Bris et al.,2007;李志生等,2015);一些研究则基于事件研究方法,讨论了限制卖空对于股票定价效率的影响(Chang et al.,2007;李科等,2014)。尽管如此,通过分析限制卖空对社会福利的影响,Allen and Gale(1991)也发现,在限制卖空的设定下,市场能够市场完全竞争与有效均衡,但当卖空限制不存在时,完全竞争和有效均衡反而无法实现。与此同时,一些实证研究也认为,允许卖空并不必然降低价格崩溃的概率(许红伟与陈欣,2012),甚至有助于实现市场操纵,从而降低市场效率(Goldstein and Guembel,2008)。

       与融券卖出交易相比,关于融资买入交易的研究较少,且主要考察其对市场波动性与流动性的影响。例如,Chang et al.(2014)发现融资卖出交易与融券卖入交易均有助于降低导致收益率波动性。根据保证金比率政策的不同,王旻等(2008)比较了台湾股票市场不同阶段的流动性与波动性,发现融资买入有助于提升市场整体流动性水平,但并未影响市场整体波动性水平。

       (二)违约概率计量方法的相关研究

       现代意义上的违约概率计量被区分为违约模式与盯市模式两种思想方法。盯市模式基于广义的信用风险定义,认为即使没有发生违约事件,客户信用质量的降低也将对违约概率产生影响;违约模式则与狭义的信用风险定义相对应,即客户的信用状况被严格区分为“违约”与“非违约”两类。

       违约模式下违约概率计量的实质可以被归纳为模式识别中的分类问题,即通过挖掘“违约类”与“非违约类”客户的特征差异来确定客户在给定时期内发生违约事件的可能性,主要包含统计学模型、人工智能模型与计量经济学模型三大类。

       统计学模型以判别分析为代表(Angilella and Mazzù,2015;Doumpos et al.,2002;徐晓萍和马文杰,2011)。总体而言,这类模型具有较好的解释性与可操作性,但是其对于概率分布具有严格的前提假设,而现实的数据环境往往无法满足这些要求。

       伴随着信息技术的发展,粗糙集、神经网络、决策树、支持向量分类等人工智能模型被广泛用于信用风险评估(Danenas and Garsva,2015;

and Gürgen,2011; Yu et al.,2010),其具有自组织、自适应与自学习的特点,能够适应小样本的数据环境,对解决非线性问题具有一定优势;但是,人工智能模型的“黑箱”算法特性使其难以被信用分析人员所理解,且经常出现组合爆炸、过度拟合与训练效率低下等问题。

       Probit模型、Logistic模型与生存分析模型等计量经济学模型是目前应用最广泛的违约概率计量方法(Tian et al.,2015;Campbell et al.,2008;钱争鸣等,2010)。这类模型的优势在于:能够借助假设检验工具,区分变量的显著性与相对重要性,且存在多种分布假设,满足现实数据分布的不同情况。但是,这类模型要求相当数量的历史违约数据,且对于会计账目数据存在较强依赖性。

       盯市模式下的违约概率计量主要基于信用风险定价模型,也可以被区分为结构化模型、简约化模型与混合模型。结构化模型主要通过考察信用对象的资产负债结构动态计量违约概率,因此,其有利于解释信用风险的生成机制,并获得了较为广泛的应用(Fiordelisi and Marqués-Ibanez,2013; Collin-Dufresne and Go-ldstein,2001; Leland and Toft,1996;韩立岩与谢朵,2005)。相比之下,简约化模型并不考虑违约机制,而是直接假设违约事件受外生随机过程所驱动,并引入违约强度概念对其加以刻画(Duffie and Singleton,1999; Lando,1998; Jarrow and Turnbull,1995)。

       (三)研究评述与借鉴

       通过归纳与梳理已有研究可以发现,目前缺乏微观视角下融资融券业务信用风险管理策略的研究,这与融资融券业务信用风险管理的现实需求存在较大差距。针对这一不足,本文以个人客户为研究对象,讨论融资融券业务的违约概率计量。但是,融资融券业务开展时间较短,数据的积累与整理工作并不完善,给违约概率计量带来了一定困难。对此,本文将重点考察信用账户的资产负债结构信息在违约概率计量方面的作用。这是考虑到:一是融资融券业务属于抵押信贷的范畴,信用账户被用于记录与融资融券业务相关的资产与负债信息,因此,客户信用状况被充分反映在信用账户中。二是在保证金交易制度下,客户信用账户受到逐日盯市监控,违约事件的判定主要基于信用账户资产负债结构的变动。

       在计量方法上,本文将选择二元选择模型作为计量工具。这是因为,二元选择模型具有简单实用的分析框架,可以最大限度地包含不同的违约情形,已经成为主流的违约概率计量方法。但是,通过归纳违约概率计量方法研究可以发现,已有研究不仅在模型选择上较为主观,即大量研究主观地使用某一类服从特定分布的二元选择模型计量违约概率,而且缺乏对各类模型应用效果的验证与比较。与此同时,提高违约概率计量精度对于增强信用风险管理与定价效率(Stein,2005),因此,有必要讨论哪一类二元选择模型最适合于计量融资融券业务个人客户的违约概率。针对这些问题,本文分别将Probit、Logistic与Extreme Value模型等多种二元选择模型用于计量违约概率;而且使用了ROC曲线方法与Brier评分方法,从模型预测的准确性与拟合性的角度对三种模型进行验证与比较,以确保筛选出最优的模型计量违约概率。

       本文结构安排如下:第二部分介绍违约概率的计量与验证方法;第三部分描述研究数据的主要特征;第四部分为计量与验证结果分析;第五部分总结全文。

       二、违约概率计量与验证方法

       (一)模型框架

      

       其中,f为分布的密度函数;同时,根据(4)式,违约概率随自变量变动的方向与回归系数βj的符号相反。

       二元选择模型是当前违约概率计量的主流方法,但是,在这一模型框架下,融资融券业务的违约概率计量与其他业务相比,还存在以下不同。

       一是较高的时效性要求。对于商业银行信贷业务而言,违约概率的计量期限通常为1年,即自变量观测的滞后期M取值为1年。但对于融资融券业务而言,因为客户受到盯市监控,所以其计量期限具有较高的时效性要求,即M的取值不宜过长。因此,本文外生选取1个月(20个交易日)、2周(10个交易日)、1周(5个交易日)与1天(1个交易日)作为融资融券业务违约概率的计量期限长度。

       二是较强的违约事件极端性特征。融资融券业务受到盯市监控,一旦客户信用账户的维持担保比例低于风险临界值,则客户将被要求在有限的时间内追加担保物,以使维持担保比例恢复到更高的水平。这就使得,相比商业银行信贷客户,融资融券客户的违约事件具有更强的极端性特征。对此,Probit模型与Logistic模型是否足以刻画,这一问题对于提高计量的精确性具有重要影响。基于这一考虑,本文将分别使用Probit、Logistic与Extreme Value模型的计量违约概率,进而从模型拟合性与准确性的角度对三种模型的计量结果进行了比较与验证。

       (二)模型验证与比较

       在验证方法上,本文主要采用ROC曲线与Brier评分方法验证模型的准确性。其中,ROC曲线是最重要的模型准确性验证方法,其验证思想与统计学中的“第一类错误”与“第二类错误”相似。这一方法首先使用违约概率估计值识别违约事件:如果客户的违约概率估计值大于一阈值α,则被识别为“违约”;反之,则为“非违约”。

       如表1所示,模型识别存在四种可能的情形,T1,1、F1,2、F2,1与T2,2分别为四种情形的数量。模型在以下两种情形成功识别客户的信用状态:一是实际信用状态为违约且模型识别状态也为违约;二是实际信用状态为非违约且模型识别状态也为非违约;而模型识别的误差可以被区分为以下两种类型:一是未识别出实际发生违约事件的客户;二是客户实际发生违约事件但是被识别为“非违约”。为了考察模型识别结果的是否正确,该方法进一步计算了命中率与错误警报率。

      

       以错误警报率为横轴,命中率为纵轴,构建平面坐标系;在不同的阈值设定下,一对错误警报率与命中率的取值即为平面坐标上的一个点,连续改变阈值,就得到一系列这样的点,由此构成的曲线即为ROC曲线。显然,ROC曲线越向直线y=x上方偏离,则意味着模型识别的命中率相对错误警报率越高,因而其区分能力越强,而这一特点可以通过ROC曲线下的面积,即AUC(Area Under Curve)值反映。换言之,表现较好的模型AUC值的取值范围应该为[0.5,1],AUC值越接近1,即ROC曲线越接近左上角,则模型的区分能力越强。

       除此之外,本文计算了验证样本的Brier评分。与传统线性回归模型不同,二元选择模型的因变量为0-1离散值,因此,

与调整

等面向线性回归模型的拟合度指标,并不能较好反映二元选择模型的拟合度。相比之下,Brier评分是对多元分类表现的综合性度量,可以用来替代F63AA9156.jpg与调整

,评估二元选择模型的拟合度;其被计算为:

      

       其中,

为客户的信用状态,即当客户违约时,

=1,否则

=0;

则为相应的违约概率估计值。一般而言,Brier评分的取值介于0与1之间,且越趋向于0,模型拟合度越高。

       三、样本选择与数据描述

       (一)样本选择

       本文的样本观测期限为2014年1月2日至2015年8月3日,样本共涉及110043位客户;其中,一共有1054位客户累计发生1137次违约事件,仅1位客户为机构客户,其余客户均为个人客户,这直观反映出个人客户违约事件集中度较高的特征。

       若同一位客户发生多次违约事件,则每一次违约事件将分别被视为不同的违约样本;类似地,对于非违约客户,每一期观测都被认为是一个独立的样本。图2是对客户的违约频率进行的频数统计,其中,985个客户仅发生过1次违约事件,58位客户发生过2次为一事件,仅8位客户发生过3次违约事件,3位客户发生4次违约事件。

      

       客户违约而受到强制平仓,既可能是由于客户未能及时追加担保物(下文简称“追保平仓”),也可能是在合同期满前未能清偿债务(下文简称“清偿平仓”)。图3则对此进行了频数统计,如图所示,追保平仓类客户数明显大于清偿平仓类客户数,换句话说,未能及时按要求补充担保物是导致违约事件的重要原因。

      

       针对研究样本存在的非对称性分布问题,本文使用配对方法对样本进行平衡处理,即从未发生违约事件的客户中,寻找处于同一交易日、资产与负债规模最相近的观测,作为控制样本。借鉴二元选择模型研究中的一般经验,本文将配对比例设置为1∶2,其中,按照1∶1的比例随机选取估计样本,其余作为验证样本(梁琪,2014)。

       (二)自变量选取

       在自变量选取上,本文重点考虑了信用账户的资产负债结构信息,主要包括以下变量。

       一是证券资产市值相对总资产市值的占比(下文简记为SM)。该指标从两个方面影响客户违约概率:一方面,证券资产市值取决证券价格,因此,其波动性显著高于现金资产,从这个意义上讲,该指标取值过大的客户的违约概率较低;另一方面,当客户主要参与融资买入交易时,该指标取值较大,当客户主要参与融券卖出交易时,该指标取值较小,而融券卖出交易的信用风险要高于融资买入交易,因此,该指标取值越大,违约概率越低。

       二是总资产折算市值相对总资产市值之比(下文简记为HM),其中总资产折算市值被计算为证券资产折算市值与现金资产之和。市值较稳定的证券,其折算率也较高。因此,该指标反映了客户资产的稳定性,而相对稳定的资产市值有利于抵御信用风险。

       三是融资融券浮动盈亏与负债市值之比(下文简记为PL)。该指标反映了客户融资融券交易的收益状况,且收益状况越好,发生违约事件的可能性越低。

       四是融资融券负债限额的对数值(下文简记为LL)。受数据不足的制约,本文无法直接考察客户的财务、征信等指标对于违约概率的影响。但考虑到,在客户提出业务申请之初,证券公司将基于这些因素评定客户的负债限额,而客户资质越优异,其获得的负债限额往往越大,因此,本文用该指标反映了客户基本资质的状况。

       五是融资买入负债相对总负债的占比(下文简记为BD),其反映了客户的融资融券负债结构。一方面,融资买入交易的信用风险要低于融券卖出交易,因此,融资买入负债占比越低,融资买入交易占比越高,则违约概率越大;另一方面,相比较于客户同时融资买入与融券卖出,客户仅单方面的融资买入或者融券卖出,其信用风险缺乏对冲机制,从而导致违约概率上升。

       六是维持担保比例的对数值(下文简记为LKR)。维持担保比例被定义为信用账户中的所有资产与负债之比,因此,维持担保比例即为信用账户的资产负债率,是融资融券业务风险盯市监控的主要指标。

       最后,本文也考虑学历(下文简记为EDU)与开户时间(下文简记为OT)。其中,学历被区分为7个档次,而开户时间被计算为开户日与计量日之间的间隔日期数。

       本文首先对模型自变量进行描述性统计。在不同期限情形下,模型自变量的描述性统计特征表现一致,因此,本文仅展示1个月期限情形下的描述性统计结果。从表2可以发现:对于“证券资产市值相对总资产市值的占比”SM、“总资产折算市值相对总资产市值之比”HM与“融资融券浮动盈亏与负债市值之比”PL而言,违约样本的均值与最大值均小于非违约样本。

      

       对于“融资融券负债限额的对数值”LL而言,违约样本的均值、最大值、最小值与标准差均大于非违约样本。对于“融资买入负债相对总负债占比”BD而言,其非违约样本与违约样本的均值都大于0.5,其中,非违约客户样本均值大于0.9,说明客户以融资负债为主,而非违约样本均值则低于违约样本均值,一定程度反映出违约样本在负债类型方面具有更强的集中度。对于“维持担保比例的对数值”LKR而言,违约样本的均值小于非违约样本。对于“学历”EDU而言,违约样本均值反而大于非违约样本。

       表3为1个月期限情形下的模型自变量相关性矩阵。由于各指标在不同期限情形下的相关性表现一致,所以,本文不再重复性展示相关性矩阵计算结果。可以看出,总体而言,自变量之间的相关性较小,因此,在模型回归过程中并不存在多重共线性的问题。

      

       四、模型估计与验证

       (一)模型回归结果分析

       表4为1个月期限情形下的违约概率计量结果,可以看出,在三种模型设定下,所有自变量对违约概率的影响方向是一致的。其中,“证券资产市值相对总资产市值的占比”SM、“融资融券负债限额的对数值”LL与“开户时间”OT的回归系数为正,因此,根据(4)式,其取值越大,违约概率越大。“融资买入负债相对总负债的占比”BD与“维持担保比例的对数值”LKR的回归系数显著为负,说明其正向影响违约概率。与此同时,在Extreme Vaule模型中,“总资产折算市值相对总资产市值之比”HM仅显著为负,意味着其正向影响了违约概率。

      

       在剔除了所有不显著的自变量,本文再进行回归,发现回归结果与之前的回归结果保持一致。同时,比较两类回归的AIC值与SC值,可以发现剔除不显著变量后回归的AIC值与SC值显著下降,说明了剔除不显著变量后的回归模型拟合效果更好。因此,本文使用剔除不显著变量后的模型作为1个月期限的违约概率计量模型。

       表5是2周期限情形的违约概率计量结果。表5中各自变量对于违约概率的影响方向与表4的回归结果相同,且表5的回归结果具有更强的一致性:在三种模型下,“融资买入负债相对总负债的占比”B与“维持担保比例的对数值”LKR的回归系数与为负,说明它们正向影响了违约概率;“证券资产市值相对总资产市值的占比”SM、“融资融券负债限额的对数值”LL与“开户时间”OT则显著负向影响违约概率。与此同时,剔除不显著变量后的回归模型的AIC值与SC值均显著下降,因此,使用剔除不显著变量后的回归模型计量2周期限的违约概率。

      

       表6与表7分别计量了1周与1天期限情形的违约概率。将表6与表7同表4与表5进行比较,可以发现,首先,在各种情形下,各自变量对于违约概率的影响方向一致。

      

       其次,“总资产折算市值相对总资产市值之比”HM与“融资融券浮动盈亏与负债市值之比”PL的显著性明显增强:在1周期限情形下,HM在三种模型中均显著不为零,PL则在Extreme Vaule模型中显著不为零;在1个交易日期限情形中,HM在Logistic模型与Extreme Vaule模型中显著不为零。最后,同表4与表5的结果一致,剔除不显著变量回归模型的AIC值与SC值显著低于包含所有变量的回归模型。

       (二)模型的验证与比较

       接下来,本文将使用ROC曲线方法与Brier评分方法,分布从模型预测准确性与拟合性的角度,对Probit、Logistic与Extreme Value模型进行验证与比较。

       ROC曲线是比较与验证模型预测准确性的重要方法。通过比较违约概率的预测值与阈值的大小,ROC曲线方法判定客户是否发生违约事件,进而通过计算模型预测正确的命中率与错误的警报率,绘制ROC曲线。模型预测准确性的优劣,取决于ROC曲线下正确预测的命中率与错误预测的警报率的变化速度。

       图4为不同情形情形下的ROC曲线。由右下方向左上方,四条曲线依次为:y=x函数曲线、Probit模型的ROC曲线、Logistic模型的ROC曲线与Extreme Value模型的ROC曲线。首先,三条ROC曲线均位于y=x直线上方;这表明所有模型都具有一定的模型预测能力。其次,在不同期限下,比较三条ROC曲线可以发现,Extreme Value模型的ROC曲线位于所有曲线的最上方。这意味着,相比Probit与Logistic模型,一方面,在相同的命中率下,Extreme Value模型发出错误警报的概率最低;另一方面,在相同的错误警报率下,Extreme Vaule模型正确预测违约事件的概率最高。

      

       AUC值计算了ROC曲线下方的面积,因此,当ROC曲线与y=x曲线相重合时,AUC值为0.5,此时模型无任何预测力可言。如表8所示,在各期限情形下,Probit、Logistic与Extreme Value模型的AUC值均大于0.5;但是,与ROC曲线方法的结论一致,在各期限情形下,Extreme Vaule模型的AUC值均大于Probit与Logistic模型,佐证了Exreme Value模型的预测能力最强。

      

       最后,前文曾简单比较了Probit、Logistic与Extreme Value模型在信息准则值方面的差异。本文进一步使用Brier评分方法比较三类模型在拟合程度方面的优劣。实际上,Brier评分方法度量了违约概率预测值与实际值之间的距离,因此,评分值越小,模型拟合程度越高。如表8所示,在各种期限情形下,Extreme Value模型的Brier评分明显小于Probit与Logistic模型,因此,Extreme Value模型在拟合程度上也明显高于其他两类模型。

       五、研究结论

       2015年A股市场的剧烈波动,使证券公司融资融券业务出现了一定程度的风险暴露,面临着较为严峻的信用风险形势。违约概率是信用风险管理的基础,被广泛用于客户准入管理、风险定价与信贷组合管理等多个方面。但对于如何正确计量融资融券业务的违约概率,学术界则缺乏充分重视与研究。

       本文使用Probit、Logistic与Extreme Value模型,讨论了融资融券业务个人客户的违约概率计量。面对相关数据不足的制约,本文充分利用了融资融券业务盯市交易制度的优势,将信用账户资产负债结构信息用于违约概率计量;研究发现:融资融券标的物市值相对总资产市值占比、总资产折算市值相对总资产市值之比、融资融券浮动盈亏与负债市值之比、融资融券负债限额的对数值、融资买入负债相对总负债的占比、维持担保比例的对数值等指标可被较好用于违约概率计量。

       违约概率计量模型精度的提高对于增强信用风险管理能力具有重要作用。但是已有研究对于模型选择较为主观,缺乏模型效果的客观验证与比较。为筛选出最优的计量模型,本文使用ROC曲线与Brier评分方法,分别从模型预测准确性与拟合性的角度对Probit、Logistic与Extreme Value模型进行比较与验证;研究发现,在各种期限情形下,Extreme Value模型的预测效果与拟合程度均高于其他模型,因此,最适合于计量融资融券业务个人客户的违约概率。

       感谢匿名审稿人的宝贵意见。文责自负。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

融资融券业务中个人客户违约概率度量研究_roc曲线论文
下载Doc文档

猜你喜欢