支持向量机的上市公司财务危机预警模型,本文主要内容关键词为:向量论文,上市公司论文,模型论文,财务危机论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 研究背景
中国证券监督管理委员会于1998年3月16日颁布了《关于上市公司状况异常期间的股票特别处理方式的通知》,要求当上市公司出现财务状况或其他状况异常,导致投资者对该公司前景难以判定,可能损害投资者权益的情形时,证券交易所应对其股票交易实行特别处理(Special treatment,简称ST)。特别处理的后果包括:(1)在指定的报刊上刊登特别处理公告;(2)股票价格的日涨跌幅限定在5%以内;(3)在股票前添加“ST”标记;(4)在指定报刊中另设专栏刊登特别处理股票的每日行情;(5)中期报告必须经过审计。上市公司若连续三年发生亏损,其股票则被当暂停上市。暂停上市期间,其股票一周只有一个交易日(即每周五)可以进行买卖。特别处理给这些公司带来了巨大的压力,公司不仅要受到更加严厉的监管,融资渠道也变得更加狭小,有的企业甚至从此一蹶不振。在这种情形下,一个有效的财务危机预警系统,无论对于上市公司、债权人、股票投资者还是其他相关利益者来说,都具有深远的意义。
国际上最早提出企业财务危机预警分析模型的是Beaver(1966),随后,又有许多学者投入该领域的研究,在研究方法上也不断完善和改进。传统的统计模型包括:单变量判定模型[1]、多变量分析模型(包括Z分数模型[2]、评分法模型[3]、主成分预测模型[4]和逻辑回归模型[5]等。传统的模型往往直接或间接依赖于线性函数来建立模型,但财务危机预警本质上是一个非线性问题,所以线性模型往往不能拟和复杂的实际数据。
近年来,出现了一些新的财务危机预警方法,如人工神经网络[6、7]等。神经网络是目前应用较为广泛的智能判别方法之一,利用神经网络技术,建立上市公司财务危机预警模型,克服了传统模型依赖线性函数建立模型的缺陷,用非线性函数更好的拟和实际资料数据,从而使模型的精度得到进一步的提高。但它本身存在着一些固有的缺点,如:网络模型和结构选择困难;易陷入局部极小点;容易出现过学习,推广能力有限等。
目前,支持向量机(support vector machine)是在机器学习领域研究的热点问题。它具有良好的推广能力,它的解具有全局性和唯一性,在解决模式识别中小样本、非线性及高维数据识别问题中表现出独特的优势,近年来得到了广泛的应用。本文将支持向量机方法应用到上市公司财务危机预警中,建立了财务危机预警模型。通过实证分析,显示出了该方法在上市公司财务危机预警系统中具有良好的应用价值。
2 支持向量机简介
支持向量机简称SVM,它的理论基础是Vapnik等人提出的统计学习理论。统计学习理论就是研究小样本统计估计和预测的理论,它是对传统统计学理论的重要发展和补充。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。分类线方程为x·w+b=0,我们可以对它进行归一化,使得对线性可分的样本集,满足
利用Lagrange优化方法可以把上述最优分类面问题转化为其对偶问题,这是一个不等式约束下二次函数寻优的问题,存在唯一解。容易证明,解中将只有一部分(通常是少部分)不为零,对应的样本就是支持向量。解上述问题后得到的最优分类函数是
其中b*为分类阈值,可以通过任何一个支持向量求得。
当样本为线性不可分时,加入一个松弛变量,此时约束条件变为:
目标函数变为使目标函数最小。式中C是对分类错误的惩罚因子。
实际中的大部分问题,都是非线性问题,其数据都是非线性的。可以通过非线性映射:把向量映射到一个高维线性特征空间,然后在此高维特征空间中构造最优分类超平面。一般来说这种非线性映射不易实现,此时可用满足Mercer条件的核函数来代替这种非线性变换。此时分类函数最终变为:
3 基于SVM的财务危机预警模型
3.1 样本数据的选取
在预警模型建立过程中,我们假定被ST的公司存在财务危机,而非ST的公司财务状况良好。对于ST公司的选取,本文选取了2001-2004年首次被标上“ST”帽子的公司共140家,用它们前三年的财务报表数据为依据,采取截面财务指标作为建模样本。与上述ST公司相对应,正常经营公司考虑到在短期内出现亏损的可能性较小,因此选取净资收益率在0-15%的上市公司。同时考虑到预警系统的广泛适用性,应选取一定数量的具有代表性的上市公司财务报表作为样本,应涉及到不同行业、不同地域的公司。最终选取140家非ST公司。在选取的280个样本数据中,70家ST公司和70家非ST公司作为训练样本,其余140家公司作为检测样本验证模型的预测精度。
3.2 财务指标的选取
关于财务指标选取已有许多研究成果,选取方法一般是先经过正态分布检验,删除区分度不强的指标;然后经过相关性检验,去掉相关性较强的指标。本文采用[7]中采用的10个财务指标,如下所示:每股净资产;净资产收益率;每股经营现金流量;现金获利指数;主营业务净收益率;利息保障倍数;应收账款周转率;流动资产周转率;主营业务收入增长率;净资产增长率。
3.3 SVM的参数选择
根据上面的分析,构造了样本集(x,y),其中的维数为10,y是样本的属性类别,对于“ST”的公司,令y=1;对于非“ST”的公司,令y=-1。核函数的选择和惩罚系数C的选择是支持向量机需要确定的主要参数。常用的核函数有多项式核函数、径向基核函数和两层神经网络Sigmoid函数等。由[8]可知,这三个核函数的性能相差不大,本文采用常用的径向基核函数。径向基核函数的形式为:
此时,需要选择的参数为C和σ[2]。参数选择可以用穷举法,但速度较慢。本文采用[9]提出的方法对参数进行优化选择,最终选为:。
3.4 结果分析
本文所有的试验都是在MATLAB6.5下进行。本文与BP神经网络模型进行了比较。对于神经网络,采用交叉验证法确定参数,确定为:目标误差为0.1,隐层个数为16个。因此采用的神经网络模型的结构为10×16×1。
表1 BP神经网络和支持向量机方法的结果比较
训练样本精度 检验样本精度
分析方法
总体 ST非ST
总体
ST非ST
BP神经网络 85.7% 84.3% 87.1% 82.1% 81.4% 82.9%
支持向量机 88.6% 91.4% 85.7% 87.1% 88.7% 84.3%
由表1可以看出,在训练样本中,对于“ST”的公司,SVM的精度要明显高于BP神经网络;而对于非“ST”的公司,两种方法精度差别不大。总体精度上,SVM要高于神经网络。而在检验样本中,精度代表模型的预测能力。可以看出,无论对于“ST”公司和非“ST”公司,SVM方法和BP神经网络方法的预测精度都有了一定的下降,但SVM下降的幅度要小于BP神经网络。也就是说,SVM方法的推广性能要优于神经网络方法。
4 结束语
SVM是基于小样本学习的通用学习算法,具有严格的理论基础,能较好地解决传统评估方法不能解决的非线性、高维和局部极小等实际问题。本文将SVM应用到上市公司的财务危机预警中,通过与BP神经网络的比较研究,发现SVM对于样本的分类精度和预测精度都高于神经网络,具有较好的发展前景。