基于逻辑回归分析的虚假财务识别模型,本文主要内容关键词为:虚假论文,逻辑论文,模型论文,财务论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
自2003年以来,由于虚假财务信息而被中国注册会计师协会出具非标准无保留意见上市公司797家,每年出具的非标准无保留意见份数约占审计意见份数的10%。而被誉为现代公司治理结构经典的美国上市公司也同样逃脱不了会计信息欺诈的愚弄,据《商业周刊》报道,20世纪90年代末期以来,美国公司财务丑闻曝光的范围和规模超过了大萧条以来的任何时期,1995年至2001年,公司纠正财务报告的案例从每年50例增长到每年150例,而2002年第一季度就高达60例。2001年12月Enron(安然公司)因会计丑闻曝光刷新了公司破产规模的纪录,6个月之后WorldCom(世界通信)再度爆发丑闻,再创公司破产规模的纪录,曾经显赫的朗讯、泰科、施乐、默克也因涉嫌会计欺诈而成为会计丑闻家族的一员。
如何在纷繁复杂的财务信息中识别出会计欺诈风险?在国外,Green & Choi利用神经网络模型对财务欺诈进行聚类分析;Fanning & Cogger利用智能神经网络建立了一个财务欺诈侦测模型。在国内,陆建桥对亏损公司盈余管理进行实证研究,对Adjusted-Jones模型进行了再修正。陈亮,王炫利用统计分析方法(单因素方差分析)对我国上市公司会计信息欺诈进行经验分析和识别模型。
本文以2008年国内110家被出具非标准审计意见上市公司为研究样本,从定量角度运用逻辑回归分析方法建立了针对虚假财务识别模型,从而为投资者和分析人员提供了识别会计欺诈的检测方法。
二、研究思路与研究方法
本文总的研究思路是:首先,采用一定的方法确定研究样本;其次,在此基础上选择确定财务指标;再次,运用SPSS10.0统计软件进行logistic回归方法分析;最后,构建模型并检验。
logistic回归分析方法是对定性变量的回归分析。根据因变量的取值类别不同,可以分为Binary Logistic回归分析和Multinominal Logistic回归分析。根据财务真实性可分为虚假财务和非虚假财务,因此本文选取Binary Logistic回归分析方法。Logistic函数的形式为:
设因变量y只能取0、1两个值的定性变量,则简单线性回归模型为:
因为y只取0和1两个值,所以因变量y的均值为:
由于y是0-1型贝努利随机变量,因此有如下概率分布:
P(y=1)=p (4)
P(y=0)=1-p(5)
式中p代表自变量为x时y=1的概率。
根据离散型随机变量期望值的定义,可得:
E(y)=1(p)+0(1-p)=p(6)
进而得到:
通过对简单线性回归函数分析可得出;它也适合复杂的多元回归函数情况。因为因变量y本身只取0、1两个离散值,不适于直接作为回归模型中的因变量,而表示在自变量为(i=1,2,…,k)条件下y=1的概率,因此可以用它来代替y本身作为因变量,其Logistic回归方程为:
三、虚假财务识别模型的实证研究
1.样本选择
样本来源:中国注册会计师协会网站和和讯网站公布的沪深两市上市公司2008年度财务比率。选择标准是2008年被注册会计师协会出具非标准意见报告上市公司。
(1)虚假财务报告样本选取
根据中国注册会计师协会上市公司年报审计快报报告,截至4月30日,会计师事务所共为1624家上市公司出具了审计报告,其中标准审计报告1514份,带强调事项段的无保留意见审计报告75份,保留意见审计报告18份,无法表示意见审计报告17份。本文将标准审计报告以外的其他报告统称为非标准审计意见报告,因此,选取110家非标准审计意见报告上市公司作为研究样本。
(2)控制样本选取
根据财务真实性可分为虚假财务和非虚假财务,相对于虚假财务样本选择,非虚假财务样本选择难度很大。本文采用同行业和资产规模相近原则选择标准审计意见报告的上市公司作为配对样本即控制样本。由于在数据收集过程中样本公司存在金融类上市公司、B股类上市公司和部分样本上市公司数据严重不完整现象,因此,经筛选最终选择87家非标准审计意见公司和87家标准审计意见公司作为研究对象(见表1)。
表1 非标准审计意见公司和标准审计意见公司
2.模型变量选择
本文实证研究的因变量采用二分类法,将1代表标准审计意见报告公司,0代表非标准审计意见报告公司。从债务状况、获利能力、运营能力、财务能力、成长能力、现金流量和单股指标7个方面81个指标作为模型的初始自变量。由于部分指标数据严重丢失,经过筛选最终确定7个方面69个指标作为模型研究的初始变量(见表2)。
3.变量检验
为了选取具有较强解释能力的指标,选择了单因素方差分析对所有变量进行了检验,挑选出对造假判断有显著影响的变量。经过单因素方差分析得出30个指标具有显著性(p<0.05)变量(见表3),它们对公司的造假具有较强的区分能力。
4.相关性检验
为了避免多重指标带来的多重共线性问题,本文采用二元定距变量的相关分析,将相关系数|r|≥0.8为高度相关变量,根据相关性较小者较优的原则应删除其中一个,这样最终确定选用17个变量(见表4)建立模型。
表2 模型的初始变量
表3 单因素方差分析结果
表4 相关性检验结果
5.模型构建
本文采用logistic回归分析方法对样本数据进行分类,以1代表标准审计意见报告公司,0代表非标准审计意见报告公司,最终以表4中17个变量作为自变量,以2008年标准审计意见报告公司和非标准审计意见报告公司财务比率数据作为分析依据,利用模型8建立判别函数。在分析过程中,采用向前逐步选择变量,17个自变量选择中第一次进入的变量是(每股净资产),第二次进入的变量是(扣除非经常损益的每股收益),见下页表5。
将表5的第二步变量系数和常数代入模型8得出Logistic回归的分类概率方程为:
将样本数据和配对数据中(每股净资产)和(扣除非经常损益的每股收益)指标值代入方程(9)求出其值,以0.5为分割点判别应归入哪一类。若样本数据代入方程的值小于0.5,则认为虚假财务报告被判定为虚假财务,判定正确;若样本数据代入方程的值大于0.5,则认为虚假财务被判定为非虚假财务,判定错误。同理,若配对数据代入方程的值大于0.5,则认为非虚假财务被判定为非虚假财务,判定正确;若样本数据代入方程的值小于0.5,则认为非虚假财务被判定为虚假财务,判定错误。经过判定后可以得出分类结果表(见下页表6)。
从表6和表7可以看出,若仅采用变量是(每股净资产)作为判别变量,则判别准确率可达到75.3%;若采用变量(每股净资产)和(扣除非经常损益的每股收益)作为判别变量,则判别准确率可达到82.8%。至此,从17个自变量中选取变量和后判别达到最优(见下页表7)。
四、结论
通过采用logistic回归分析方法,可以得出结论预测模型在预测上市公司财务造假预测方面具备了较强的可信度。通过模型的建立和预测,可以认为模型具备以下几个优点:
一是模型中选择的原始财务比率指标具有较强的解释能力,能较好地辨别出样本公司和配对样本公司年度报告审计意见为“标准意见报告”或“非标准意见报告”类公司。
二是模型中每股净资产具有较强的判别能力,单一指标准确率为75.3%。上市公司的每股净资产主要由股本、资本公积金、盈余公积金和未分配利润组成。根据《公司法》的有关规定,股本、资本公积和盈余公积在公司正常经营期内是不能随便变更的,因此,每股净资产的调整主要是对未分配利润进行调整。由此,可以得出财务造假主要是对未分配利润进行调整的结果。
表5 进入方程变量
a Variable(s) entered on strp 1:
b Variable(s) entered on strp 2:
表6 分类结果表
表7 步骤总结表
a No more variables can be deleted from or added to the current model.
b End block:1
三是模型中加入扣除非经常损益的每股收益指标判别准确率为82.8%。扣除非经常性损益的每股收益是以扣除非经常性损益的净利润除以股本。非经常性损益可能是由于显失公允的关联交易、资产置换、处理下属部门、被投资单位股权和会计政策变更而引起。因此,财务造假可以通过对上述项目操作而达到目的。
四是logistic回归分析方法是一种科学的统计方法,且在SPSS等统计分析软件的支持下,使这种预测变得可行。
五是通过财务造假上市公司的实证检验,预测准确率达82.8%。这说明该模型具有较好的预测能力,有一定的实践意义。
综上所述,通过logistic回归分析方法建立该模型,选取每股净资产指标和扣除非经常损益的每股收益指标作为依据具有较好的判别能力。因此,应加强对上述两个指标及相应项的审计力度。
标签:审计意见论文; 逻辑回归论文; 回归模型论文; 判别分析论文; 逻辑模型论文; 每股净资产论文; 模型公司论文; 统计学论文; 财会论文;