统计检验:实证会计研究方法的核心,本文主要内容关键词为:实证论文,核心论文,会计论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、统计检验与实证会计研究方法之关系
有比较才能有鉴别。为认清实证会计研究方法的特点,我们不妨先把它和传统的规范会计作一考察对比。
规范会计学是一套关于“应该是什么”的系统知识体系,它以若干会计假定为起点(根据我国《企业会计准则》,会计假定包括会计主体假定、持续经营假定、会计分期假定以及货币计量假定),通过提出一系列基本的会计原则、会计准则的规范要求,从逻辑高度上概括或指明最优化的会计实务是什么,进而指导实务,规范实务。实证会计理论是一套关于会计“是什么”的系统知识体系,目的在于揭示会计现象的内在规律性,从而为解释现行会计实务和预测未来会计实务提供理论依据。
规范会计研究的这种作法自有其道理。因为对现实进行抽象是一切科学研究的起点。具体的会计实务成千上万,它们虽能帮助我们增加对会计的亲切感,但如果不作抽象,系统的会计知识就不可能形成。概念的抽象能够弥补行知的不足。这可以视为一个普遍的规律。
实证会计研究的核心是:根据经济学等有关理论,设立各种有关影响会计事务因素的假设,然后采用一定的科学方法,进行实际的调查研究,以证明这些假设的现实性。
由此可见,实证会计研究中所说的假设(Hypothesis)与规范会计研究中所说的假定(Assumption)是完全不同的概念。规范研究中所说的假定,是对所研究问题设定的基础条件,亦即研究之前根据人们的某种共识或前人的权威论断,研究者对问题存在的主客观环境作出一些限制性约定,如经济行为遵循的规则、价值判断的依据、特定的历史、经济、文化环境以及行为主体的基本特质等等。作出这些约定,是为了使规范研究的问题环境得以简化,逻辑推理有公认的起点与规则。因此规范研究中所说的假定在该研究过程中是不可能改变的。不同的规范研究者对同一个问题可以建立不同的假定,这样就可以导致不同的结论。规范研究的理论发展通常是通过对以前研究的前提假定作出修改或扩展而实现的。
而实证研究中所说的假设,是对所研究问题的结果或状态的一种预期,需要通过假设检验,用证据判断其真伪。也就是说,经过实证研究,开始时提出的假设,最终可能因得到实际资料的支持而被认可,也可能,由于实际资料不支持而被拒绝。若一个假设可以用统计方法加以检验的话,则这种假设就可视为能够检验的,也就是“可证伪的”,当然,并非它一定会被证伪。
建立可证伪的假设就是建立可检验的假设。之所以称之为“可证伪的”假设,是因为假设检验统计方法的基本思路是利用样本所提供的信息去论证是否可以据此推翻原假设。实证会计研究方法尽管有多种多样,既有传统的统计描述、回归相关分析,也有比较高级的统计分析方法如方差分析、聚类分析、判别分析、因子分析、多元统计分析、条件概率、贝叶斯方法、定性资料的统计分析方法,等等,但使用这些方法的目的只有一个,那就是利用数据检验假设,解释结果并得出结论。因此,统计检验是实证会计研究方法的核心。
二、统计检验在实证会计一般实证过程中的体现
如上所述,抓住假设检验在实证会计中的应用,就意味着抓住了实证会计方法的关键。统计检验在实证会计的一般实证过程中的核心作用可通过以下四个步骤来体现。
第一步:提出原假设和备择假设
这是对研究人员处理问题能力的一种锻炼,关键在于要把握住具体问题的会计学与经济学涵义。正确区分原假设和备择假设是实证会计研究取得成功的前提。原假设通常用H[,0]表示,而备择假设用H[,1],或H[,a]表示。H[,0]指观察到的差异只反映机会变异,而H[,1]或H[,a]指观察到的差异是真实的。
第二步:选取作假设检验用的统计量
这也是一种能力锻炼,它注重的是研究人员运用数理统计工具的能力。这一步和下一步,从统计学上看难度较大。好在当我们利用常用的统计量作推断时均有数表可查。
为使统计量T发挥作用,它必须具备下列两个重要性质:一是当H[,1]成立时,T(X[,1],X[,2]...,X[,n])的表现应与当H[,0]成立时的表现有所不同,因为T(X[,1],X[,2],...,X[,n])是用来表明推翻H[,0]的证据之强弱的,并且一般地,实际情况和H[,0]的假定差别越大,T(X[,1],X[,2],...,X[,n])的表现也就该越不相同;二是在假定H[,0]成立的条件下,T(X[,1],X[,2],...,X[,n])的概率分布必须能够计算出来(至少能近似地算出)。这个概率分布称为零分布,它提供了一个基准,据此判断在假设H[,0]下,我们所观察到的样本数据相对于H[,0]而言合理或不合理的程度,可用以评价所得到的推翻H[,0]的证据的显著(强弱)程度。
第三步:临界区域的构造及其利用
统计量T(X[,1],X[,2],...,X[,n])选定之后,可以设问:“统计量的什么样的样本观察值能够表明我们得到了推翻H[,0]的证据?那种能表明H[,0]不成立的统计量观察值的全体,就被称为临界区域。因此,若发现由数据算出的T(X[,1],X[,2],...,X[,n])值位于临界区域内,我们就拒绝H[,0]而支持H[,1]。此事一经发生,就可以说得到了足以拒绝H[,0]的显著证据,或者说,T(X[,1],X[,2],...,X[,n])的值是显著的;但若T(X[,1],X[,2],...,X[,n])不在临界区域内,就表示没有足够的证据拒绝H[,0]而支持H[,1],这时就可以说T(X[,1],X[,2],...,X[,n])值是不显著的。
第四步:显著性水平的确定及临界值的决定
如果确认T≥c为临界区域合适的模型(自然可以讨论T>c、T≤c及T<c的情形),c值该如何选?遗憾的是,无论在现实中怎样确定拒绝或不拒绝H[,0]的标准,总有可能作出错误的结论。
例如,若临界区域相对说来很大,则H[,0]有可能遭拒绝而事实上不该拒绝。另一方面,若把临界区域做得很小,则在应该拒绝H[,0]时反而没有拒绝它。在实践中,H[,0]的拒绝与否取决于检验的显著性水平。所谓显著性水平,即当客观上H[,0]成立而被判不成立时,我们所需承担的风险(此即“第1类错误”,通常用α表示)。可见显著性水平就是当H[,0]成立时获得有显著意义的拒绝H[,0]的T(X[,1],X[,2],...,X[,n])值的概率。显著性水平越高,临界区域就越大;显著性水平越低,临界区域就越小。
在实证会计研究中,经常采用的显著性水平为1%,5%,10%(注:在实践中,实证会计研究人员常使用P[-]值(即观察到的显著性水平)。使用P[-]值的好处是,一般地说,在单侧检验时,不明确的先验信息所导出后验概率与P[-]值近似,而经典的犯第Ⅰ类错误及第Ⅱ类错误的概率通常都不与相应的后验概率近似。)。
完成上述四个步骤之后,我们就可以作出关于H[,0]的结论了。首先,现实显著性与统计显著性是有差别的:现实显著性着重在所观察到的差异有无实际上的重要性,而统计显著性则着重所观察到的差异可否仅用随即性去解释;其次,统计上的显著性不必有现实意义,但是,若现实的显著性达不到统计显著性,则不能充分使人信服,因其不能排除偶然因素的作用;最后,在实证会计研究中,这种对统计问题的解释是需要谨慎对待的。
三、使用简单假设检验应注意的问题
笔者认为,使用简单原假设检验应注意以下几个问题。
首先,在概率论中,两个随机变量X,Y之间的相关程度常用相关系数ρ表示,它实际是线性相关性,且须假定X,Y均来自正态总体。因而,H[,0]:ρ=0,H[,1]:ρ≠0这种形式的检验就很常见。(无论是原假设还是备择假设,若原假设假定我们所关心的参数取单一数值,则称为简单原假设,否则就称为复合原假设)若H[,0]成立,则X,Y之间不存在相关关系,一般说来,我们也就不必关心它们了。
其次,对容易量化与不容易量化者要有所选择。在实证会计文献中,这种形式的简单原假设检验也很普遍,但形式上有变化。人们更常用回归方程能否通过统计检验的方式,来考虑两个随机变量是否有相关关系(甚至是因果关系)。
比起直接考察H[,0]:ρ=0,H[,1]:ρ≠0,用回归方程研究两变量之间的关系,虽然计算上复杂一些,但问题的性质并无改变:都是利用统计检验对简单假设作出取舍决定。当然,使用回归方程的形式自有其原因。
这种用回归方程考察两个随机变量是否相关的简单原假设检验,应引起我们的重视,因为,这涉及与经典答案完全不同的贝叶斯解释(可惜许多实证会计文献对此关注不够)。
笔者发现,实证会计问题所涉及的随机变量,往往是一个容易量化而另一个则不容易量化,须经人为地“变量分解”才行。比如,美国学者Mark H.Lang & Russell J.Lundholm在其“公司信息披露政策与财务分析师行为”一文中(注:Corporate Disclosure Policy and Analyst Behavior,by Mark H.Lang & Russell J.Lundholm,The Accounting Review,Vol.71.No.4,Oct1996。),就试图考察“财务分析师人数”与“对某公司信息披露政策有了解”这两个随机变量之间是否存在关系。如果这两个随机变量都容易量化,则取一样本(Xi,Yi),i=1,2...n,计算简单相关系数r并对其作相应的t[-]检验或F[-]检验,即可作出判断。
在这个问题中,不好量化的显然是“对某公司信息披露政策有了解”。Mark H.Lang & Russell J.Lundholm的做法是,设计7个可计量的(解释)变量来近似表示“对某公司信息披露政策有了解”,从而建立“财务分析师人数”关于这7个解释变量的回归方程(注:Number of Anakysts=α+β[,1] Annual Report+β[,2] Other Publications+β[,3] Investor Relations+β[,4] Total Score+β[,5] Market Value+β[,6] Standard Deviation of ROE+β[,7] Return-Earnings Correlation+ε。),经过抽取样本,对数据作分析,两位作者得出“财务分析师人数”与“对某公司信息披露政策有了解”两变量之间有密切关系的结论。
两个随机变量,一个容易量化,一个不容易量化,选择若干容易计量的变量代替不容易量化的变量,建立回归方程,以研究所关心的两个随机现象之间的相关关系,这种例子俯拾皆是。这既是当代统计学的发展趋势,也是实证会计研究的特点所在,可以认为是一个规律。我们认为研究水平的高低往往取决于回归自变量的选择是否适当。
H[,0]的后验概率
z(P[-]值)
n
1
5
10
20 50 100 1000
1.645(0.1)
0.42 0.44 0.49 0.56 0.65 0.72 0.89
1.960(0.05)
0.35 0.33 0.37 0.42 0.52 0.60 0.80
2.576(0.01)
0.21 0.13 0.14 0.16 0.22 0.27 0.53
3.291(0.001) 0.086 0.026 0.024 0.026 0.034 0.045 0.124
(本表录自“统计决策论及贝叶斯分析”,第166页,[美]James O.Berger著,贾乃光译,吴喜之校译,中国统计出版社1998)
第三,进一步思考贝叶斯推断的特点。进行形如H[,0]:ρ=0,H[,1]:ρ≠0的原假设为简单假设的检验,通常是不适当的。事实上,完全接受丝毫不差的ρ=0的可能性不存在。更合理的原假设应该是ρ∈Θ0=(0-b,0+b),其中b>0为某一常数,选择b使ρ∈Θ0与ρ=0“难以区别”。
当确知应做检验H[,0]:ρ∈Θ0=(0-b,0+b)时,需要知道何时以H[,0]:ρ=0作为近似是适宜的。按贝叶斯的观点,此问题唯一明智的答案是,若这两个检验的H[,0]的后验概率近似相等,则这种近似就告成立,而出现这种情况的一个很强的条件是,观测值的似然函数在(0-b,0+b)近似为常数。(注:对贝叶斯分析而言,直接处理区间的假设比审查用简单假设做近似是否合适来得容易。但为了和经典作对比,也可以进行简单原假设的贝叶斯检验。)
就关于正态总体均值的简单假设检验而言(设方差已知),众所周知,所用的检验统计量是z。假如先验的具体值为μ=θ0,π0=1/2(π0为使原假设成立的参数集合之先验概率),σ=τ,则对各种z(选择它使之相应于经典的双侧P[,-]值,或假设为简单假设的检验显著性水平α)及n的后验概率由上表来给以列出。
此表的数值令人惊讶。因为若由观测值得到z=1.96,经典理论拒绝H[,0]的显著性水平σ为0.05。给人的印象是,这个值越小H[,0]越可能不成立。但H[,0]的后验却很大,从n较小时的约1/3,到n较大时的接近于1。而当z=1.96时,(对此具体先验而言)事实上几乎不提供拒绝H[,0]的证据。贝叶斯推断与经典推断的结论恰好相反(这矛盾被称作Jeffreys悖论或Lindley悖论,人们发现它已近半个世纪了)。
这里有一个问题需要说明,即如何解释经由概率抽样且样本容量适中,在显著性水平α为0.05水平上却作出了关于正态总体(方差已知)均值的简单假设检验?
笔者认为,这一悖论能促使我们进一步思考贝叶斯推断的特点,深化我们关于从样本推断总体的认识。不言而喻,贝叶斯方法认为样本的作用是使对θ的认识深化,由先验分布转化为后验分布。后验分布包含了θ的先验信息与样本观测值提供的信息(先验密度因此不再包含任何信息),从而形成贝叶斯推断的基础。问题在于,“先验分布转化为后验分布”是否具有完全性。特别是在经典推断与贝叶斯推断所得结论不相协调时,更应谨慎从事,例如可结合数据并注意到先验密度来对模型的适用性展开研究。这时,相关的会计专业知识及会计实践经验就能发挥作用。
标签:会计论文; 显著性论文; 贝叶斯论文; 显著性水平论文; 假设检验论文; 显著性检验论文; 会计假设论文; 实证经济学论文; t检验论文; 财会论文;