论Benford法则作为一种反舞弊审计手段的局限性
吴国平
【摘 要】 二十世纪80年代末以来,国内外理论界试图将Benford法则作为一种数值分析方法引入舞弊审计领域;国内外相关研究文献虽多,却鲜少论及最核心、最关键的问题:即Benford法则作为一种数值分析方法在舞弊审计中是否具有有效性的问题。Steven W. Smith基于傅里叶变换视角提出的一套理论解析框架,有助于该关键性问题的分析。这一理论解析框架的适当完善与扩展,表明并非所有随机过程产生的数据都符合Benford法则,因此,在审计实务中把Benford法则作为一种财务舞弊检验器是缺乏严密理论依据的。
【关键词】 Benford法则;舞弊审计;卷积定理;Smith判别定理
随着财务欺诈与舞弊行为的频繁发生,欺诈与舞弊手段也日趋隐蔽复杂,如何改进和提升财务欺诈与舞弊行为审计能力成为审计界与社会公众共同关注的焦点。20世纪80年代末以来,作为一种数值分析方法,Benford法则逐渐被引入舞弊审计领域。相关研究文献虽多,却鲜少论及最核心也是最关键的问题:即Benford法则作为一种数值分析方法在舞弊审计中是否具有有效性问题。众多研究文献事实上都先验性假定其所分析的数据对象,本质上应符合该法则,如果“实然”状态偏离“应然”状态,则推断存在欺诈与舞弊行为。本文认为正是囿于此种逻辑推理上的局限,导致了对该工具本身普适性的怀疑,因而不具有广泛、系统地推广使用的基础。
一、Benford法则内涵
Benford法则①是关于随机数组非零首位数概率分布的规律,亦称“首位数分布规律”。Simon Newcomb在1881年首次发现许多类型的随机数组都很好地符合以下规律:以1为首位数的随机数要比以2为首位数的随机数出现的概率大,而以2为首位数的随机数又比以3为首位数的随机数出现的概率要大,依此类推,但纽卡姆并没有对这一定律做出任何解释。1938年Frank Benford再次注意到同样的现象,并首次推导出Benford法则的数学表达式,即各非零首位数出现的概率为:
P(n)=log10(1+1/n)
共建,让建设“绿色西江”的力度不断加大。海事部门大力推进西江流域船舶污染物接收转运处置、港口码头污染防治和船舶船型标准化工作。西江沿线各市已经设立21个船舶溢油应急物资储备仓库,初步覆盖沿线水域,大大增强了船舶溢油处置能力;佛山市引导西江9家危险品码头,建立溢油应急联防体和相应工作机制,提升企业联防联控水平。
物联网在家庭安防、安全方面应用广泛,佳木斯的住宅小区大多采用了RF门禁系统,加强了小区的安防建设,室内天然器传感器可以及时检测到报警数据,立刻启动报警器,提高了居民的安全感。电表、燃气表、水表自动结算系统,方便了居民缴费;多媒体自动娱乐丰富了居民生活;家电自动控制,使居民生活更加方便。
其中:n=1,2,3……,9;P(n)代表随机数首位数为n的概率。
根据以上公式,数字首位非零数字为整数“1”的概率大约为30.10%,为整数“2”的概率大约为17.61%,而整数9在首位出现的概率仅为4.58%,完全颠覆了均匀分布的预期。
二、文献回顾
1988年,Carslaw首次运用Benford法则对公司利润舞弊进行实证研究。1994年Raimi和Boyle对大部分财务数据为什么都符合Benford法则的原因进行了研究。Nigrini[1](1996)认为审计人员可以通过检测实际数据中各首位数字出现的频率并与Benford法则理论值进行比较,发现两者的差异,从而获得通过传统的数据分析方法和抽样技术不能获得的信息。Nigrini为此开发了对财务数据进行Benford法则测试的计算机软件,首次把Benford法则系统广泛地应用到舞弊审计领域。
国内研究文献早期注重于对Benford法则的验证性测试,中期则关注其在实务中的可运用性问题,后期则涉及到此方法的局限、修正与完善。总体而言,研究的深度和广度远不及国外同行,缺乏标杆性的理论成果,学术界相关理论研究虽多,但并未得到广大审计实务工作者的普遍认可。
陈曦、万宇飞、李璐[7](2012)采用近11年的中国上市公司财务数据,对Benford法则的适用性作出检测。刘云霞,曾五一[8](2013)探讨了如何将Benford法则与异常值探测、数据挖掘技术等方法相结合,从而找出可能存在数据质量问题的具体样本及其规律的方法,并利用该方法对我国保险行业2006-2011年主要经济指标的数据质量进行了实证分析。张苏彤[9](2016)利用“人为造假”的样本数据与随机数样本数据对该法则进行测试,证明了Benford法则在舞弊侦测方面的有效性,认为Benford法则在识别“人为造假”数据方面具有明显作用,可以将Benford法则及其相关的数值分析工具视为“财务舞弊检验器”;罗玉波[10](2016)对相关研究文献进行了系统的梳理、总结与述评,指出应用Benford法则于经济信息质量检测方面的研究较多,主要表现为应用相关经济信息数据库对Benford法则进行实证研究,但作为一种审计技术方法使用得比较少,应用于中小企业会计信息的鉴证则更少。孟杰、王欣、张然[11](2017)指出,Benford法则通常只适用于完整数据集的数据质量评估;对于完整数据集的有界子集,应采用修正Benford法则评估其数据质量。陈伟、吴正、刘海[12](2017)则在自主研发的审计软件中实现基于Benford法则的大数据审计方法。牛志勇、张耀武[13](2018)针对1999-2011年中国工业企业和城市经济统计数据,利用Benford法则对中国工业企业财务数据进行了质量检验和分析。结果显示中国工业企业的资产、纳税数据质量相对较好,销售和成本数据可能存在质量问题,有证据表明工业企业在销售等数据上有调整的可能性,数据质量需引起注意。
如何判断连续型随机变量是否符合Benford法则呢?Steven W. Smith基于傅里叶变换视角提出的一套理论解析框架,有助于以上关键性问题的解决。
除此之外,尚有若干作者运用Benford法则于矿山安全数据、医疗数据、保险理赔数据、农业统计数据可信度评估等方向。
国内学者自本世纪初起对Benford法则展开研究。冯郁和丁国勇[2](2003)对Benford法则的正确性进行了验证;张苏彤[3](2005)利用2003年1394家上市公司的主要财务数据进行验证性测试;张苏彤和康智慧[4](2007)对2006年我国1447家上市公司的主要财务数据与Benford法则理论值进行相关系数的验证性测试,并从相关系数的角度得出了财务舞弊公司的主要财务数据与Benford法则理论值相关性较差的结论;李勋[5](2006)对Benford法则在审计中的适用性和效果进行分析,进行相关技术手段设计,总结了在审计实践中应用该法则的优缺点、应该注意的问题以及应用展望。王福生、李勋和孙逊[5](2007)阐述了Benford法则在审计领域应用的成果、适用性以及优缺点,并借助于某股份公司的财务数据验证其在舞弊识别上的有效性。
目前我国正深化教育改革,着力培养素质全面发展的合格公民,从客观上要求加强和扩大中小学图书馆职能的发挥,而中小学图书馆给未成年人群体以适当的智识发展和精神发育上引导及文化熏陶就会成为其创建和发展的最大意义。由上述对教育学理论基础的回顾与阐释,可简单得出下列启示性的对策,希望对实际工作与理论研究都产生帮助作用。
第二,巧妙导入激发学生学习兴趣。高中历史教学中激发学生学习兴趣的手段比较多样,在教学中精心的安排课程巧妙的加以导入,对激发学生学习兴趣就有着积极作用。历史课堂教学当中的巧妙导入是不可缺少的环节,教师在实际教学当中要和教学内容以及学生自身特点紧密结合起来,通过针对性的设计才能激发学生学习兴趣。对于热门话题导入方法的应用就比较有效,将学生喜闻乐见以及比较关心内容能够作为切入点,这对激发学生学习兴趣就有着促进作用,能有效吸引学生的注意力。
三、Smith判别定理
在上述描述中,制造能力以制造活动为载体,体现了制造活动对制造资源,例如生产设备、原材料、加工工艺和加工技术等运行的能力水平。因此,根据不同生产任务、生产类型、生产工艺的需要,制造能力进一步划分为不同的针对制造活动的制造能力,如生产能力、库存能力、加工能力、装配能力等。
(一)模型构建
国家各项事业的发展离不开经济建设的支撑与推动,中国志愿服务的发展也同样如此。改革开放以来,中国志愿服务取得了快速发展,这都归功于经济建设的发展与支持。未来要推动中国志愿服务更进一步发展,必须清楚认识经济建设在其发展过程中的地位及作用,有效开发经济建设的价值,助力中国志愿服务长效发展。
图1 随机变量的概率密度函数、位移与取样函数
sfn(x)与pdf(x)的乘积,等同于取样函数 sfn(x)将概率密度函数pdf(x)分割为若于孤立的部分,各分割出的孤立部分代表首位数为n的部分,其面积之和记为ostn(0):
当pdf曲线向右微移s后,取样函数 sfn(x)同样将右移后的pdf曲线分割为若干孤立的部分,其面积之和记为ostn(s):
一要根据“产教融合”特征,加强校企双质量监控机制的构建。首先建立校督导、企业督导共同参与的质量监控团队,既可以监控会计专业学生学习效果,也可以促进企业与本科高校的通力合作,重点确保企业督导能深度参与学校的专业教学过程中;其次,明确“校、企、生”三位一体的责权利,逐步优化运作制度,保障会计学专业本科生能得到充分的指导。
等式(2)表明函数ostn(s)等于取样函数sfn(x)与概率密度函数沿Y轴的镜像pdf(-x)的卷积(Convolution)④,因而上式可简写为:
YIN Wei, WANG Tie-gong, XU Bing, YE Feng-ping, WANG Min-jie
根据傅里叶变换的时域卷积定理⑤⑥可得:
推论5:对于标准正态分布其傅里叶变换在各非零冲激点| PDF⋆(ω)|>0,不遵循Benford法则。同理X~N(µ,σ)也不遵循Benford法则。正态分布在严格意义上虽不遵循Benford法则,但当其方差σ足够大时,其偏离Benford法则的幅度将非常小。
上式等同于:
图2 取样函数 sfn(x)傅里叶变换的振幅频谱⑧
图3 复平面上sf1(x)的余弦、正弦分量振幅频谱变动轨迹⑨
(二)Smith判别定理及推论
等式(6)⑦表明ostn(s)的傅里叶变换为一周期T=ω0、冲击强度=2πFnkPDF⋆(ω)的冲激串。因取样函数(周期性矩形方波函数)周期T =1,所以基频ω0=2π/T=2π,因而,OSTn(ω)在各冲激点的模值为:2π|Fn,k|.|PDF⋆(ω)|ω=2kπ
图2反映了Fn,k(n=1,2, …,9)的模值变化,图3则反映正、余弦分量振幅频谱的变动轨迹及收敛情况,其零点为2kπ/τn,因τn= log10(1+1/n)为无理数,所以在所有的冲激点ω=2kπ处,|Fn,k|≠0,即an、bn不可能同时等于零。
故时域函数ostn(s)的傅里叶变换的频谱特征主要由概率密度函数的傅里叶变换的共轭函数PDF⋆(ω)决定。若时域函数ostn(s)遵循Benford法则,则其所有谐波分量应为零。故可得出:
Smith判别定理:连续型随机变量X遵循Benford法则,当且仅当在所有的非零冲激点ω=2kπ处 ,| PDF ⋆(ω)|≡0。
根据以上判别定理,可有如下推论:
推论1:对于单位冲激函数(pdf(x)=σ(x)),其傅里叶变换PDF⋆(ω)=1(“白色谱”),在各非零冲激点| PDF⋆(ω)| ≡1,故不遵循Benford法则。
推论2:对于区间[n m]上的均匀分布pdf(x)=1/(m-n)(n≤x≤m,m-n为非零整数),其傅里叶变换PDF⋆(ω)=e-j(m+n)ω/2Sa[(m-n)ω/2],在各非零冲激点| PDF⋆(ω)|≡0,此时Benford法则成立。
图4 三角脉冲函数的傅里叶变换振幅谱
①Benford,s Law的中文译法很多,有译为“法则”的,有译为“分布律”的,更多的则称其为“定律”,本文统称为“法则”。
推论4:对于三角脉冲函数pdf(x)=1-|x|(|x|≤1,否则为0),其傅里叶变换PDF⋆(ω)=sa2(ω/2),在所有的非零冲激点ω=2kπ处,︱PDF⋆(ω)|≡0,此时Benford法则成立。除此之外尚可构造出满足一定条件的由若干三角脉冲组成的函数,Benford法则亦成立。
这个例子或许能够佐证,《图像学》中那些拟人形象方案,里帕即便采纳的是视觉化图像资源,也未必是他个人的实际观察,而更可能去参考文学作品中“艺格敷词式”描述。毕竟,“特征描述法”这种易于再现画面的文字表达手段,不仅适用于古代的那些佚失无存的图像作品,而且适用于当时那些受到热议,却囿于地理距离无法亲往一睹的赫赫名作。
(3)基塘系统。澎溪河湿地自然保护区的实验区的生态恢复中运用了多功能基塘系统,经过多年的淹没考验,如今基塘结构依旧稳定,植物生长情况良好,系统生态服务功能高效,生态效益良好[21]。在三峡水库消落带实施的多功能基塘是应对季节性水位变化的一项生态工程尝试,它为消落带生态修复提供新途径的同时,也强调了生态系统结构和功能的整体性优化和生态系统服务功能持续性提升的思想。
推论6:根据傅里叶变换的相似性定理(尺度变换特征)⑩,对任意连续概率密度函数pdf(x),当a足够小时,pdf(ax)与Benford法则的偏差幅度将逐渐缩小。
(三)结论检验
在Matlab R2012b上对上述推论2、4、5进行检验,推论2的区间设定为(0,1),推论4的区间设定为(-1,1),均匀分布随机数用rand函数生成,推论4用逆变换法(Inverse Transform Method)从其概率密度函数生成所需随机数,推论5直接用normrnd函数生成所需随机数。为了比较对每个分布均采用两个以上不同的方案进行检验,检验结果如表1所示,表明理论分析结果完全正确。
设X为一连续随机变量(假定其取值为正实数②),其概率密度函数为pdf(x);sfn(x)为宽度τn③、高度1、周期长度1的周期矩形方波函数,因用其完成取样,所以又称取样函数。
表1 均匀分布、三角脉冲函数与正态分布首位数概率分布检验结果
四、结论
以上研究表明,并不是任何随机过程产生的数据都符合Benford法则,当且仅当在满足特定条件后Benford法则才严格成立。有鉴于此,在审计实务中把Benford法则作为一种反舞弊审计手段是缺乏坚实理论基础的,不能充当财务舞弊检验器角色,数值分析的结果具有一定程度的误导性。审计作为一种鉴证技术方法,不论是风险导向审计,亦或合规性审计,都需要审计人员通过制订合理审计计划,执行风险评估、实施控制测试,采取针对性实质性程序等一系列审计工作,在获取充分适当的审计证据基础上形成审计结论,最终发表审计意见。审计执业质量的高低更多依赖于广大审计人员对审计实践经验的归纳、总结和积累,寄希望于通过Benford法则来高效精准地发现隐藏在财务数据谜雾后面的舞弊真相是不切实际的。
注释:
推论3:对于若干区间[nimi]上的均匀分布pdfi(x)=ri(ni≤x≤mi,mi-ni为非零整数,且∑ri(mi-ni)=1),根据傅里叶变换的加法定理,可知其傅里叶变换:在各非零冲激点| PDF⋆(ω)|≡0,此时Benford法则成立。
检索算法效果对比如图3所示。由图3可知,本文应用环境(查询结果不多于5条)限制,lucene的排序算法查准率不高,使用本文设计的3种计算方法,查准率较高,检索出的结果精确度较高。3种算法比较,结果表明,归一化算法的查准率稍高于其他两种算法。笔者认为,项目(湖南农业信息平台)运行初期,归一化算法在检索上优势明显;但当数据量为海量时,向量空间模型的优势将得到体现。本文在农业检索方面只做了基础的研究工作,随着农业知识库的不断完善,算法需要不断的改进。
②假定首位数函数为B(x),则B(x) =B(-x) =B(10^n.x)(n为整数),即具有对称性、尺度不变性,因分析的需要可限定随机变量X为正实数(负数通过取其相反数处理);对随机变量X取其常用对数log10X,则B(log10X)=B(n+log10X)具有周期性且最小周期T=1,这样与取样函数具有相同的周期,根据中心极限定理这也可以在一定程度上解释为什么大部分财务数据都比较符合Benford法则的原因(Raimi&Boyle)。如不作特别声明,则本文中的随机变量x是指进行对数转化后的值,因而时域中的坐标轴X为对数轴。
③τ值随取样任务的变化而变化,当要完成首位数n的取样时,其值为τn= log10(1+1/n)。
④[美]罗纳德.N.布雷斯韦尔著.殷勤业 张建国译. 傅里叶变换及其应用(第3版)[M] .西安交通大学出版社. 2005年9月第1版,P18。
⑤TF表示傅里叶变换,OSTn(ω)为ostn(s)的傅里叶变换,SFn(ω)、PDF*(ω)亦然。PDF*(ω)表示PDF(ω)的共轭。因pdf(x)≥0且所以如pdf(x)为实偶函数则其傅氏变换为实偶函数(如高斯分布、三角分布等),则PDF*(ω)= PDF(-ω)= PDF(ω);若pdf(x)为非对称正实函数,则其傅氏变换为复的Hermitian函数,因而pdf(-x)的傅氏变换为pdf(x)傅氏变换的共轭函数,即PDF*(ω)= PDF(-ω)。
⑥时域卷积定理指时域两函数卷积的傅里叶变换等于它们傅里叶变换的乘积,即时域卷积等同于频域点积.卷积符号用“*”表示。
⑦反映时移的相位影响。
⑧为了数值观察的方便,此振幅频谱图未考虑相位影响。另为了作图方便X轴的角频率ω都省略了2π,图中m刻度处的真实角频率应为2πm。
⑨此图为三维立体图形在复平面上的投影图,反映余弦、正弦分量振幅频谱缠绕ω轴变动情况,振幅越来越小并最终收敛于ω轴。其余Sfn(x)的变动轨迹与Sf1(x)图形类似,只是an、bn的数值有所区别。
⑩相似性定理指,如f(x)的傅里叶变换为F(ω),则f(ax)的傅里叶变换是 1/︱a︱.F(ω/a),当时域函数f(x)在水平方向扩展(压缩)时,则其傅里叶变换函数将在水平方向上压缩(扩展),在垂直方向增长(下降)。
参考文献:
[1]Mark J.Nigrini.Using Digital Frequencies to Detect Fraud[J].The White Paper,1996.
[2]冯郁,丁国勇.班福法则及其审计应用[J].审计理论与实践,2003(12).
[3]张苏彤.奔福德定律:一种舞弊审计的数值分析方法[J].中国注册会计师,2005(11).
[4]张苏彤,康智慧.信息时代舞弊审计新工具——奔福德定律及其来自中国上市公的实证测试[J].审计研究.2007(3).
[5]李勋.奔福德定律在审计中的应用研究[D].哈尔滨工业大学硕士学位论文.
[6]王福生,李勋,孙逊.奔福德定律及其在审计中的应用研究[J].财务通讯,2007(3).
[7]陈曦,万宇飞,李璐.基于本福德定律发现企业舞弊的适用性--针对我国上市公司财务数据的实证测试[J].财会月刊,2012(6).
[8]刘云霞,曾五一.关于综合利用Benford法则与其他方法评估统计数据质量的进一步研究[J].统计研究,2013(8).
[9]张苏彤.奔福德定律与舞弊审计-基于“人为造假”与随机数样本的实证测试[J].会计之友,2016(12).
[10]罗玉波.Benford法则在审计中的应用研究:文献回顾与展望[J].广东石油化工学院学报,2016(6).
[11]孟杰,王欣,张然.修正Benford分布律及其模拟研究[J].统计理论与方法,2017(9).
[12]陈伟,吴正,刘海.基于Benford法则的大数据审计方法研究与实现[J].中国注册会计师,2017(9).
[13]牛志勇,张耀武.企业数据质量与经济发展水平的关系:基于Benford法则的实证研究[J].数理统计与管理,2018(1).
[14]Mark J.Nigrini:A taxpayer compliance application of Benford’Law [J].Am. Taxation Assoc,1996.
[15]Hill.T.P:A Statistical Derivation of the Significant-Digiit Law[J].Statsci 1996(10).
[16]Mark J.Nigrini:I’ve Got Your Number[J].Journal of Accountancy,1999(5).
[17]Eugenio P.Balanzario,Jorge Sanchez-Ortiz:Sufficent conditions for Benford’s law[L].Statistics and Probability Letters,80(2010).
[18]G.Whyman,N.Ohtori,E.Shulzinger,Ed,Bormashenko:Revisiting the Benford-like distribution of leading digits in sets of numerical data is expectable? [L].Physica A 461(2016).
[19][美]罗纳德.N.布雷斯韦尔著,殷勤业,张建国译.傅里叶变换及其应用(第3版)[M].西安交通大学出版社,2005年9月第1版.
[20]Steven W. Smith. The Scientist and Engineer’s Guide To Digital Signal Processing(2nd Edition)[M].California Technical Publishing.San.Diego.California,1998.
(四川大学经济学院,四川 成都 610064)
作者简介:
吴国平(1971—),重庆人,四川大学经济学院讲师、会计师,经济学博士研究生毕业,主讲会计学等课程,先后在《四川大学学报(哲社版》、《天府新论》、《研究与发展管理》、《对外经贸实务》等刊物发表论文十余篇,从事财务管理工作十余年。
标签:Benford法则论文; 舞弊审计论文; 卷积定理论文; Smith判别定理论文; 四川大学经济学院论文;