数据挖掘在计算机审计中的应用,本文主要内容关键词为:数据挖掘论文,计算机论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据挖掘是指从大型数据库中挖掘先前未知的、有效的、可实用的信息,并使用这些信息做出决策或丰富知识的一个完整的过程。"数据挖掘"这个名字源于它有点类似于在矿山中挖掘有价值的矿藏。数据挖掘环境如图1所示:
数据挖掘是一种决策支持过程,其目的在于通过对数据的统计、分析、归纳和推理,揭示事物之间的相互联系,预测未来的发展趋势,起到辅助实际工作、支持决策的作用。
数据挖掘的目标是从数据库中发现隐含的、有意义的知识,而审计的目标是通过对被审计单位财务报表及有关经济资料的审计,查证其经营活动的经济性、效率性、效果性及管理活动的可行性、有效性。由此可见,两者的目标是一致的,都是通过数据资料揭示其背后隐藏着的本质。因此,作为一种有效的技术手段,数据挖掘在审计领域中有着广阔的应用前景。
以上市公司财务报表审计为例,通常财务报表提供了反映公司经营情况及财务状况的各种不同数据及相关信息,但它仅仅是一种历史性的静态文件,只能概括地反映该公司在一段时间内的财务状况与经营成果,这种概括的反映还不能作为审计人员做出审计结论的全部依据。在审计时,应将公司财务报表与公司历史进行纵向深度比较、与同行业进行横向宽度比较,舍弃其中偶然的、非本质的东西,把握其中实质性的信息,以保证审计结论的正确性与准确性,因此在审计中需要对公司长期的、动态的大量财务数据进行知识挖掘,而这时数据挖掘技术就成为一个得心应手的工具。
数据挖掘的主要功能包括聚类、关联分析、概念描述、偏差检测、自动预测趋势和行为等,通过这些功能可以挖掘出不同类型的知识,如广义型知识(反映同类事物共同性质的知识)、特征型知识(反映事物各方面特征的知识)、差异型知识(反映不同事物之间属性差别的知识)、关联型知识(反映事物之间依赖或关联的知识)、预测型知识(根据历史的和当前的数据推测未来数据)及偏离型知识(揭示事物偏离常规的异常现象)等。这些不同类型知识的挖掘对于审计人员来说都具有重要的意义。
关联型知识的挖掘对审计工作具有重要的应用价值。在数据挖掘中,关联是指数据库中的两个或多个变量的取值之间存在某种规律性,如时序关系、因果关系等。通常,被审计单位的经济数据都存在一定的关联,如财务数据之间的勾稽关系。因此,在审计中我们可以通过对关联型数据的挖掘,找出经济数据之间存在的关联网,并从中发现其经济活动的规律及影响因素,有时甚至还可能发现按照常规思维认为不可能的一些影响因素。
通过数据挖掘得到的偏离型知识对审计同样具有重要的意义。数据库中的数据经常可能出现一些异常记录,它们与正常记录之间存在偏差,偏差一般包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与预测值的偏差等。被审计对象经济活动中的违规行为通常会以异常记录的形式出现在数据库中,审计的任务就是要从中检测出这些异常记录。借助于对偏离型知识的挖掘,我们可以通过计算机在审计数据库中挖掘出舞弊行为的线索,查出违规事实。
审计的一个重要作用是建设性作用,即促进被审计单位的经营管理水平并提高其经济效益,数据挖掘技术在这一方面也大有可为。运用数据挖掘中自动预测趋势和行为的功能,在被审计单位大型数据库中挖掘出反映其经济活动规律的预测型知识,审计人员可以对被审计单位的经营和管理活动提出切实可行的合理化建议。
审计专家系统是模仿审计专家思维活动,进行逻辑推理和判断,能够像专家那样求解专业领域问题的计算机系统。基于数据挖掘的专家系统通常由人机界面、推理机、数据库、知识库、数据挖掘模块等部分组成(如图2)。
知识库又称规则库,是整个系统的基础,它以规则的形式存放着利用数据挖掘工具从数据库中发现的知识和领域专家提供的领域知识。数据库则是存放审计领域内原始数据的"仓库"。推理机是专家系统的主要部件之一,它根据输入,决定如何选用知识库中的有关知识,进行推理,得出恰当的结论、建议或决策,供用户参考。人机界面包括输入输出模块和解释模块,输入输出模块主要负责把用户输入信息转化为系统内规范化的表示形式、把内部信息转化为用户易于理解的外部表示形式显示给用户,解释模块对推理机得出的解进行内码转换并传输。数据挖掘模块是系统的核心,主要负责利用各种数据挖掘技术从数据库中发现知识(规则),并送入知识库,同时也负责知识库中知识的修改、删除和更改,并对知识库的一致性进行维护。