计算机审计数据处理方法探讨,本文主要内容关键词为:数据处理论文,计算机论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
我国计算机审计和发达国家相比,起步比较晚,相对比较落后。但是,近几年来,我国的审计手段已经由传统的手工审计逐渐向计算机审计过渡。2001年,金审工程建设启动以来,审计信息网络建设进展顺利,截至2005年,“金审一期”工程已经初步完成,在审计法规检索系统和审计信息管理系统的开发方面取得了较大成功,已开发了多个审计信息管理系统和审计办公自动化系统。与此同时,关于审计数据采集分析与联网审计技术的863计划也正在顺利进行中,审计应用系统建设初具规模,审计工作急需的被审计单位资料库、审计专家经验库、审计文献资料库三大数据库已经建成。
一、计算机审计的一般步骤
按照对原始数据采集处理分析整理的过程,计算机审计流程通常可分为四个阶段:
(一)将数据从被审计单位信息系统导入到审计软件中,即数据采集。数据采集是进行计算机审计的基础,也是最关键的环节。审计人员可以直接利用审计软件中的导入模板导入财务数据,也可以根据情况从被审计单位数据库中导入需要的相关文件。对于企业通常只需导入凭证库表、科目表、期初余额表等数据,即可生成相应的会计明细账、总账、报表等会计资料与信息。
(二)对导入的数据进行清理、转换,以及数据的集成与优化处理,即数据的预处理技术。在完成数据采集之后,需要对数据进行清理转换,以满足审计分析的需要。广义上讲,凡是有助于提高数据质量的过程都是数据清理,主要包括确认输入数据、修改错误值、替换空值、保证数据值落入定义域中、消除冗余数据、解决数据中的冲突等。比如在车辆购置费审计中,由于车购费系统本身不完善和车购费征费记录人员操作不规范,存在发票价、最低征费额为空的记录,在数据库中记录数为空并不等于为0,因此必须把为空的记录转换为0,否则检索时会漏掉这些记录。另外,相似重复记录的清理也是数据清理的一个重要问题。
数据转换通常涉及到三种类型:简单变换,日期、时间格式的转换,字段值合并、拆分。简单变换即转换源数据库表中某些字段的类型、长度等,最常见的简单变换是转换一个数据元的类型。对于类型相容(类型相容指的是一种类型数据的值域可以通过常用的转换函数转换映射到另一类的值域上,而不会丢失数据的精确度)的,可以直接进行,而对于不合适的转换,可通过编写简单程序完成。日期、时间格式的转换,即将来自于各个数据源的不同格式的日期和时间数据变换成统一的规范格式。而字段值合并、拆分即将源数据库中的多个字段的值合并成一个字段值或将源数据库中的一个字段值拆分成多个字段值。
数据的集成与优化指将从各种类型的数据源中得到的业务数据,通过数据衍生、数据概括等技术手段,结合在一起形成新的数据。或者通过基于某种算法,将数据转换成更有利于发现本身内在规律的数据,进行数据优化。
(三)对预处理后的电子数据采用查询、抽样、统计、汇总、计算等技术进行分析处理,即数据处理。
(四)对分析整理的数据进行归档,生成综合性文书以及审计证据等文件,归集到审计工作底稿中去,并进行数据存档以备复核审查。
二、常用计算机审计数据处理方法分析
目前的计算机审计软件,除了数据采集、数据清理、转换以及数据的集成与优化功能外,主要实现了以下几项数据处理技术:
(一)审计数据查询技术。数据查询是目前计算机审计分析中最重要的运用,利用数据库查询技术,审计人员可以迅速完成数据的真实性和完整性测试,高效地获取审计证据,迅速查找疑点。
审计查询通常包括数据查询、法规查询、工作底稿查询。审计数据查询主要是针对被审计单位的财务数据和业务数据进行的,通过数据库操作语言,实现对转入数据和计算产生数据的查询,并将查询到的数据发送形成工作底稿。一般审计系统软件都提供强大的查询功能,允许审计人员自行从被审计单位转换过来的会计凭证库、科目库、生成的明细分类账选择条件进行查询。
对于导入到软件中的数据,运用SQL语言进行查询是非常方便的,可以完成简单查询、模糊查询以及多表之间的交叉查询。SQL语言又称结构化查询语言,是关系数据库标准语言,集数据操纵、数据定义、数据控制功能于一体。它可以独立完成从关系模式定义、数据录入、查询、更新、维护到数据库重构、数据库安全性控制等一系列操作,为数据库应用系统开发提供了良好的环境。
例如,审计人员在审查企业有无通过银行存款一借一贷的会计处理进行出租、出借账户,挪用公款,非法出借资金等违纪问题时,可编写如下代码快速进行查询:
SELECT凭证日期,科目编码,凭证号,摘要,借方金额,贷方金额,源凭证号
FROM凭证库
WHERE源凭证号IN
(SELECT源凭证号FROM凭证库WHERE LEFT(科目编码,3)=‘102’AND借方金额<>0 AND源凭证号IN
(SELECT源凭证号FROM凭证库
WHERE LEFT(科目编码,3)=‘102’AND贷方金额<>0)
查询结果将显示出一系列凭证,计算机将自动将之保存到疑点库中,以供审计人员进行审查(‘102’在通用审计软件中一般指银行存款类账户的科目编码)。
(二)审计抽样技术。利用计算机程序进行抽样是计算机审计的一大特色。现在很多审计软件中都开发了审计抽样模块,使得以前繁琐的数学计算、随机数生成等工作,可以轻松实现,并且可以保证抽样工作的准确性,合法性。审计人员只要按照抽样向导的提示,输入相应的参数即可。计算机审计抽样流程为:输入抽样基本信息、选择数据、设定抽样和选样方法以及控制参数值、计算样本量、导入样本数据并指定保存位置。这种合法化的抽样工作,为审计人员规避审计风险,提高审计工作质量,起到了很大的作用。抽样中使用的随机数表和计算机生成的随机数,应当遵守相关的规定,使用统一的程序。
(三)审计统计分析技术。计算机审计中的统计技术,也是整理和分析统计数据的方法技术,其目的是探索审计数据内在的数量规律性,以发现异常现象,快速寻找审计突破口。其中,数据分析是核心内容,是通过统计描述和统计推断的方法探索出数据内在的数量规律性的过程。计算机审计中基于特定方法的分析工具包括一般统计、分层分析和分类分析。这些分析工具都采用相对固定的算法,具有很强的目的性。
一般统计常用于在具体分析之前,以对数据有一个大致的了解,它能够快速地发现异常现象,为后续的分析工作确定目标。一般统计对数值字段提供下列统计信息:全部字段以及正值字段、负值字段和零值字段的个数,某类数据的平均值、绝对值以及最大或最小的若干个值等等。
分层分析首先选取一个数值类型的字段作为分层字段,根据其值域将这一字段划分为若干个相等或不等的区间,通过观察对应的其他字段在分层字段的各个区间上的分布情况来确定需要重点考察的范围。它是通过数据分布来发现异常的一种常用方法。例如金融审计在审查贷款损失时,可以贷款金额为分层字段,先显示出其最大值和最小值来确定其取值区间,然后审计软件自动将分层字段的取值以最大值和最小值为端点划分为若干个等距或不等距区间。用户可以修改这个区间的数量。经过这样分类汇总,就可以很直观地发现异常现象,比如落在某一区间的本金损失、利息损失与其他区间的数量级相差悬殊,数据分布图显示明显非线性关系,体现出很强的差异性,对于这样的数据,审计人员就需要重点关注,以检查是否存在舞弊或欺诈现象。
分类分析首先选择某一字段作为分类字段,通过观察其他对应字段在分类字段各个取值点上的分布情况来确定需要重点考察的对象。与分层分析不同的是,分类分析用作分类的某一字段不一定是数值型,可以是其他类型的数据。对于企业审计来说,在审计应收账款时,就可以以不同客户作为分类字段,审查不同客户对应的应收款的金额、坏账计提数、欠款期限等。
(四)审计自动化计算技术。利用计算机程序自动进行审计计算,判断会计计提数的真实准确,是计算机审计的重要运用之一。通过从被审计单位财务系统中采集到的会计报表,软件能自动计算出各项财务比率,形成会计报表的趋势分析、变动分析、杜邦财务体系分析等,让审计人员能轻松评价被审计单位的财务状况及审计风险,并作为确定审计重点的依据。也可以利用程序对固定资产计提折旧、借款利息资本化、所得税纳税调整等直接影响当期损益的工作进行快速复核重算。
三、计算机审计数据处理方法的发展趋势
(一)数据挖掘技术将在计算机审计数据处理中得到广泛应用。数据挖掘就是从一些事实或观察数据的集合中发现趋势或模式的决策支持过程,是关于从所收集的信息中获得知识的重要信息分析方法,是能够从存在的数据中找出有效、新颖、有潜在价值、易于理解的关系模型。数据挖掘的核心,是为数据集建立模型的过程。
数据挖掘作为一项新兴的高新技术,理论上和技术上面临着许多难点和挑战,但这项技术有着相当大的发展前景,是国际前沿开发研究的新领域。数据挖掘的方法主要有:决策树方法,粗糙集方法与关联规则挖掘,公式发现,神经网络与遗传算法等。数据挖掘的这些方法,在审计中运用广泛,它使审计人员在面临诸如银行、海关、税务等被审单位的海量数据时,能迅速发现审计线索,找到审计突破口。
(二)联机分析处理技术将在计算机审计数据处理中得到广泛应用。二十世纪六十年代末,E.F.Codd所提出的关系数据模型促进了关系数据库及联机事务处理的发展。数据不再以文件方式同应用程序捆绑在一起,而是分离出来以关系表的方式供大家共享。随着政府及商业应用的发展,大型数据库系统内的数据量发生了飞速的增长,同时用户的查询需求也越来越复杂,涉及的已不只是查询或操纵一张关系表中的几条记录,而是要对多张表中的千万条记录进行数据分析和信息综合。单独依靠关系数据库管理系统(RDBMS)已不能完全满足这一要求。于是,不少软件厂商采取了发展其前端产品来弥补RDBMS支持不足的策略,他们通过专门的数据综合引擎,辅之以更加直观的人机交互界面,力图统一分散的公共应用逻辑,以达到在短时间内响应用户复杂查询的目的。1993年,E.F.Codd将这类技术定义为联机分析处理(OLAP)。
联机分析处理是针对决策问题的联机数据访问和分析。通过对信息维(这些信息维是由抽象的原始数据转换而得到的易于用户理解的信息表现形式)的很多种可能的观察形式进行快速、稳定、一致和交互性的读取,允许决策人员对数据进行深入地观察。
多维数据库和联机分析处理在审计中的应用,是审计信息化发展过程中提出的问题。同时,多维数据分析与传统的数据分析相结合,也是目前审计实践中提出的问题。利用联机分析的快速性、多维性,可以在某些方面取得非常好的应用效果。
(三)采用可视化技术进行计算机审计数据处理。虽然国内已有一些学者提出把OLAP及数据挖掘技术应用于审计分析之中,但未提出明确的方法。而可视化工具可以提供直观、简洁的机制表示大量的审计信息,这有助于定位重要的数据。另外,可视化工具提供的多窗口、交互式、可视化图形界面便于审计人员直观、综合、灵活地进行分析处理,获得评价结果。因此,如何把可视化工具应用于计算机审计数据处理中来减小审计人员的工作强度,提高审计效率已成为审计界迫切的需求。
(四)审计应用系统向智能化方向发展。比如在现场审计实施系统中的自动审计功能、一些审计软件中的专家分析等,审计软件正由查账型向分析型和专家系统方向发展。专家系统是一种模拟人类专家解决特定领域问题的计算机程序系统,即内部含有大量的某个领域专家水平的知识和经验,借助人工智能技术和计算机技术,进行推理和判断,模拟专家的决策过程,解决复杂问题。
标签:数据处理论文; 大数据论文; 审计软件论文; 审计计划论文; 审计质量论文; 会计与审计论文; 审计流程论文; 审计方法论文; 审计目标论文; 数据挖掘论文; 电脑论文;