数据挖掘技术在审计数据分析中的应用与实施过程,本文主要内容关键词为:实施过程论文,数据挖掘论文,数据论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据挖掘技术与审计数据分析中的应用研究
在信息化环境下,面对被审计单位的海量电子数据,可通过应用数据挖掘技术对被审计电子数据进行综合分析处理,从而提高审计数据分析的效率和质量,降低审计风险。具体包括:
1.数据概化技术的应用。在审计数据分析中,审计人员往往需要查询不同综合程度的被审计数据信息,以便了解被审计单位的有关各级别的财务经营信息,以便寻找审计线索。而由于数据概化可用于对数据库中的细节数据进行浓缩,以满足用户对不同层次的信息需求。因此,数据概化可应用于审计数据分析中的描述式挖掘,审计人员可从不同的粒度和不同的角度描述数据集,从而了解某类数据的概貌。大量研究证实,与正常的财务报告相比,虚假财务报告常具有某种结构上的特征。审计人员可以采用概念描述技术对存储在被审计数据库中的数据实施数据挖掘,通过使用属性概化、属性相关分析等数据概化技术将详细的财务数据在较高层次上表达出来,以得到财务报告的一般属性特征描述,从而为审计人员判断虚假财务报告提供依据。例如,对于会计信息,可在记账凭证、明细账、分类账以及财务报表等各层次上进行概化,采用概念描述技术获得财务报告的一般信息评价,以满足审计人员对不同综合程度的信息的财务审计需求。
2.统计分析技术的应用。统计分析是目前数据挖掘技术中最为成熟,也较为精确的一种方法,审计中用此方法可对数据进行分类和预测。通过分类挖掘对被审计数据库中的各类数据挖掘出其数据的描述或模型,或者审计人员通过建立的统计模型对被审计单位的大量财务或业务历史数据进行预测分析,根据分析的预测值和审计值进行比较,都能帮助审计人员从中发现审计疑点,从而将其列为审计重点。比如在财务审计中,虚假财务报告从财务指标上看,就是某些财务指标显著地异于同类企业,这些能够显著显示财务欺诈征兆的财务指标包括应收款项比率、应收款项周转率、资产负债率、速动比率、主营业务税金及附加比率、资产质量、管理费用和销售费用率等。对此,审计中可采用数据挖掘的统计分析技术对这些指标数据进行分类和预测,当预测值与审计值差距较大时,可列为审计关注的重点。再如数据库中保存着应收账款及其债务人的记录,利用统计分析技术,根据债务人的信誉等级、数据的时间戳、历史的账龄分析表,预测坏账损失,当其与被审计单位提供的坏账损失实际值存在较大差异时,审计人员应将其列为审查重点。再比如,在对某企业审计时,通过统计建模进行大量数据挖掘分析,发现某企业连续三年都进口某产品用于工程项目,可第四年项目并未结束,却没有缴纳进口关税,审计人员据此确定其为审计疑点,经过详查发现了该企业偷漏关税的事实。
3.聚类分析技术的应用。聚类分析在审计数据分析中也具有极大的用途,如审计人员可运用该方法识别密集和稀疏的区域,从而发现被审计数据的分布模式,以及数据属性间的关系,以进一步确定重点审计领域。企业的财务报表数据会随着企业经营业务的变化而变化,一般来说,真实的财务报表中主要项目的数据变动具有一定的规律性,如果其变动表现异常,表明数据中的异常点可能隐藏了重要的信息,反映了被审计报表项目数据可能存在虚假成分。以应付账款的实质性测试为例,运用聚类分析技术将具有相似特征的会计数据进行聚类分组,可以发现金额明显异于其他月份的应付账款、重复记账的应付账款、与总账和明细账金额不等的同一笔应付账款、资产负债表日前后的应付账款以及重复发生的非常规交易的应付账款等。运用该方法更可进行一些“孤立点”的挖掘分析,在审计数据分析中,审计人员一般都会检查数据的偏差、异常和极端值,这些异常或特殊情况信息即孤立点往往是我们审计工作中需要关注的重点。运用聚类分析进行“孤立点”的挖掘,采用孤立点检测算法,发现异常审计数据、事件或异常的发生频率等,从而发现有可能隐藏的违规行为。审计人员可以使用孤立点分析技术来检查一些舞弊、违背规律和规定的行为,因为这些行为产生的数据一般是隐藏在大量正常数据下的少量数据,而且很可能以不同于一般数据的形式表现出来,通过孤立点分析方法可以有效地发现这样的异常数据。如通过对被审计单位若干年来的管理费用数据进行聚类分析,发现其中某期间的管理费用出现异常,据此审计人员可将其列为审计重点。再比如运用孤立点分析于金融领域,可以用于发现欺诈和其他金融犯罪行为。
4.关联分析技术的应用。财务做假是一项系统工程,需要各个科目间的协调配合,但很难做到天衣无缝,难免会出现个别科目的背离。利用关联分析,审计人员可通过对被审计数据库中的数据利用关联规则进行挖掘分析,找出被审计数据库中不同数据项之间的联系,从而发现存在异常联系的数据项,在此基础上通过进一步分析,发现审计疑点。在会计领域,会计数据之间存在严密的勾稽关系,通过基于关联规则的数据挖掘分析,可挖掘出隐藏在数据间的相互关系。如财务做假有时表现在科目做假上,通过各个科目之间的运作、协调和配合,表现为“假科目,真做账”现象。但这种做假手段难免会出现个别科目的背离以及报表间钩稽关系的异常。为此,可运用数据挖掘中的关联分析技术方法,在对财务数据或经济数据的审计中,针对同类或不同类会计科目及数据项之间可能存在某种对应关系,以及资产负债表、利润表、现金流量表三大财务报表之间的勾稽关系,按照非财务逻辑关系的规律来查找、挖掘,从而发现一些隐藏的经济活动,为审计人员的进一步工作提供参考。再如利用数据挖掘中的关联分析,可以发现一个单位的车辆数和养路费、汽车保险费等日常维护支出存在一定的关系,能够据此发现是否存在用账外资产买车的行为,进而查出小金库问题。
数据挖掘在审计数据分析中的实施过程
数据挖掘在审计数据分析中的实施步骤如下,见图1:
图1 数据挖掘审计数据分析模型
1.确定审计分析需求。根据审计的目标和内容要求,描述和表达审计问题,并将其转化为数据挖掘问题。
2.数据理解和准备。熟悉数据,确定数据来源,从被审计数据信息集中选择适用于数据挖掘的数据,识别数据质量问题,对有关数据进行转换和清理。
3.建模和数据挖掘。针对所要发现审计任务的所属类别,确定将要进行的挖掘操作类型,如统计分析、聚类、关联规则等,设计或选择有效的数据挖掘算法,产生一些数学分析模型并加以实现。例如,要预测企业的盈利能力指标,因为影响盈利能力的因素很多,所以可以应用人工神经网络建立预测模型。
4,评估。进行模型评价,解释并评估挖掘结果,测试与评价所发现的知识,对知识进行一致性、效用性处理。其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术。模型的建立是一个迭代循环过程,一个良好的模型并不是一次完成的,根据模型对数据的分析结果,对模型进行评价,如果模型的效果不令人满意,可利用反馈机制重新运用挖掘工具进行建模、分析,直到模型可以把每一次的分析结果清晰、准确、明了地表述给有关审计人员为止。
5.发布。根据审计人员的要求,对所获得的审计知识进行组织,并以一种审计人员能够使用的方式呈现,从而使审计人员能在审计数据分析工作中运用所发现的审计知识。
上述步骤不是一次性完成的,某些或者全部步骤可能需要反复进行,这取决于每个阶段的结果和接下来将要实施的阶段或者一个阶段的具体任务。
标签:大数据论文; 数据挖掘论文; 数据分析论文; 数据挖掘算法论文; 审计质量论文; 会计与审计论文; 审计方法论文; 审计目标论文; 聚类论文;