数据挖掘技术在信息系统审计中的实际应用_数据挖掘技术论文

数据挖掘技术在信息系统审计中的实际应用_数据挖掘技术论文

数据挖掘技术在信息系统审计中的实际运用,本文主要内容关键词为:信息系统论文,数据挖掘论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

数据挖掘是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘在信息系统审计过程中发挥着举足轻重的作用。因为它不仅可以对信息系统产生的被审计单位财务、业务数据进行深层次分析和研究,揭示其本来特征和内在联系,而且可以通过模型匹配和挖掘算法实现其在信息系统开发审计、安全审计等方面的应用。此外,通过数据挖掘技术与信息系统审计技术的有效结合可确定快照技术中快照点的选择问题,以及确定系统控制审计复核文件中嵌入审计程序应采集什么信息。

一、数据挖掘技术在信息系统审计中的运用研究

数据挖掘技术很多,笔者在此仅列举目前最有可能运用于审计工作中的几种常见技术。运用这些技术可以实现对被审数据进行综合分析处理,从而提高信息系统审计的效率和质量,降低审计风险。

(一)运用统计分析技术发现偏差数据

统计分析技术是指利用统计学原理对数据库字段项之间存在的函数关系或相关关系进行科学分析的方法。具体方法包括常用统计(求大量数据中的最大、最小、汇总、平均值等)、回归分析(用回归方程来表示变量间的数量关系)、差异分析(从样本统计量的值得出差异来确定总体参数之间是否存在差异)等。

该技术是目前数据挖掘在审计工作使用的较为成熟的技术。审计人员通过建立统计模型对搜集的被审计单位以及同类型单位的大量财务、业务历史数据进行分析,挖掘内部存在的函数关系或相关关系,然后对审计期间内的相关数据进行合理预测。通过将分析的预测值和审计值进行比较,从而帮助审计人员发现疑点。例如对某些财务指标进行深层次挖掘,可以发现异常指标数据,获得审计线索。

统计分析技术在信息系统开发审计阶段同样可得到很好的运用。作为开发阶段审计的重中之重就是对信息系统项目进度与成本费用的控制审查。审计人员通过借鉴同类型项目经验数据,对项目进度与成本费用建立统计分析模型,按照项目计划预测出实现预定进度所发生的成本费用,然后与项目实际发生的费用进行比较,判断成本费用是否得到有效控制。通过对偏离较大支出实施进一步审查,确定项目实施过程中资源是否合理配置,有无存在损失、浪费等不合理支出情况。

(二)运用聚类分析技术确定审计重点

聚类分析就是把一个数据集分解或划分成不同的组,使同一组中的对象尽可能相似,不同组中的对象尽可能相异。通过聚类,容易识别出密集的和稀疏的区域,发现全局的分布模式和数据属性之间的相互关系。

在审计过程中,通常是利用聚类分析技术对信息系统中被审计单位的同类型的财务数据或者业务数据进行分组,使其成为有相似特性的聚集。一般说来,财务数据及重要业务数据(如销售数据)的变动具有一定的规律性。所以如果某些数据处于稀疏区域,说明其变动表现异常,需要重点关注。同时通过观察该区域记录的特征,可以发现审计需要查证的问题特征。

审计人员在对信息系统安全审计中,可以借助该技术实现对计算机日志的审查。计算机日志记录了计算机系统发生的各种重要事件,通过它,可以了解系统运行状况,审核安全事件,发现差错异常,从而对系统安全给予全面评价。但是计算机日志种类繁多、格式差别巨大,大小呈级数增长,也给审计人员带了巨大工作压力。在这种情况下,聚类分析起到了事半功倍的作用。审计人员将收集到的同类日志数据导入到数据挖掘于具中,如SQL2005中的Microsoft Analysis Services工具,选择聚类挖掘模型,就可利用其强大的分析功能实现日志数据的分类,“魔法般”地将非正常的日志记录从正常的日志数据中区分出来,例如登录时间在半夜的日志记录,暴力攻击的日志记录等,为后续审查评价提供了线索。

(三)运用孤立点分析技术挖掘审计疑点

孤立点是指明显偏离其他数据,即不满足一般模式或行为的数据。孤立点分析是数据挖掘中的一项重要技术,用来发现数据源中显著不同于其他数据或行为的异常数据和异常行为。

在常规审计中,被审数据的孤立点往往是审计人员依靠职业敏感,凭借一双“火眼金睛”来发现的。而面对海量的电子数据,审计人员则需要利用计算机强大的数据分析能力,采用孤立点检测算法,发现异常审计数据或异常发生频率等,从而发现有可能隐藏的违规行为。特别要强调的是,孤立点分析方法如与信息系统审计技术实现有机结合,能够达到更为理想的效果。利用这种方法确定孤立点后,审计人员可将审计样本选在孤立点数据上,通过采用信息系统审计技术,如利用快照点捕捉问题数据,利用嵌入式审计模块进行实时监控等方法,达到锁定疑点数据的目的。

例如,在某医院信息系统审计项目中,审计人员选取了该院门诊处方明细库上半年度的全部数据,对半年内向同一病人开同一种药品的处方数在两张以上的处方所间隔的天数进行了孤立点分析。结果表明与正常数据分布图形态相比较,出现了若干处明显的低值。孤立点分布在0~2天。经延伸审计,发现该院存在大处方开药情况。于是,审计人员将审计样本选在孤立点数据上,利用快照技术迅速在全年度数据中捕捉到了疑点记录,大大提高了审计效率。

(四)运用关联分析技术揭示关键属性

关联分析技术是从操作数据库的所有细节或事务中抽取频繁出现的模式,进而总结出一组事件或条目与其他事件或条目的相互联系。

在对财务或业务数据的审计中,同类或不同类会计科目及数据项之间,可能存在某种对应关系,利用关联分析方法来查找、分析,可发现一些隐藏的经济活动,挖掘出数据的各个属性间可能的相互影响,为后续审计工作提供参考。继续以医院信息系统审计项目为例,审计组对住院病人费用进行了专项分析,以寻求影响其费用形成的最重要因素。首先从住院病人费用等表中选取病人的年龄、诊断病种、住院病区、住院天数、治疗结果、药品费用等属性作为分析项,然后建立关联分析挖掘模型,通过运用强关联原则,得出挖掘结果:药品费用和住院天数决定了病人的住院总费用。于是,审计人员将重点锁定于对上述两项重要属性的审查,最终发现该院存在违规设置住院天数计算规则以及超标准药品加价的问题。同样该技术也可与信息系统审计技术结合运用。

三、数据挖掘技术在信息系统审计中有效运用的发展策略

(一)开发高效易用的数据挖掘工具

目前常见的数据挖掘工具大多是国外公司开发的通用数据挖掘软件,大多数审计人员难以做到在日常审计中熟练掌握运用,这也成为制约数据挖掘技术在信息系统审计中被广泛采用的主要原因之一。因此开发出一套满足审计需求,简便易学,高效易用的数据挖掘工具已成为当务之急。这套挖掘工具既可作为应用软件单独开发,也可集成于信息系统审计软件的功能模块中,但都必须涵盖常用的各种数据挖掘技术,同时融合多项典型信息系统审计数据挖掘示例的经验模型。只有这样才能帮助审计人员快速定义具体业务,选择合适挖掘技术,准确建立模型,提高工作效率。

(二)及时出台信息系统审计操作指南

审计机关应当尽快组织制定出台相关信息系统审计准则和审计指南,特别是对信息系统数据挖掘的操作规程,如系统日志分析,以规范和指导信息系统审计实践,提高数据挖掘质量,防范和规避审计风险。

(三)建立完备的信息系统审计专业人才队伍

要熟练运用数据挖掘技术,开展好信息系统审计,审计机关和审计人员应当提高认识,高度重视,树立攻坚克难的精神。同时,各级审计机关应加大力度开展各种形式的培训,培养和引进一批熟悉和精通审计和计算机专业知识,掌握数据挖掘技术的高端复合型人才。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

数据挖掘技术在信息系统审计中的实际应用_数据挖掘技术论文
下载Doc文档

猜你喜欢