基于审计项目视角的数据库技术应用,本文主要内容关键词为:视角论文,数据库技术论文,项目论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据库技术对审计信息化的影响
影响一:审计工作的理念要求自身具备信息化的技术基础。审计工作的一般模式是调查了解被审计单位的情况,对被审计单位的薄弱业务环节开展审计,形成审计结论。顺利实施这一过程的核心是充分占有资料,在传统审计环境下是占有各类纸质资料,在信息化环境下则是充分获取数据,采取趋势、结构、比例等基本分析技术和聚类分析等数据挖掘分析技术,对被审计单位的财务和业务数据加以分析,拓宽对被审计单位情况分析的广度和深度,为全面审计、突出重点奠定基础。
影响二:审计工作的内容发生改变。在传统环境下从收集资料到形成结论,各阶段工作内容的载体都是纸质资料,通过对纸质资料的收集、整理、分析、取证,形成审计结论。在信息化环境下,从收集资料开始,就要依托于被审计单位的财务信息系统和业务信息系统来采集电子数据,通过对采集到的电子数据进行整理和分析,形成初步审计结论,并对电子数据或纸质资料进行取证,形成审计结论(下图为不同环境下审计工作内容的差异)。
影响三:数据库等信息化知识和技能成为审计人员的必备素质。在信息化环境下,开展审计工作需要数据库、网络、财务电算化等方面的知识,随着信息化环境的深化,审计中应用数据分析知识的广度和深度不断拓展,审计数据分析师的培训也提上了日程,为掌握数据挖掘技术、提高数据分析模型能力,更好地服务于跨行业、多专业、多角度融合的数据综合分析利用奠定基础。
审计项目数据库环境的特点
数据库环境的多样性。审计工作的特点决定了审计对象的多样性,既有行政事业单位,也有国有企业单位,还有项目建设单位,涉及的领域涵盖财政、金融、企业、投资、社保等行业。根据各单位和各行业的业务特点,选择的数据库也不尽相同,审计项目中常遇到ORACLE、SQL Server、DB2、SYBASE等不同数据库环境。
所需的数据涉及的单位多、部门广。在审计项目中,金融、企业等审计项目在采集数据时,涉及的单位相对较多。而像社会保障资金审计项目,除涉及各级地方政府以及人力资源社会保障、民政、财政、卫生、残联、地税等社会保险经办机构外,还需要延伸房管局、车管所、公积金管理等与社保资金保障对象相关的部门或单位,数据涉及的部门广。
数据存储分散。目前由于各单位信息系统建设大多采取分步实施、逐步推进的方式,加上业务职能的分工,各单位信息系统功能只涵盖本单位职能的要求,数据存储分散,如社保资金的管理因职能分工、地区、时间、统筹级次等方面的差异,数据分散存放在不同的部门或单位,基本养老、基本医疗、失业、工伤、生育保险基金的数据存储在社会保险部门,低保数据存储在民政部门,新型农村合作医疗的数据存储在卫生部门。
数据量大。审计工作要求“全面审计,突出重点”,全面审计的基础是充分占有数据并对数据加以分析,从占有数据的角度,纵向尽可能取得多个时间段的数据,横向尽可能取得审计内容涉及的多方面数据。如社会保障资金审计涉及基本养老、基本医疗等12类18项资金,审计时间从2005至2011年,跨度共7年,涉及的数据以T计量。
审计项目运用的主要数据库技术
利用数据库数据传输技术,实现数据库版本的完整统一,解决数据库环境的多样性问题。审计人员对数据库技术的把握在“专”的基础上还要求“博”。当前审计人员较熟悉的是SQLServer数据库系统,因此在同一审计项目中涉及ORACLE、SQL Server、DB2、SYBASE等不同后台数据库系统时,通常将数据采集成标准的SQL Server数据表。如果存在不同的版本,要将采集到的数据存放在统一版本的SQL Server数据库环境下,可通过两类方式处理:其一,编写脚本将同一单位的不同数据库自动汇总,在同一台电脑上安装不同版本的SQL Server数据库,通过DTS方式导入导出数据,形成版本的统一;其二,搭建局域网,将其中一台电脑安装一个版本的SQL Server数据库,其他电脑安装另一版本的数据库,并与该电脑连接,通过数据库DTS方式将数据传输到同一个版本中,达到数据库版本的统一。
利用数据库游标技术,提高数据汇总的效率,解决数据涉及单位多、部门广的问题。游标是系统为用户开设的数据缓冲区,用于存放SQL语句的执行结果。游标就本质而言,是从包括多条数据记录的结果中每次提取一条记录的机制。对从多部门、多单位采集到的数据,按要求汇总到相应数据库中时,可充分利用游标技术。如在社会保障资金审计中,按预先的数据采集方案采集到的标准数据库多,最终又要按市县将采集到的标准表数据进行汇总,每一个市县汇总数据库又分为人力资源和社会保障、民政、地税、卫生部门的数据,这就要把原来分散在不同数据库中的同一市县的数据,经过抽取、汇集,存放在同一市县数据库中,通过游标的定位,可以逐个读取每一个数据库中的每一张表,将符合条件的数据抽取出来,存放到指定的表中,完成对分散存储数据的汇总工作,提高数据汇总的效率。
利用数据库索引技术,提高数据分析的效率,解决大数据量的分析问题。通常在既有的数据库结构中,表内和表间数据都通过建立主键、外键、索引等约束,用来强化数据之间的关系。在数据采集过程中根据行业的数据规划和审计工作的要求,往往从被审计单位数据库抽取审计工作所需的数据,原有的数据约束被打破。在数据分析阶段为提高分析效率,对采集整理后的数据可以根据分析需求,针对特定字段建立索引,将创建索引的表进行关联分析,可以加速表和表之间的连接。在数据分析阶段,通常对需要分析的数据表选取关键字段建立索引,在社会保障资金审计中,需要分析涉及个人的大量信息,因此通常将个人编号或个人身份证号建立索引,提高数据分析的效率。
利用数据库算法技术,提高分析结果的准确率,解决数据存储分散的问题。随着审计项目信息化程度的提高和数据环境的改善,数据分析已超出单一维度分析的范畴,需要融合相关数据对比分析。在社保资金审计中,需要对个人的参保信息进行分析,同时要将该信息与房产等外围数据进行分析,因此身份证号是定位个人信息的关键字段。由于不同系统或同一系统不同时间段的数据中,存在身份证号15位和18位不统一的情况,如果进行身份证号的全等比较,将造成筛选数据结果的遗漏。根据身份证编码规律,采取前6位区域代码、后几位出生时间代码分段比较的方式,通过改进算法提高了分析结果的准确率和分析效果。