大数据环境下的数据审计模型分析_大数据论文

试析大数据环境下的数据式审计模式,本文主要内容关键词为:数据论文,模式论文,环境论文,试析大论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      数据式审计模式是信息化条件下审计对象从传统纸制账目转变为电子数据后采用的审计取证模式。近年来,信息化环境持续发生变化,审计对象已经向大数据方向发展。面对这种变化,数据式审计模式研究也应有所发展和推进。分析和总结大数据环境下的数据式审计模式,将有助于提升审计能力,帮助审计人员更好地开展大数据审计工作。

      一、文献综述

      1.大数据与审计关系研究

      中国科学院院士李国杰(2012)认为,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。中国工程院院士邬贺铨(2013)指出,大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。一般而言,“大数据”的特征可以归纳为4个V(李国杰、程学旗,2012;严霄凤、张德馨,2013):容量大(volume big),数据量级已从TB发展至PB乃至ZB,可称海量、巨量乃至超量;多样性(variable type),数据类型繁多,越来越多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息;生成速度快(velocity fast),数据是高速产生并高速计算处理的,数据是生成为一个可实时查询的连续数据流,可根据需求提供有用信息,而不是批量生成;价值高和密度低(value high and low density),能够从基于机器学习、统计模型以及图算法的深入、复杂的数据分析中获取可对未来趋势和模式提供预测性分析的重要洞察力。大数据已经在宏观经济研究方面、农业领域、商业领域、医疗保健领域、社会安全管理领域、科学研究领域等众多领域取得应用成果(李国杰,2012)。大数据甚至改变了经济预测范式,经济预测不再以经济统计指标为唯一来源,基于互联网产生的大数据都可以用于经济预测,利用搜索数据和社交媒体数据可以提高预测和实效性(蔡跃洲,2015)。

      国际学术界和实务界对大数据与审计的研究至今为止比较少。T.M.Persons(2013)在美国政府审计论坛上提出审计要考虑大数据发展趋势的影响。Kyunghee Yoon等(2015)认为大数据因其充分性、可靠性和关联性的特点,将成为传统审计取证方式的有力补充。Juan Zhang等(2015)分析了由于大数据的特点,造成持续审计在数据一致性、完整性、识别性、聚合性和机密性方面存在问题并提出了解决方案。国内学术界和实务界对大数据审计的研究始于2013年。刘碧湘(2013)分析了大数据对计算机审计的机遇和挑战,提出利用大数据推进计算机审计,要解决保障数据质量,建立公共分析数据平台,加强对审计人员的培训和建立合理的审计结果评价体系等问题。秦荣生(2014)认为大数据技术主要着眼于“数据”,负责提供数据采集、挖掘、分析的技术和方法,而云计算技术主要关注“计算”,负责提供IT解决方案,大数据、云计算技术可以促进持续审计方式的发展、总体审计模式的应用、审计成果的综合应用、相关关系证据的应用、高效数据审计的发展和大数据审计师的发展。鲁清仿、梁子慧(2015)从科学范式的角度研究了大数据对风险导向审计模式的影响,认为大数据降低了审计师审计取证的成本,打破了分析取证的技术限制,使得审计证据更加充分适当,有助于减少审计风险。国内学术界对大数据与审计关系的研究日渐丰富。

      2.数据式审计模式研究

      石爱中、孙俭(2005)创造性地提出了数据式审计模式的观点,认为信息化条件下,审计工作的对象从传统纸质账目转变成了种类繁多的电子数据,对数据式审计模式的涵义和特点进行深入的阐述,提出数据式基础审计可以简单描述为系统内部控制测评加数据审计,开创了这一新型审计模式的研究。董博坤(2007)在此基础上结合杭州预算执行审计实际,提出实现数据式审计模式路径的三个重点,分别是构建审计数据综合分析系统,把握审计关键环节和强化审计应用。徐瑾(2009)从一般计算机技术、计算机辅助审计技术、审计信息化建设到审计人员专业技术素质对对数据式审计的实施路径和发展方向进行了进一步的研究。王锴(2011)认为数据式审计模式是风险导向审计模式的发展,数据式审计模式的切入点是直审数据库(数据及其形成机制),并就此提出数据库审计技术。数据式审计模式研究逐渐成为计算机审计研究的重要研究方向。

      以往对数据式审计模式的研究,均以传统数据环境为基础,数据式审计模式的关键环节即内部控制测评和数据审计均建立在相对封闭和结构化数据环境下,审计分析方法以传统计算机辅助审计技术为主,难以满足当前大数据环境下的审计数据分析需求。当前互联网数据可供审计分析利用的越来越多,被审计单位的业务数据量越来越大,审计机关内部的数据亟待整合利用,如果仅仅满足于传统环境下的数据分析处理,将难以适应大数据环境下的数据式审计模式的挑战。而且,综合目前的大数据审计研究来看,现有的研究主要是分析大数据给审计带来的机遇与挑战,较少深入分析大数据环境下如何有效推进数据式审计。本文试图从分析大数据环境对数据式审计的影响入手,研究大数据环境下数据式审计的可行性和路径,探索如何运用主要的大数据技术开展数据式审计工作。

      二、大数据环境下数据式审计模式的影响和可行性

      (一)大数据环境给数据式审计模式带来的影响

      1.数据式审计模式的发展历程

      审计模式,又称审计取证模式,主要经历了账项基础审计模式、制度基础审计模式和风险基础审计模式等阶段。账项基础审计模式是将反映经济业务的纸质账目作为审计取证切入点的审计模式,大量运用详查法,后来逐渐发展了抽查法。制度基础审计模式是将控制经济业务及其记录的内部控制制度作为审计取证切入点的审计模式,审计的重心被前移到内部控制制度。风险基础审计模式是在制度基础审计基础上,通过在审计全过程引入风险分析方法,增加风险因素作为另外一个切入点而形成的一种审计模式。在纸质环境下,审计取证模式已经发展到制度基础审计模式和风险基础审计阶段。而信息化环境下,相应的审计取证模式发展为数据式系统基础审计模式,即对系统内部控制和电子数据进行审计。随着大数据环境的到来,数据式审计模式进一步发生变化。

      2.大数据环境下数据式审计模式框架的变化

      一是系统控制测评需要调整。传统环境下,系统控制是数据式审计模式的重要对象(石爱中、孙俭,2005)。然而在大数据环境下,由于系统来源复杂尤其是互联网系统未知,难以继续依赖检查系统内部控制的方法确认互联网数据的真实性、完整性和正确性。因此需要调整主要以系统内部控制测评来验证数据的思路,才能适应互联网环境下的数据验证需求,即变化对为数据质量和电子数据进行审计。二是审计方法对技术要求逐步提高。传统环境下,审计中间表和审计分析模型是主要的技术方法(徐瑾,2009),基本可以满足数据审计的需要。然而大数据环境下,由于数据量大、数据类型多等特征,审计技术方法更加深入,需要对包括非结构化数据在内的全量数据进行数据分析。而且为了充分发挥大数据环境下挖掘型数据分析的效果,大数据预测技术和可视化技术得到广泛应用。三是审计程序有所变化。传统环境下,由于数据分析结果可以应用于审计准备阶段(石爱中、孙俭,2005),数据式审计模式并不局限于审计实施阶段。然而在大数据环境下,审计机关可以通过建设审计云和大数据审计平台实时采集和整理各种内外部数据,如互联网大数据、被审计单位数据和审计机关内部数据。大数据分析已经不再局限于具体的审计项目,数据分析结果甚至可以成为审计立项的依据来源,大数据分析在审计程序中的顺序将进一步前移。

      3.大数据环境下审计能力取得拓展

      一是互联网大数据分析拓展审计线索发现能力。互联网大数据可以成为发现审计线索的重要来源。大数据环境下,互联网搜索引擎、门户网站、论坛、微博和微信等资源每天加载大量数据,其中可能包含众多审计线索。如果借助大数据热点分析和预测技术,将在一定程度上实现自动发现审计线索。二是被审计单位大数据分析拓展经济安全保障能力。政府和企业大数据可以成为推动经济安全分析的重要来源。当前,我国经济发展进入新常态,审计机关要认识新常态、适应新常态和引领新常态,将十八届五中精神和中央经济工作会议精神真正成为审计工作的标准和尺子(刘家义,2016)。为了保障经济安全,审计需要对各类业务开展大数据审计分析,促进和保障中央精神落地实施。三是审计机关内部大数据分析拓展审计成果利用能力。审计机关内部大数据可以成为推动审计成果利用的重要途径。审计机关日常工作产生各种数据,主要有各类审计文书、底稿和资料等。如果将这些内部数据进行整合、分析和利用,将有力地促进审计成果利用。大数据环境下,非结构化数据处理技术使得分析批量审计成果成为可能。通过实现对内部大数据进行分析,可以促进审计智力资源共享,可以加强知识聚类,实现共性问题分析和问题追踪分析。

      (二)大数据环境下数据式审计模式的可行性分析

      1.从成本效益角度进行分析

      通过对确定的成本和效益进行比较,可以判断审计项目是否可行(陈伟、尹平,2007)。采用该方法,也可以分析大数据下的数据式审计模式是否可行。如计算搭建大数据环境下数据式审计模式每年的投入、成本和收入,在设定折现率(基准收益率)的情况下,计算净现值可以判断大数据环境下数据式审计模式投入是否可行。如果净现值大于0,表示在经济上是可行的。如果净现值小于0,表示在经济上是不可行的。然而,由于数据式审计模式带来的收入往往难以准确地单独计量,而且具备较大的无形收益,因此成本效益法的计算结果可能存在一定的偏差。而且针对不同的大数据环境下数据式审计模式实施方案,应该优先选择净现值最大的实施方案。

      2.从需求供给角度进行分析

      从需求方角度,审计面临数据爆炸的环境,如果没有适应大数据环境的审计模式,不仅无法完成系统控制测评,而且难以完成数据审计,不能很好地完成审计工作。从供给方角度,完善后的数据式审计模式能够适应大数据环境下的审计工作,审计流程更加清晰,数据来源更加丰富,分析方法更加深入,必将有力地促进数据式审计模式的推广和应用。

      基于大数据技术对数据式审计模式带来的影响,数据式审计模式研究应当适应新形势的变化。系统控制测评已经无法满足互联网大数据验证的需求,需要明确在数据预处理阶段加强数据质量控制。结构化查询型数据分析方法无法适应各种类型数据分析的需要,需要加快建设大数据审计平台研究各种审计数据分析方法。大数据分析已经在审计准备和审计实施阶段发挥重要作用,未来将在审计程序顺序中进一步前移以发挥更大作用。已有的研究文献虽在上述的某个领域提出一些改进的建议,但是缺乏对如何完善和改进审计模式的路径研究。本文提出基于大数据环境下的数据式审计模式从逻辑流程、网络架构和应用架构三个维度的路径研究设计,以期对数据式审计模式进行进一步的完善。

      三、大数据环境下的数据式审计模式的路径设计

      (一)大数据环境下数据式审计模式逻辑流程

      传统数据管理系统基于关系型数据管理系统(RDBMS)建设,虽然处理结构化数据式时性能突出,但是无法处理半结构化或非结构化数据,而且当需要处理的结构化数据增长后,只能通过增加昂贵硬件向上扩展而不能通过并行增加硬件数量向外扩展,导致数据分析能力受到很大制约,数据分析能力成为技术瓶颈。审计机关为了突破数据分析能力瓶颈,就必须建设大数据审计平台。由于目前Apache Hadoop架构是大数据处理领域的主流标准,本文就以Hadoop海量数据处理平台(见图1)为例分析建设大数据审计模式技术架构。

      1.审计大数据采集阶段

      大数据环境下,审计数据采集来源更加丰富。从互联网平台,审计人员可以采集门户网站、搜索引擎、社交网络如论坛、微博、微信等互联网大数据,数据类型主要为网页、文档、图片等非结构化数据,数据量大而且数据类型多;从各行各业的被审计单位,审计人员主要采集财务数据和业务等结构化数据,也可以采集会议纪要、业务文档等非结构化数据,数据量很大;从审计机关内部,审计人员可以整理和分析审计业务数据和管理数据,数据类型以审计文书、审计档案等各类非结构化数据为主。大数据环境下,设置传感器、采集日志文件和Web爬虫技术,成为大数据采集的重要手段,审计人员可以采集和处理的数据范围得以显著拓展。

      2.审计大数据处理和存储阶段

      

      大数据环境下,从各种渠道采集的大数据需要进行预处理,包括数据集成、数据清洗和冗余消除后,才会存储到数据库中。数据集成是在逻辑上和物理上把不同数据源的数据进行集中,为用户提供一个统一的视图便于处理;数据清洗是在数据集中过程中发现不准确、不完整或不合理数据,并对这些数据进行修补或移除以提高数据质量的过程;冗余消除是减少数据的重复或过剩,降低传输开销和存储空间。大数据环境下,审计大数据处理和存储阶段尤为需要对数据进行充分的预处理,才能提高数据处理和存储效率。而且,数据质量检查成为该阶段的重要审计任务。数据质量检查将为后续的大数据审计分析打下良好基础。

      通过简单升级计算和存储设备性能已经无法满足大数据发展趋势,尤其是非结构化数据的处理和存储必须采用大数据技术。大数据审计大数据平台,可以采用Hadoop海量数据处理平台,以HDFS分布式文件系统、Hbase数据库和MapReduce编程模型为核心,实现审计大数据的存储于管理。HDFS技术可以在低廉的服务器硬件上部署构建分布式系统,具备高容错性和高伸缩性等优点,安装部署便捷;NoSQL数据库技术已经成为处理大数据的标准,可以解决多样化和数据量大的需求,采用Hbase列式存储数据库,可以整合已有的关系型数据库,方便批量数据处理和实时查询。MapReduce分布式编程模型技术简单但功能强大,能将大规模的计算任务分配到廉价服务器硬件集群中,允许在不了解分布式系统底层细节的情况下开发并行应用程序。

      3.审计大数据分析阶段

      传统环境下,审计数据分析以查询型分析和多维分析为主,审计分析多以关联分析和趋势分析作为审计疑点或线索的判定依据,结果精确但作用范围有限,而且分析预测能力不强。大数据环境下,由于大数据分析的三个原则即要全体不要抽样,要效率不要绝对精确,要相关关系不要因果关系(维克托,2012),大数据分析可以更多采用统计分析、数据挖掘和数据可视化等方法,以扩大审计数据分析能力。不同的数据分析类型需要采用不同的分析方法,结构化数据分析主要采用数据挖掘和统计分析方法;文本分析主要采用文本表达、自然语言处理、信息提取、摘要、分类聚类、问答系统和观点挖掘等方法;网页分析主要采用网页内容挖掘、网页结构挖掘、网页用法挖掘方法;多媒体分析主要使用摘要、标注、索引检索、推荐和事件检测方法;社交网络分析主要使用链接预测、社区发现、社交网络演化、影响分析、关键词搜索、分类聚类和迁移学习方法(李学龙、龚海刚,2015)。通过上述大数据分析方法,审计数据分析得以对采集获得的各类数据进行深入挖掘,取得以往难以取得的审计数据分析效果。数据审计在此阶段将发挥重大作用。

      (二)大数据环境下数据式审计模式的网络架构

      大数据环境下,数据式审计需要建立在审计云基础之上,审计云的建立将大大提升审计工作效率。在已经实现审计机关联网的基础上,可以以上级审计数据中心和下级审计数据分中心为平台,在金审工程三期项目中加快推进审计云计算和大数据功能建设,统筹建设和使用审计机关的计算资源和数据资源,变分散的审计资源为集中的审计资源(见图2),一方面提高资金使用效率,另一方面提升数据利用效果,为审计人员提供更好的审计数据分析平台。魏祥健(2014)讨论了云审计与云审计平台概念,研究了云审计平台架构下的协同审计模式,并分析了协同审计模式的实现方式,提出加快建设全国审计云,打破审计机关审计数据分析各自为战的壁垒,实现软件即服务(SaaS)平台应用层的互联互通。随着省级审计机关统筹管理地方审计机关政策的落实,未来审计云可以集中在高层次审计机关建设,下级审计机关和审计人员作为审计云用户接入,无论是在审计机关,还是被审计单位现场,都可以使用审计云计算和大数据服务。

      1.通过审计云可以统筹计算资源,提高资金使用效率

      

      当前各级审计机关的服务器一般仅为本机关审计人员使用,很多审计机关尤其是地市级以下审计机关计算资源分散而且计算能力不强。各级审计机关投资采购的服务器总量虽然不少,但多数为低性能服务器而且使用频率不高。通过集中建设审计机关审计云,将充分发挥云计算扩展性好的特点,集中采购和部署廉价服务器集群,就能很快形成高性能的审计计算能力。

      2.通过审计云可以统筹数据资源,提升数据利用效果

      当前各级审计机关都已经各自存储了大量的内部数据和被审计单位外部数据。一方面很多审计机关由于经费限制,数据存储容量紧张,存储能力捉襟见肘。另一方面审计机关之间协同不足,数据利用效果不佳,数据有待深入分析。通过建设审计机关审计云,集中上收基层审计机关的数据存储设备,共享审计机关之间的数据资源,将显著提升审计机关内部数据利用的效果。

      (三)大数据环境下数据式审计模式的应用架构

      大数据环境下,审计机关可以以审计大数据平台为基础,构建多维审计分析系统,支持横向(多业务部门)和纵向(各级审计机关)的应用(见图3)。

      1.以审计大数据平台作为基础

      审计大数据平台基于大数据采集系统、大数据存储系统和大数据管理系统构建。大数据采集系统负责从互联网网、被审计单位和审计机关内部采集和整理各种结构化数据和非结构化数据;数据存储系统负责采用分布式文件存储技术和数据仓库技术存储数据;数据管理系统负责优化和调度数据;审计大数据平台负责对数据进行统计分析、数据挖掘和可视化分析等多维分析,充分解析数据的信息价值。

      2.利用大数据技术建设审计分析系统

      在审计大数据平台的基础上,可以重点建设审计线索分析系统、业务审计分析系统和审计成果分析系统。审计线索分析系统主要采用网页分析、社交网络分析和多媒体分析技术,基于互联网社会热点话题和举报信息搜集审计线索,加大搜集审计线索的能力。业务审计分析系统主要采用结构化分析和文本分析技术,在传统审计分析的基础上,加入对中央重大政策和各行业主管部门具体政策的分析,有助于调整业务审计“微观化”和“案件化”趋势,发挥审计宏观监督的作用。审计成果分析系统主要采用文本分析技术,对以前年度的审计成果进行信息提取、分类聚类和观点挖掘等分析,加大对审计整改情况的追踪,提升审计监督的效果。

      

      四、大数据环境下数据式审计模式的探索和效果评估

      (一)大数据环境下数据式审计模式的探索

      传统环境下,审计人员仅根据审计项目需要采集被审计单位的财务数据和业务数据,数据量一般不大,数据类型通常简单。数据式审计模式仅需要对被审计单位的财务系统和主要业务系统进行系统内部控制测评后,即可开展数据审计,通过数据趋势分析和关联分析取得审计线索。但是随着对审计能力要求的提高,以及被审计单位数据量的迅猛增长,传统环境下的数据式审计模式需要改进。

      从审计署官方网站了解到,湖北省审计厅已经在大数据审计方面取得了比较突出的成果,大数据环境下的数据式审计模式已经发生变化。一是数据采集变得多样。湖北省审计厅通过构建被审计单位财务业务数据库、审计机关审计结果数据库、第三方信息数据库、互联网舆情数据库等四大类数据库,收集省直审计数据量8TB和市县审计数据量3TB,积累大数据审计之源。二是更加重视数据质量检查和数据处理。湖北省审计厅认为收集数据不是目的,目的是能使用这些数据,注意解决数据一致性、数据转换和数据筛选等问题。三是数据分析方法更加深入。湖北省审计厅开展业务数据与财务数据,单位数据与行业数据以及跨行业、跨领域数据的综合比对分析,研究开发审计结果分析系统,将非结构化的文本数据进行结构化处理并进行审计成果分析。四是审计程序可以优化。湖北省审计厅根据被审计单位以往被审计的频次和审计结果,实现被审计单位的审计情况汇总,为编制年度项目计划提供依据,大数据分析不再局限于具体审计项目,可以运用于审计程序的各个环节。

      经过改进后的数据式审计模式取得了突出的审计成果,湖北省部门预算执行审计由原来一年只能审计10多个单位到可以基本实现省直预算单位审计全覆盖。在2014年保障房审计中,发现疑点问题2722条,查处各类违纪违规问题金额12.12亿元,审计成果显著提升。同时,经过改进的数据式审计模式也为审计成果利用创造了条件和机会。

      (二)大数据环境下数据式审计模式的效果评估

      平衡计分卡作为绩效评价的重要方法,可以用于评估大数据环境下数据式审计模式的效果。对于企业而言,平衡计分卡是从财务、客户、内部运营、学习与成长四个角度,将企业的战略落实为可操作的衡量指标和目标值的一种绩效管理体系。对于审计而言,上述角度可以相应地转换为“效果”即完成审计任务的同时促使预算资金效益最大化,“服务”即提升报告质量和增进为被审计单位顾问服务的功能,“效率”即改进内部运营和优化审计业务流程,“创新”即创造学习和成长环境进而创新方式方法(付同青,2008)。通过从效果、服务、效率和创新层面设置评价指标(见表1),在积累测试数据的基础上,可以有效评估大数据环境下数据式审计模式的效果。

      大数据环境下,数据式审计模式发生了变革。审计人员需要充分认识大数据环境对数据式审计模式带来的影响,认真分析审计对象、审计方法和审计程序发生的变化,积极利用大数据技术快速提升审计能力,更加有效地发挥审计在推动完善国家治理中的重要作用。

      

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

大数据环境下的数据审计模型分析_大数据论文
下载Doc文档

猜你喜欢