大数据金融审计防范金融风险的对策研究
张译华 许倩倩
(西北大学经济管理学院 陕西 西安 710127)
【摘要】 随着大数据的普遍运用,金融行业对大量复杂的数据处理变得更加高效和快捷。同时,金融行业作为一个高风险的行业,这一趋势无疑也对金融审计提出了更高的要求。在大数据的大环境下,金融审计如何利用大数据技术防范金融风险已经成为一个广泛关注的问题。文章阐述了金融审计对大数据的需求,提出在大数据背景下如何构建金融审计的数据平台以及如何进行数据收集、数据管理与数据分析,旨在为大数据背景下的金融审计如何防范金融风险提出可行的建议。
【关键词】 大数据;金融审计;数据平台;数据分析
一、引言
习近平总书记在党的十九大报告中强调:“健全金融监管体系,守住不发生系统性金融风险的底线。”新时期,金融风险的防范是金融审计工作的重中之重。在防范金融风险的工作上,国家审计必须发挥其国家治理功能,辅之必要的金融审计工作。在金融领域实现金融审计全覆盖,不仅是实现审计全覆盖工作的重要环节,更是打赢防范化解重大风险攻坚战的必要保障。当前金融审计工作应紧紧围绕如何防范化解金融风险,从微观和宏观两个层面把握各个金融风险点,把发现和揭露当下最受关注的金融风险问题作为工作重点,致力于发挥审计在防范化解金融风险中的监督作用。
宫腔镜可以对子宫内疾病进行诊断和治疗,对子宫腔的情况进行了解观察。通过宫腔镜进行引导,对病变组织进行全面直观的观察和采集,对输卵管插管、输卵管通畅度进行判断有较好的效果,宫腔镜手术还能够切除子宫内息肉,子宫内膜和黏膜下肌瘤,取出宫腔内的异物效果也比较突出,不需要开腹治疗,对患者的创伤比较小,恢复速度快。
二、金融审计对大数据技术的需求
在信息化高速发展的新时代,海量的金融数据爆炸增长,其中隐藏着巨大的金融风险,目前金融审计工作的重点就是要尽最大努力防范金融风险,在这种背景下,采用大数据技术助力金融审计成为必然的趋势。大数据技术在审计工作中的应用,也是科技强审之路的必然要求。
由于历史发展原因,全市电商主体大部分散布在各区县园区、镇街住宅楼中,工业园区、商务楼宇等载体集聚电商资源较少。全市重点电子商务产业园,由于受场地限制原因,产业园区内知名电商企业数目不够多、布局产业不够集中,不利于资源整合及专项规划政策的制定,产业集聚效应难以凸显,影响了行业的整体竞争能力。
近年来,互联网金融的发展非常迅猛,结构化数据、半结构化及非结构化数据均有了前所未有的增长,数据类型多样,数据量庞大,传统的金融审计已经不能满足目前的审计需求,必须采用相应的大数据技术对数据进行统一管理,整合所需要的大量资源,为金融审计工作更好地开展提供必要的前提条件。采用大数据技术对金融审计所需要的数据进行收集、筛选、利用、积累,在对各项数据进行综合分析后找出审计线索,能够大大缩短人工处理数据的时间,这在很大程度上避免了低级的人为错误,从而减少人为因素对审计工作产生的影响,将节省出的时间用在金融审计的现场取证等其他重要环节,提高金融审计的工作效率;运用大数据技术可以更充分地利用多类型的数据,从多个维度对数据进行比对,发现并核查可能的疑点,有效避免未及时发现问题的情况,更好地发挥金融审计在防范化解金融风险中的作用。
三、大数据背景下金融审计的数据平台构建
其次,大数据时代产生的数据类型复杂,金融审计收集的数据分为两大类,一类为结构化数据,这类数据通常方便搜索,定义明确,存放于数据库中,便于分析处理,比如数字、日期等。金融审计中从被审计单位获取的数据大多都属于结构化数据,如商业银行审计中的存贷款数据;另一类数据为非结构化数据,这类数据不具有完整规则的数据结构,格式复杂多样。如金融审计中从互联网平台获取的各种文档、图片信息数据,从被审计单位获取的会议纪要、业务审批文件等数据,审计机关存储的历年审计工作的审计档案等数据,这些都属于非结构化数据。传统的审计方法对于结构化数据的处理已经相对较为成熟,但还不足以应对非结构化数据的处理,在非结构化数据呈爆炸式增长的大数据时代,必须充分利用大数据技术来处理非结构化数据,进而提高金融审计的效率。
在对金融机构的数据进行统一的收集、存储和管理后,需要利用大数据技术对海量复杂的数据进行分析,找出可能出现的问题,进而评估面临的风险,确定审计的重点所在,寻找审计证据,得出审计结论,因此如何有效地利用大数据技术挖掘数据中隐藏的深层次的信息,增强对数据的分析能力,提高数据的利用率对于防范金融风险至关重要。
江西省赣州市是浓香型烤烟产区。近年来,由于当地主栽烤烟品种K326和云烟87早花现象严重及其品种特征特性出现退化现象,品种单一已是影响江西烟叶发展的重要因素之一,因此,选育及筛选出替代烤烟新品种并探索其配套栽培技术是当前急需解决的问题[7-8]。不同烤烟品种其品质特性不同,适宜的栽培技术才能彰显出其品种特色,施氮量是栽培过程中一个重要的影响因素[9]。GZ90和GZ66是赣州市烟草科学研究所自主选育的新品系,笔者通过不同施氮量对GZ90和GZ66的产质量影响及与K326的比较试验,完善它们的配套栽培技术,以期选育适应江西生态环境的优良烤烟新品种,为进一步改良自育新品种的特性提供理论依据。
四、大数据背景下金融审计的数据收集
“汇报演示型”课堂互动模式,也就是课堂上开展以小组为单位的汇报演示,重点考察学生的团队合作能力、协助精神以及创新意识。“汇报演示型”课堂互动模式要求各小组根据教师课前布置的相关任务组内成员分解准备,课中以小组为单位开展汇报演示,且汇报结束后对现场师生的实时提问进行解答。在实施过程中,课中环节按照高度结构化的设计准则(见表1),将课堂活动设计到分钟尺度,即教师讲授5min,每组汇报15min,每组师生提问讨论3min,每组师生评分2min,教师总结5min。在此过程中,教师作为支架,全程参与指导,帮助学生消化吸收、答疑解惑。
首先,金融数据的获取最主要是来自于被审计的金融机构本身,通过审计署发布的公告来看,目前金融审计的内容主要还是针对金融机构的年度资产负债损益进行监督审计,因此对金融机构内部产生的数据有大量需求。在当前的互联网时代,从互联网平台获取所需数据也成为一种必要的手段,金融审计所需的一些公共数据等都要从互联网平台获取。在金融审计过程中,由于其业务具有高度综合性,涉及的内容范围较广,还需要其他政府部门配合,大数据时代下传统的部门间的壁垒正在慢慢被打破。审计机关以往进行金融审计产生的数据也具有重要价值,在金融审计过程中还需要从审计机关内部获取大量数据。
对于目前汉语依存的发展,研究要结合汉语自身的特点。就目前而言,统计方法已成为主流技术,尽管英语方面出现许多较为成熟的统计模型,可以为汉语分析所借鉴,但汉语的语言特点使得研究人员在借鉴其优点的同时,还应该结合汉语特点进行特殊处理,比如汉语中特殊语法结构(排比句、叠词等)的处理。利用语法、语义等方面知识构建联合模型来提高依存分析的正确率,构建的词义、词性标注和依存分析的联合模型。联合模型开辟了一种新的思路,可以成为我们研究的一种方向。
大数据背景下,海量的金融数据一方面满足了金融审计对信息数量和质量的需求,另一方面也给审计平台的构建提出了更高的要求。金融审计面临着比以往更多样更复杂的信息,有被审单位内部的财务数据及治理机制、研发情况、组织结构、内外部环境等非财务数据,互联网上产生的与被审单位有关的大量媒体资讯、统计数据等实时动态数据,以往审计中使用的模型、程序等经验数据以及政策变更、宏观经济形势、行业前景预测等其他数据(刘国城等,2017),等等,这些数据大多散乱无章,没有建立相互之间的联系,不能高效率地得到运用,这就对审计数据平台提出了更高的要求。
以下从大数据背景下金融审计的数据收集、数据管理、数据分析三个方面介绍金融审计平台的运用。
首先,对收集的数据进行预处理,不仅需要预先对结构化数据进行全面审阅,对于非结构化数据而言预处理也非常重要。这一步骤的主要目的是对数据中存在的短缺、错误等问题进行检测、调整,以使原始数据更加准确,确保原始数据的高质量,这对于下一步的数据分析至关重要。对于结构化数据的预处理,审计师可以通过分析重要指标的变化趋势、查看审计重点涉及到的数据是否披露等方式预先审阅数据;对于非结构化数据,预处理的主要目的是便于在后续处理时计算机能够快速找出审计工作所需要的信息。对于文本类的数据,主要方法是将文本分解成各项词汇的组合,并建立词汇之间的关系。不同于结构化数据,非结构化数据的预处理还要对相似文本进行筛选,避免处理相似数据导致工作量大、效率低下以及在统计中因为重复而导致结果不准确等情况。对于影音、图像类等非结构化数据需要先运用相关的技术将其转化为文本类数据,再进行预处理。
图1 金融审计数据收集流程图
五、大数据背景下金融审计的数据管理
数据的收集是为了数据的管理利用,在金融审计过程中,首先是利用大数据采集技术完成对所需的各项数据的收集,在数据收集工作完成后如何对数据进行处理及如何更好地管理这些数据将更为重要。
最后,在金融审计过程中对于各项数据的采集主要运用传感器、日志文件和网络爬虫三种大数据技术(郑伟等,2016)。利用传感器进行数据收集弥补了人类的感知局限,能够及时收集到实时数据并传输至审计平台,为实时审计提供了技术支持。传感器技术将成为大数据时代下海量信息来源的一种重要方式;被审单位产生的大量日志文件经过整理、分类、统计也可以成为审计证据的重要来源;网络爬虫是事先设定好需要的爬网作业,将非结构化数据从网站中提取出来,经过转换,转化成易于分析的结构化数据。这三种大数据采集技术目前应用较为广泛,可以高效地获取数据,为金融审计的开展提供了便利。除了这三种常用的采集技术外,还可以利用数据众包、AO 采集等技术。
金融市场上每天都会产生大量的金融数据,这些数据来源广泛,具有较高的复杂性,这就需要有效地运用大数据技术对海量的数据信息进行全面的收集与系统的管理,确保金融数据的准确性、完整性及有效性,由此大大提高金融审计工作的效率。本文设计了在大数据背景下金融审计的数据收集流程图,如下页图1所示,该流程图从整体上看说明了大数据背景下,金融审计从哪里收集数据,收集哪些数据,以及应采取哪些方法进行数据收集。
其次,加强对数据的存储,包括对结构化数据以及非结构化数据的储存。结构化数据的存储较简单,一般通过金融机构使用的财务软件直接导入审计平台中,目前对金融机构的审计集中在对结构化数据的审计上,因此对结构化数据的存储难度不大;非结构化数据存在种类众多、数量巨大、利用率低等一系列的特点。充分利用非结构化数据,挖掘其中的重要信息,实现与结构化数据对接,不仅有助于发现审计疑点,也有助于提供有力的审计证据,因此对非结构化数据的存储尤为重要。对于文本类的非结构化数据,例如规章制度、批准文件、会议记录等可以按照内容摘要、基本信息等分类储存在数据库中;对于视频、录音、图片等影音文件可利用光盘、磁盘文件的方式进行储存,以便于查询与管理。
六、大数据背景下金融审计的数据分析
在数据的存储上,审计数据平台要按照逻辑将数据进行有序的储存,运用一定的计算机数据处理技术将杂乱无章的数据转化成能够便于审计使用的数据,这需要专业的计算机人员的参与。Hadoop 分布式存储系统是专门为了应对大数据的存储问题设置出来的一种模式,它能够通过网络对各个离散的单元间建立联结,将作业调度、并行处理相结合,具有没有导入限制、成本较低以及可延展性高等突出优势,是目前普遍得到认可的数据存储模式,在实际的审计工作中逐渐得到运用;在数据的处理上,数据平台需要满足海量数据的查询、分类、筛选、统计、关联等多种功能(刘星等,2016),发掘出数据中隐藏的潜在信息,从而找出新的审计疑点;在数据的实时检测上,数据平台通过建立多种金融数学模型对数据进行监控,发挥数据的预测功能,及时发现问题,建立预警机制,改变传统的事后审计,逐渐实现实时审计,这样既能降低金融风险,又减轻了审计人员的负担。由此可以看到,与传统的审计不同,数据平台的构建融合了多种学科的知识,对审计人员的能力提出了更高的要求,这将是大数据背景下审计面临的新的挑战。
数据分析包括对结构化数据及非结构化数据的分析。目前的金融审计主要集中在对从金融机构内部获取的结构化数据的分析上。在大数据的大环境下,审计人员主要采取SQL 查询、数据挖掘技术、多维数据检查技术及专家经验模型四种方法对结构化数据进行分析。具体而言,SQL查询通过输入查询语句找到需要的信息,可以在不同数据库之间建立联系,找到审计需要的全部信息,实现更高效更全面的查询,获取充分的审计证据;数据挖掘技术是通过设定复杂的算法、程序,对海量的数据进行更大程度的信息挖掘,发现仅靠人力难以注意到的可能存在的疑点(程平等,2016),经常用于信贷的风险评估、项目收益率的预估等,还可通过构建复杂的模型在不同的数据之间建立联系,实时监测数据,通过科学的定量分析提前发现问题,及时做出调整,预防金融风险;多维数据检查技术是从横向和纵向维度对数据进行检查,及时发现偏差较大的数据。横向维度是指可以将不同分行、支行的数据在统一平台上进行分析,检查各项财务指标是否正常,是否符合标准及规章制度,从整体角度检测数据是否合理;纵向维度一方面是指可以通过对比历年各项重要数据的变化趋势进行分析,另一方面也可以借鉴历年审计所使用的模型、程序等解决相似的问题,这将大大提升审计效率,减少不必要的时间消耗;专家经验模型是将金融专家建立的经过检验的审计模型储存在审计平台上,在金融审计中只需将需要的模型或程序直接运用在同类型问题的审计中,系统将自觉检查出问题数据,实现计算机自动审计,减少人为审计可能出现的错误,提高审计的准确度(黄舒,2017)。
金融机构的非结构化数据包括公司的规章制度、会议记录、批准文件等,关系着金融机构的内控设置是否合理、是否得到落实、重大决策是如何做出的、是否积极响应国家政策等关键信息。然而目前对于非结构化数据的分析主要采用查询关键词的方法,没有统一的标准化的分析模式,因此,如何利用大数据技术深度挖掘非结构化数据中的潜在信息,体现大数据技术给金融审计带来的便利、发现人力难以注意到的潜在金融风险是当前审计面临的重要问题。
图2 金融审计数据处理流程图
首先,可以将文本类数据按照一定的标准进行统一的分类,以便于数据的整体管理和审计中的查询分析,减少数据杂乱带来的遗漏、重复的情况,影响审计证据的准确性和真实性。分类的标准有内容摘要和基本信息,内容摘要具体包括文本涉及的业务类型、主题等;基本信息是与文本内容无关的信息,包括生成时间、发布者、文件类型、文件大小等;对于非文本类的非结构化数据,可以先运用计算机技术将其转化为文本类数据再进行分析(吕劲松等,2017)。
其次,建立模型对统一分类处理后的数据进行查询、挖掘。例如,可以建立情感词分析模型,统计文本中的正面、负面类词汇的出现频率,以及程度词的运用情况,深度了解文本表达的精确含义,挖掘潜在的信息,进而聚焦可能出现审计疑点的地方,防范金融风险;最后,非结构化数据不仅要发挥自身的作用,体现金融机构决策流程的、规章制度等内部控制的有效性,还应与结构化数据相结合,从公司的整体层面系统分析财务数据,二者相辅相成,共同找出审计疑点(如图2所示)。
七、结论
在大数据背景下,如何运用各项计算机技术充分发挥大数据带来的优势,提高审计效率,防范金融风险已经成为金融审计工作急需解决的重要问题。本文首先阐述了大数据对于金融审计重要性和必要性,进而对如何改善传统金融审计方式,构建大数据背景下更准确更高效的审计方式进行了详细的探讨,分别从金融审计数据平台的构建、数据的收集、管理及分析四个方面展开了论述,为金融审计防范风险提出了有效可行的对策,对大数据环境下金融审计如何更好地发挥作用具有一定的理论意义。
【主要参考文献】
[1]M Cao,R Chychyla,T Stewart.Big data analytics in finan⁃cial statement audits[J].Accounting Horizons,2015,29(2).
[2]Manyika J,Chui M,Brown B,et al.Big Data: The Next Frontier for Innovation,Competition,and Productivity[R].McKinsey Global Institute,2011.
[3]Li W,Lang B.A Tetrahedral Data Model for Unstructured Data Management[J].Science China Information Sciences,2010,53(8).
[4]黄舒.大数据背景下审计质量提升路径[J].企业经济,2017,(12).
[5]郑伟,张立民,杨莉.试析大数据环境下的数据式审计模式[J].审计研究,2016,(4).
[6]吕劲松,王志成,王秦辉,徐权.大数据环境下商业银行审计非结构化数据研究[J].软科学,2017,31(1).
[7]刘国城,王会金.大数据审计平台构建研究[J].审计研究,2017,(6).
[8]吕劲松,王忠.金融审计中的数据分析[J].审计研究,2014,(5).
[9]罗键,刘丰.构建基于大数据理念的金融审计模式[N].中国审计报,2015-1-28.
[10]刘星,牛艳芳,唐志豪.关于推进大数据审计工作的几点思考[J].审计研究,2016,(5).
[11]程平,白沂.基于财务共享服务模式的大数据审计研究[J].审计与鉴证,2016,(5).
【中图分类号】 F239.4
【文献标识码】 A
【文章编号】 1002-5812(2019)19-0016-04
标签:大数据论文; 金融审计论文; 数据平台论文; 数据分析论文; 西北大学经济管理学院论文;