审计数据恢复中常见问题的解决方法,本文主要内容关键词为:常见问题论文,解决方法论文,数据恢复论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据库版本问题 由于被审计单位的信息系统建设时间不一,且数据库的发行版本又在不断更新,因此审计人员在实际项目中可能会遇到不同版本的数据备份。实际上,数据的顺利恢复与版本是否兼容密切相关。建议数据的备份版本与恢复所用的数据库版本保持一致,即在明确被审计单位数据库版本的同时,采用相同版本的数据库进行恢复。在无对应版本的情况下,可采用较高版本作为恢复环境,进而保证数据库的向下兼容性。在上述场景均无法保证的情况下,一种折中的方案是建议被审计单位将原始数据保存为平面文件,即特定字符分隔的文本文件(见本刊2015年第8期文《计算机审计中如何实现平面文件的快速恢复》)。这种格式的文件能够避免数据库底层间的差异,即使对于同一种数据库也不会受到版本的制约。然而,该格式也存在一定的局限性,如导入和导出操作需要较多的人工干预、存储空间浪费较大等。 字符集问题 在数据恢复过程中,另一个让人头疼的问题是数据库的字符集问题。在以往审计项目中发现,审计人员在创建数据库时通常采用系统默认的字符集,而不考虑被审计单位所采用的字符集。当数据恢复完成并投入使用时,审计人员才发现数据由于字符集不同而产生乱码,根本无法使用,时间和精力也被白白浪费。 字符集实际上是一种编码集合,它以一定字符编码方案对特定符号进行表示。由于编码方案的不同,每种字符集所能表达的字符个数也有所不同。通常的解决方法有两种:一是将被审计单位所用的字符集作为审计分析环境的默认字符集。这种方法的好处在于,恢复数据过程中数据库无需对字符集进行转换,数据也不会出现乱码现象。二是使用一个能够涵盖被审计单位所用字符集的字符集,即原有字符集的超集。由于其保证了向下兼容性,因此数据的显示也不会出现异常。对于字符集间的包含关系,通常可从相应的数据库帮助文档中获得。 数据恢复效率问题 数据恢复过程中,即使在不出错的情况下,一个较小的数据文件恢复也需要花费较多时间,对于一些比较紧急的审计项目,数据恢复所花费的时间越长,就意味着可用于分析的时间越短,严重影响审计实施的效率。 对于该问题,通常可采用以下两种方法对数据恢复效率做进一步提升:更改配置和调整应用。其中,更改配置是指通过调整系统硬件及软件配置来提升机器的整体性能,从而使数据恢复工具能够利用更多的系统资源,如优化I/O子系统、增加内存、调整数据库数据缓存区等;调整应用则是指通过改变恢复策略或选择适当的恢复工具来缩短恢复所用时间,如缩小恢复范围、忽略索引和统计信息、使用快速恢复工具等。 上述两种方法中,调整应用通常可作为一种有效的方式。现实场景中,被审计单位所提供的数据通常包含一些与审计关联性较弱的系统数据。如应用维护数据、元数据等,这些数据在审计分析中并非完全需要,因此在数据采集阶段就可对其过滤进而减少后续所需恢复的数据量。此外,对于主流数据库系统来说,通常提供几种效率较高的恢复工具或命令,如SQL Server的BLUK INSERT、Oracle的IMPDP和SQL LOADER、DB2的LOAD等,因此,审计人员可通过与被审计单位沟通获取相应的数据格式,并结合上述工具或命令以实现恢复效率的提升。审计数据恢复中常见问题的解决方案_大数据论文
审计数据恢复中常见问题的解决方案_大数据论文
下载Doc文档