基于数据挖掘思维的农村集体土地征地拆迁舞弊行为审计,本文主要内容关键词为:集体土地论文,数据挖掘论文,思维论文,征地拆迁论文,农村论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着大数据的话题在公共卫生、商业服务等领域引发越来越多的关注,数据挖掘技术也迎来更广阔的应用舞台。所谓数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。一种比较公认的定义是:数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程。数据挖掘通过在数据库中寻找模型而产生假设,本质上是一个归纳的过程。在实际应用中,应重点关注以下几个方面:基于真实性基础上数据的完整性,足够丰富完整的数据是挖掘出有价值信息的基础;数据的预处理非常重要,甚至在分析过程中需要多次返回重新修订;精通业务和数据管理、数据分析同等重要。作为紧跟信息时代的审计人,应该“努力在可以应用、可以拓展的地方,应用它、拓展它”。虽然我们在审计工作中接触的数据从容量上称不上“大数据”,但数据挖掘的思维却有助于我们透过纷杂的数据,挖掘有价值的信息,这种应用和探索值得审计人关注。 一、审计背景 本文涉及的两个农村集体土地拆迁审计是配合某市审计局实施的全市X个街道办事处财政运行情况专项审计调查重点审计项目而实施的,是项目的重要组成部分。基于数据挖掘思维的审计方法,实现在拆迁现场结束后,资料不全甚至是原始测量资料缺失的情况下,对舞弊行为的快速高效审计。该方法在A、B两个街道的拆迁审计中,证明是高效可行的。 二、主要思路 征地拆迁中若存在舞弊行为,多通过社区干部本人或其直系亲属参与实现。据此审计确定“剖析重点项目、确定重点人员、挖掘主要问题”的思路,抓住两条主线:一是拆迁补偿重点人员紧紧围绕查证社区干部及其直系亲属展开;二是补偿金额的定量分析紧紧围绕重点人员展开。 鉴于审计手段有限、拆迁项目众多、审计人手不足等原因,以上思路的实现主要依靠数据挖掘思维和方法,从不同部门不同来源的多源数据中挖掘潜在、未知的关联信息、生成模型、综合分析、得出疑点。 三、资料数据来源 1.2010年第六次人口普查街道的户籍资料,由街道统计部门提供,主要用于挖掘社区干部群众的社会关系。该户籍资料可能存在字段、数据不全,最终的亲属关系还需要在后续分析过程中不断修订。 2.街道、社区、拆迁办工作人员名册,最好带身份证号,由街道人事部门提供,主要用于圈定社区干部名单。若缺少社区非编干部数据,可从社区补助发放等会计凭证附件中搜集补充。 3.拆迁(青苗)补偿等支付凭证附件中发放明细的电子表,由街道财政所或拆迁办提供,主要用于定量分析赔偿金额。 4.房屋拆迁地案资料和青苗补偿资料以及拆迁办报送财政所的补偿款明细等业务资料,由街道拆迁办提供,主要用于后期的分析和数据挖掘使用。前者可能包含原始测量资料,也可能仅仅是拆迁双方协商后最后签订的协议;申请补偿明细中有些字段(如联系电话、原始序号等)隐含的信息对后期的数据挖掘很有价值。 5.付款单位(如开发区、指挥部等)提供的拆迁和青苗补偿明细以及原始测量表,主要用于疑点筛选出来后进一步定量分析确认。 索要资料数据时需要注意:一是注意保密,查阅、复印等各个环节尽量由审计人员自己做;二是“兵贵神速”,所有资料均要在第一时间、资料提供单位没有事先准备的情况下获取,数据的真实性重于完整性;三是对数据的预处理要“不厌其烦”,通常在数据挖掘过程中需要多次回头重新处理原数据。 四、审计内容和方法 (一)虚报房屋和附属物审计——挖掘重点人员和纸质资料中有价值信息 该部分主要数据分析流程见上图,流程图中主要数据的标注序号对应本文“四、资料数据”部分的序号,重点关注四个节点: 1.挖掘社区干部隐含的直系亲属关系、查找同组村民中只有一户拿到拆迁补偿的人员、查找户籍不在本地却拿到拆迁补偿的人员,合并分析确定重点人员范围。这部分需要注意的是,最后挖掘出的社区干部及其亲属范围在开展下一步分析工作前要及时与公安部门核实其准确性。这一过程需要注意两点:一是保密,尽量不要通过街道同级的派出所或区公安分局核实,而要通过区的上级政府公安部门查询。二是公安查询社会关系并不是简单的点点鼠标,而是要逐级追溯查询,很费时间,因此审计人员要尽量提高挖掘信息的准确性,以提高核实效率。 2.定量分析重点人员补偿明细。将重点人员名单与补偿款支付凭证明细关联,生成结果表。 3.对重点人员逐户查阅、分析地案资料和原始入户测量表,挖掘有价值信息:如计算拆迁占地面积,估算附属物合计占地面积,比对代领签字笔迹、指纹等,关注测量人员与户主的关系,挖掘房产证、土地证隐含的信息等等。这部分需要注意的是:一是因审计手段有限,被审计单位和村民很可能不配合,不提供原始的入户测量数据,或提供的赔偿协议及附件实际上是拆迁双方最后商定的不实资料;这样,审计人员更要对相关纸质资料逐户、逐份、逐页、逐项分析比对,挖掘其中隐含的有价值信息;一句话就是“分析其到底有多假”!二是在分析过程中,要随时做好记录并复印相关佐证材料。 4.整理出涉嫌违规明细和详细的分析文档,和相关复印佐证材料一并作为移送处理书附件,移送相关部门。这部分需要注意的是:作为审计移送处理书的附件,除了复印的佐证材料外,分析文档要花工夫撰写。审计移送书因受公文格式的限制主要表述涉嫌舞弊行为结论性内容,而环环相扣、详尽的疑点分析文档会使受理移送书的纪委、检察部门读起来一目了然,确定办案思路和重点,以达到事半功倍。 (二)虚报青苗审计 主要过程大体同(一),此外还要关注以下三个方面: 1.社区干部及亲属以户籍为单位,一户多次领取青苗补偿。 2.同组中(特别是门牌号邻近的同组村民)只有一户拿到青苗补偿。 3.关注大额的青苗补偿协议是否签订承包合同、承包合同是否备案,同时关注补偿协议、承包合同、领款人等文档的签字笔迹等细节。 (三)伪造房产证审计——挖掘公章、登记日期与编号之间关系 在分析数据和查阅地案资料过程中,审计人员发现B街道房产证上共出现三种公章,为便于表述分别称之为小“口”字章(区划合并前用章)、大“口”字章(区划调整后用章)和瘦“用”字章(疑点章)。其中,最后确定的疑点名单中瘦“用”字章仅出现三处,审计人员进而怀疑该街道可能存在房产证造假。通过对疑点人员房产证登记内容重新分类整理,结果参见附表1,表中隐去“所有权人”和“身份证”两列内容。对结果表按房产证编号和登记日期升序排列后,发现涉嫌伪造房产证主要集中体现在两个方面: 1.公章造假,如瘦“用”字章涉嫌造假。 2.公章虽真,但用印时间不对。主要体现在房产证编号和登记日期之间存在疑点,如编号为“XX大字第440号”的房产证疑点有两处:一是按流水编号440号的登记日期(2003-12-09)不应该出现在525号登记日期(1998-06-20)之后;二是525号及之前的房产证公章均是小“口”字章,只有440号用的是大“口”字章。再如编号为“XX石字第099号”的房产证疑点集中在1998-06-10登记的批次房产证中均用小“口”字章,唯独099号用的是大“口”字章。 该审计结果其实是数据挖掘过程的附带产品,结果模型却简单明了、行之有效。该项工作除了在查阅资料过程中始终保持职业敏感之外,对可能存在潜在价值的信息还要“不厌其烦”地处理数据,甚至是手工整理输入数据,进而挖掘出潜在的关系。 五、审计成果 该方法经过A、B两个街道拆迁审计的实践检验,取得良好的效果:报送市政府专报一份;移送市纪委、检察院审计移送处理书四份,查出通过伪造房产证、虚报房屋和附属物等骗取房屋拆迁补偿款、通过虚报青苗亩数骗取青苗补偿款等问题,涉案人员及金额相关部门正在办理中。基于数据挖掘思想的农村集体征地拆迁诈骗审计_审计方法论文
基于数据挖掘思想的农村集体征地拆迁诈骗审计_审计方法论文
下载Doc文档