非结构化数据分析在工程招标串标问题审计中的应用,本文主要内容关键词为:结构化论文,工程招标论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近年来军队基建工程招标投标中的串标、围标等违法行为频频发生,严重扰乱了正常的财经管理秩序,妨碍了部队工程招标工作的健康发展,如何治理这一腐败行为已成为当前财经管理中的一大难点。目前对工程招标的审计方法和手段有限,审计问题难以认定。本文在介绍非结构化数据概念的同时,用其分析方法快速分析出投标人标书雷同、错漏一致的地方,帮助审计人员认定和查处串标问题。 一、非结构化数据的概念 在信息时代,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。 非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图像、声音、影视、超媒体等信息)。非结构化WEB数据库主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段,并实现了对变长数据和重复字段进行处理及数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势。 二、军队基建工程串标的危害及主要表现形式 串标是指投标单位之间或投标单位与招标单位相互串通骗取中标的投机行为。首先,串标实质上是一种无序、恶意竞争行为,其扰乱了正常的招投标秩序,妨碍了竞争机制应有功能的充分发挥,往往使中标结果在很大程度上操纵在少数几家企业手中,而把有优势、有实力中标的潜在中标人拒之门外,破坏了建设市场的正常管理和诚信环境,严重影响招标投标的公正性和严肃性,伤害了大多数投标人的利益。其次,串标常常会导致中标价或竣工结算价大大超出正常范围,从而加大投资成本,造成军队建设资金流失。再次,参与串标的企业往往诚信度不高,甚至不大重视企业的内部管理,给工程建设留下安全隐患。当前串标主要表现为: (一)招标人与投标人串通 招标单位的代表,多为建设单位相关部门负责人,投资的钱是军队资金,工程价款的多少与自己没有多大关系,在地方投标企业给予个人以足够的经济利益报酬情况下,就可能产生权钱交易,出现招标人与投标人串通投标。 1.透露信息。招标人将能够影响公平竞争的有关信息透露给内定的中标人,造成投标人之间的不公平竞争,甚至协助投标者撤换标书,更换报价。 2.事后补偿。招标人与投标人串通好,由投标人超出自己承受能力压低投标价格,中标后再由招标人通过变更增加招标时没有的工程项目或工程量等方式,让中标人低中标高结算。 3.设置障碍。招标人根据内定中标人特有的技术条件,故意在资格预审或招标文件中设置某种技术资质要求,以排斥其他潜在投标人,操纵中标结果。 4.招标人通过内定中标单位邀请两家以上单位参加投标(该被邀单位有的甚至自身资质不够而挂靠其他单位进行投标),然后招标人自己,或通过招标代理单位以招标人资金不足、工程会拖欠工程款等原因影响一部分参加投标单位退出投标,这样几个已经串通好的投标单位就可以操纵中标。 5.招标单位派二至三个代表参加招标评标,把人为因素的影响贯穿于整个招标过程,有利于内定中标单位中标。 (二)投标人之间串通 投标人之间建立攻守同盟串标,现有的常规调查手段很难取证、认定,况且,惩处力度不大使串通投标行为的违法违规成本远远小于其风险收益,所以,这也是最重要的串标方式。 1.价格串通。一些投标人之间相互勾结,私下串通,就投标价格达成一致协议,抬高或者压低投标报价,使竞争对手的正常报价失去竞争力,导致其他投标人不能中标。 2.轮流中标。该行为多发生在分段招标或者多次招标中。投标人之间互相约定,在投标中轮流以高价中标,捞取高额利润,从而使招标人无法从投标人中选出最优人选,造成巨大损失。 3.陪标补偿。几个投标人之间私下确定中标人,约定内定中标人以高价中标后,给予未中标的其他投标人以补偿,其实这部分补偿费也是从招标人支付的工程价款中去获取的。 4.挂靠垄断。通过挂靠其他企业,一家企业或个体包工头可以同时以好几家企业的名义去参加同一标的投标,形成实质上的投标垄断,无论哪家企业中标,实际都是一家企业。被挂靠企业从中收取管理费,而对工程质量、安全没有进行实质上的管理,一些不具备相关资质的企业或个人得以进入原本无法进入的经营领域,为质量安全问题埋下隐患。 5.招标代理单位暗中组织协调部分投标者进行串通投标。 (三)代理机构及监管人员与投标人串通 代理机构及监管人员利用工作便利,将掌握的招标人各种信息透露给投标人;利用工作之便帮助投标人撤换标书,更换报价或有关资料;与投标人串通,隐瞒投标人的虚假或不利信息,欺骗招标人;与招标人串通,帮助招标人内定中标人;就同一项目,既受招标人委托招标代理,同时又接受投标人委托投标咨询等等行为。 三、基建工程串标常用的审计方法 (一)雷同、错漏对比 不同投标人在投标书中出现大部分雷同之处、错漏一致、异常一致之处,如标书中多处大段的相似,多处在同一地方错别字相同,A公司标书出现了B公司的规定等等。如果上述出现多处,则基本能判断为“疑似串标”。 (二)价格分析 如果投标人的报价出现以下情况,应引起高度怀疑:总报价相近,但其中分项报价不合理,且无合理解释;总价相近,其中部分项目价格雷同,提不出计算依据;总价相近,部分单价完全相同,提不出合理单价组成的;总价相同,没有成本分析,分项乱调的。 (三)条件分析 甲方招标书中通常有各种限定,如甲级资质、三年盈利、近几年内承包过类似项目等。如果发现有不符合这些规定的投标人出现在最后的竞标过程中,则说明监管方有与投标人串标嫌疑。 (四)保证金和标书费用分析 通常串标都会由中标的那家单位为其他陪标单位出保证金和购买标书的费用。保证金既要关注缴纳情况,也要关注退还情况,因为如果招标单位和投标单位勾结的话,有时候会将中标单位为其他投标单位出资的保证金全部一次性打到中标单位。 (五)材料采购 如果投标书上大部分材料的品牌都相同或者来自相同的供应商,而且价格也相同或相近,则极有可能存在串标嫌疑。在审计实践中,这些串标审计方法通常是要打“组合拳”,需要运用上述手段进行综合评价、比较和分析,进而做出比较准确而客观的判断,而不能仅凭报价相近就武断地认定为串标,还需进行雷同、错漏等分析。 四、基建工程串标非结构化数据分析审计方法 上述建筑工程串标常用审计方法基本都是通过手工翻阅资料来完成的。在审计实践过程中往往每个投标人的标书就有好几本,所有投标人的标书加在一起非常多,通过手工翻阅查找上述问题非常困难,效率不高。因此,应该采用计算机对投标人电子光盘中的非结构化数据进行分析,通过比较和分析投标人的标书来判断招标过程中是否有串标行为。 (一)建筑工程非结构化数据特点 使用计算机进行审计的一个重要步骤就是数据的采集。根据确定的审计方案和采用的审计软件采集到的数据格式、文件大小等要素,对顺利进行计算机审计工作起着至关重要的作用。在审计过程中接触的数据基本上可以分为结构化数据、非结构化数据这两种数据。结构化数据一般指存储在数据库中,具有一定逻辑结构和物理结构的数据,最为常见的是存储在关系数据库中的数据;非结构化数据一般指结构化数据以外的数据,这些数据不方便用数据库二维逻辑表来表现,通常不存储在数据库中,而是以各种类型的文本形式存放。 随着各类信息的巨量增加,被审计单位的非结构化数据在快速增长,建筑工程非结构化数据的业务对象包括会议文件、规章制度、档案、报表、单据、工作报告、凭证、公文、发票、报表、技术规范书、标书、设计图、批复文件、结算文档、图纸策划等文件形式;建筑工程非结构化数据的格式丰富,包括Word、Excel、PPT、PDF、TXT、JPEG、压缩文件、Cad图纸等文件格式;建筑工程非结构化数据存储方式多样,有结构化数据库、FTP、纸质材料等多种存储方式。 非结构化数据贯穿于建筑工程业务中的各个环节,而招投标环节中主要的非结构化数据就是纸质招标文件和投标文件及电子光盘。其中投标文件包含投标函及投标函附录、法定代表人身份证、投标人资格审查、投标报价、施工组织设计、项目管理结构、其它资料等。光盘中电子数据格式主要是Word、PDF、Excel、JPC等格式。 (二)非结构化数据分析原理 串标非结构化数据分析主要通过文件属性分析、相似度分析、错漏一致分析、价格趋势分析实现。 1.文件属性分析。通过对比文件属性的作者、创作时间来判断标书是否由同一家公司制作,是否在同一台电脑上编写,光盘是否在同一台电脑上刻录。 2.相似度分析。其计算机后台运行原理是将投标人的标书分50到200字的小文本,将不同标书中的这些小文本逐一比较,标出每个文本块与其它文本的最大相似度。然后统计出相似度,再将相似的部分标识出来。 3.错漏一致分析。其原理是将标书文件与内嵌专业词库、专业词汇、错误核心库、重点词监控库、敏感库、建议库、排序库等词库进行比较,通过比较发现错漏一致的地方。 4.价格趋势分析。其原理是围绕报价总价格和各子项目价格,分析投标人是否将某一投标人的标书的报价作为模版,上下改动部分材料的单价来制作自己的标书。 (三)非结构化数据分析需注意的问题 1.将PDF文件转化为Word格式。投标人在串标过程中为了防止评标专家委员会通过电子文件比对发现串标问题,电子投标书采用PDF格式表示,甚至PDF文件中的重要部分采用图片形式。对于这种情况,可以从网上下载PDF转Word转换器,将PDF文件转换成Word格式。 2.通过Word软件对比功能找出不同投标文件中的相同部分。不同投标文件中相同的部分,一则是串标雷同的直接证据,二则可以通过相同的部分来查找共同的错别字。 3.巧用OA系统(审计管理系统)中的“公文错别字检测”功能查找投标文件中相同部分的错别字。相同部分中的错别字是串标错漏一致的直接证据。 4.将查找出的错别字与纸质投标文件核对。PDF格式文件转换成Word格式文件的过程中,会出现小量错别字,所以要对查处的错别字与纸质投标文件核对。 (四)非结构化数据分析过程 1.文件属性分析。首先,通过文件属性的“常规”项检查文件的“创建时间”。如果创建时间不是投标文件送达截止时间前创建,或者是开标后几天内创建的,说明具有串投标嫌疑。其次,通过属性的“详细信息项”检查“最后一次保存者”。如果“最后一次保存者”一致,且具体到类似xxx创建,则说明很有可能不同投标人的标书都是由同一个人编写。 2.相似度分析。首先,比较标书。打开Word2010的对比工具,在菜单栏“审阅”下面的“比较”工具栏中,选择“比较(C)”会弹出比较文档工具,将中标单位的投标书作为原文件,将其它单位的投标书作为修订的文件,在比较文档工具中打开,点“确定”开始比较两个投标文件。其次,处理比较结果。比较结果的文件中有紫、黑、蓝三种颜色,其中,紫色表示其他投标人的标书与中标人的表示不一致的地方;黑色表示其他投标人的标书与中标人的表示一致的地方;蓝色表示其他投标人的标书具有的内容在中标人的标书上没有。重点要关注黑色字体部分,因为黑色字体部分是两份标书一致的地方,也就是雷同的地方,很有可能就是串标的证据。将黑色的部分记录提取出来,放到一个新的Word文件中,如果多处有大段的黑色文字,则表明多处雷同。 3.错漏一致分析。登入OA系统,打开错别字检测系统。将投标文件对比中的黑色字体的部分拷贝到错别字检测系统中进行检测,该系统会对检测处理的错别字进行统计,并且给出修正提示。然后,将错别字、雷同部分与原始文件进行核对,判断是否由PDF转换引起的错误。 4.价格趋势分析。抽投标书里面某一子工程的报价表进行价格趋势分析。统计子工程的报价表的价格,对比不同投标人相同子工程的报价表的价格变化,如果发现有规律的呈现某种同增同减变化趋势,则有串标嫌疑。标签:标书论文; 投标人论文; 招标人论文; 非结构化数据论文; 工程招标论文; 大数据论文; 投标保证金论文; 审计方法论文; 招标方案论文; 工程审计论文; 工程信息论文;