信用数据的质量评价
□ 陈晓芸
最近,李克强总理在浙江考察时,对浙江省公共信用信息平台给予了高度的评价。信用数据是建设公共信用信息平台的基础,离开数据,信息平台便成无源之水、无本之木。信用数据质量好坏直接影响信用档案的质量状况,影响信用信息的共享互通,影响信用评价的准确性和客观性,最终影响信用应用的顺利开展。因此,加强信用数据质量管理,开展信用数据质量评价,将其作为数据管理的手段倒逼数据质量的提升,十分有必要。
之后的五月十五日[注]《钦定平定陕甘新疆回匪方略》卷107,同治四年六月壬寅条。、十七日至二十日,察哈尔蒙古兵跟随棍噶扎勒参镇压起事者,至五月二十一日晚,蒙古兵与守城官兵从东南两面夹击起事者,使起事者全数击退,“大获全胜”,[注]《钦定平定陕甘新疆回匪方略》卷107,同治四年六月壬寅条。五月二十二日凌晨,塔尔巴哈台城终获解围。察哈尔蒙古兵为解围塔尔巴哈台城起到了重作用。这将是守护塔尔巴哈台城的转折点。
公共信用信息归集的特点是只负责整合各数据源头部门的信用信息,不修改各部门提供的信息内容,确保信用数据真实有效并可追溯。开展信用数据质量评价的目标是对省级部门和市、县(市、区)信用数据报送质量进行评价,并把相应评价结果反馈给数源部门,从源头上提高数据质量。
在实际公共信用信息归集过程中,各信息来源部门提供的数据在完整性、有效性、及时性等方面存在质量参差不齐的问题。从完整性看,较常见的问题是缺失唯一识别码和关键字段。缺失唯一识别码即缺失统一社会信用代码或身份证号码,对信息清洗比对带来难度,容易造成主体的信息遗漏;缺少关键字段即缺少反映信息实质内容的必要字段,如不良信息、荣誉记录信息时间字段缺失或不完整等。从有效性看,常见的问题是归集的公共信用数据字段类型、字段长度等格式不符合国家或浙江已有的规范标准,无法通过入库的规范化校验。从时效性看,较常见的问题是数源部门未根据公共信用信息目录更新周期的要求及时更新信息,无法动态反映主体的真实信用状况。
据统计互联网时代线上订购旅游产品,65%的人表示不确定其真实性,24%表示旅游产品太多,眼花缭乱,11%表示不确定哪款软件比较好。由此可知如今互联网发展迅速,不可避免带来信任危机,出现生态旅游内容过度泛化和功能的淡化。通过对校园用户的调查发现,随着互联网的飞速发展,不少大学生们因为经济原因而不报旅游团,“互联网+旅游”的出现不只解决了大学生市场难以拓展的问题,更重要的是满足了大学生理智旅游的需求。因此我们注重开发有个性的,价格优惠的特色旅游路线,满足大学生旅游的体验、优质低价性等需求。
四是信息更新率。 用以评价部门或地方是否在规定周期内及时更新信息,可通过及时更新的信息项条数与该部门或地方报送信息项总条数的比率获取测评值。及时更新的信息项条数计算规则分为两种情况:一种为生成周期为年度、半年、季度、月度的这类定期信息,通过计算检查当日和最近一次更新日期的时间间距,与更新周期值进行比较,以确定该信息记录是否做到及时更新。若时间间距小于或等于周期值的视为该信息项已及时更新,若大于周期值的视为该信息项未及时更新。第二种情况为生成周期为不定期或实时的信息,默认己更新,若通过抽查或例证发现,该信息项没有做到及时更新的,则不计入更新条数。
一是主体唯一识别码覆盖率。 用以评价部门或地方所提供信息记录是否包含统一社会信用代码或自然人身份证号码,可通过有主体唯一识别码的记录条数与所提供信息的总记录条数比率获取测评值。
三是信息准确率。 用以评价部门或地方所提供信息记录的数据内容是否符合系统定义的数据类型、长度、格式、取值范围或逻辑关系等,可通过逻辑校验的记录条数与总记录条数比率获取测评值,单条信息记录所有数据项内容均通过逻辑校验的计为1条。
二是必填字段覆盖率。 用以评价部门或地方所提供信息的重要字段是否完整填报,可通过完整填报必填字段的记录条数和总记录条数比率获取测评值,单条信息记录的必填项均完整填报的计为1条。
针对上述问题,积极开展信用数据质量评价,让部门了解自身数据问题,切实加强质量管控,是提升社会信用建设水平的有效手段。从完整性、时效性、有效性等三个方面存在的症结着手,借鉴其它省市信用数据质量管理经验,基于可操作性原则,可设置如下五方面评价指标:
五是信息覆盖面。 用以评价部门或地方是否提供其产生的规定信息项的全部信用信息,可通过数据库比对进行验证。此项评价指标作为附加指标,不列入评价总分权重分配,作为抽查或例证的扣分项。
为了降低传感器节点的能量消耗,每个传感器节点在一个数据重构周期内仅需采集部分感知数据,并将其传输至汇聚节点.与文献[12]类似,汇聚节点可以通过广播或者预设的方式将采样率分发给网络中的所有传感器节点.每个传感器节点即可根据该采样率随机选择在当前采样周期内是否需要采集感知数据并将其传输至汇聚节点.在每个数据重构周期结束后,汇聚节点根据接收到的感知数据集构造观测矩阵Y和投影矩阵B,首先将接收到的xi,jΔt填充至观测矩阵Y的第i行第j列,然后将投影矩阵B中相同位置上的元素置1.最后,运行第3节中介绍的矩阵补全算法重构感知矩阵X,补全所有未传输的感知数据.
在实际工作中,遇到的数据问题更加错综复杂,信用数据质量评价需在实践当中不断动态调整与完善,在评价中不断发现问题与解决问题,并配套针对性的制度与管理办法,才能长效地提升信用数据的质量。
作者单位:浙江省信用中心
标签:信用数据论文; 质量评价论文; 信用信息平台论文; 数据质量管理论文; 质量状况论文; 信用档案论文; 信用评价论文; 数据管理论文; 浙江省信用中心论文;