公共部门数据增值利用的信息质量要求,本文主要内容关键词为:部门论文,质量论文,数据论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
公共部门数据的增值利用,可以促进技术创新和帮助解决问题,进而刺激经济增长和改善生活质量。然而,它的顺利进行要受到很多因素的影响,如知识产权、隐私、信息获取性和信息质量等问题。尤其信息质量问题的影响不容小觑,因为它是公共部门数据能被增值利用的前提性基础。英国《信息社会联盟小组关于信息质量的现状报告和建议》(Status Report and Recommendations of the EURIM Sub-group on the Quality of Information)就曾表述过信息增值利用与信息质量的关系:“公共机构收集和维护的信息应该明确与提供的服务相关和组织目标相一致,当信息被增值利用时,最初收集信息的环境需要被理解,包括相关性。例如,谁收集的信息,他们能检查信息的准确性吗?信息仍然有效和相关吗?”[1]另外,我国虽然缺乏有关公共部门数据质量的直接管辖法律制度,但《科学数据共享工程数据分发服务指南与规范》对信息分享过程中的数据提出了一些质量要求[2]。可见,公共部门数据增值利用必须以信息的质量保障为基础。因此,为了推进公共部门数据能够广泛被各类主体增值利用,必须要对公共部门数据提出相应的质量要求,而且应当制定或完善确保信息质量的信息策略,这也正是本文的主要内容。
1 公共部门数据增值利用的信息质量要求
公共部门数据的6项质量要求自然而然地成为一个层级结构,如图1(是在英国公共部门信息原则[3]的基础上进行改动得到的)所示。这个层级结构是非常重要的,因为每一层的要求都是以下层要求为基础的。例如,公共部门数据被增值利用是不可能的,除非它是有价值的、被管理的、符合用途的、标准化的、及时更新的、客观的。
图1 公共部门数据的质量要求层级结构
前两层要求是所有公共部门数据增值利用所依赖的基础。公共部门数据作为一项资产,在整个生命周期中是有价值的、可被管理的、可保护的和可使用的。人们需要根据规章制度并基于风险评估的一贯方法来管理公共部门数据。第三层的4项要求揭示了公共部门数据固有的价值。公共部门数据不需要过于完美,但是它的确需要在技术格式方面和遵从明确的质量特征方面符合用途。当公共部门数据以标准形式提供并且可链接到其他数据和权威来源时,它也变得更加有价值了。公共部门数据能够在网站上被客观地展示并及时更新,那么它的价值性会进一步增强。当公共部门数据满足了这些质量要求时,增值利用才能进行。增值利用避免了无谓的重复,提供了以新颖的、创新的方式提取价值的途径。
1.1 公共部门数据是一项价值资产
公共部门数据是一项资产——公共部门数据被高效率增值利用的基础。这项要求强调了组织理解它使用的信息和重视业务方面信息的重要性。它与其他组织资产(例如建筑、机器、人员和资金等)同等重要,它强调公共部门数据像其他组织资产一样被理解、记录、重视、保护和使用的必要性。公共部门数据作为一项资产的价值提供了所有其他质量要求依赖的基础。知道数据范围和数据用途及价值的评价是公共部门数据所有利用的先决条件,也是适当地保护和充分利用和使用数据的先决条件[3]。
1.2 公共部门数据是能被管理的
公共部门数据以与它们价值相称的方式被存储、管理、保护和使用。这要求在所有公共部门数据移动的整个生命周期内进行考量,例如从需求识别、创造、质量保证、维护、增值利用到最终的存档或一旦它停止商业使用的毁灭。一系列信息管理的最佳实践需要应用到公共部门数据的整个生命周期,例如确保适当的可利用性和完整性,避免暴露和损失,确保技术升级过程中的持续性。尤其重要的是个人数据应当被适当地保护。
现代的工作方式越来越是以知识为基础的,并且成熟的信息管理实践是支持这个所必要的。公共部门数据也需要被很好地管理,因为它可能需要被用于提供向意欲增值利用的主体和普通公众展示他们有责任的证据。就保护公共部门数据而言,不好的信息管理和治理实践使公共部门暴露在不必要的风险中。例如,公共部门是大量个人信息的保管人,公众有权期望保持这些信息的安全性。不好的信息管理实践也可能导致不一致性,进而可能招致成本或名誉损失。当考虑用新的技术来确保风险和机会、利益被适当地平衡时,信息管理是尤为重要的。就使用公共部门数据而言,不好的信息管理和治理实践可能导致过度风险规避方法阻碍了信息共享和增值利用。因此,需要制定适当的政策框架,允许信息为了合法的目的共享和增值利用,同时确保信息被保护,以便法律义务被满足,并且那些需要访问这些信息的人可以这样做[3]。
1.3 公共部门数据是符合用途的
确保公共部门数据满足它意欲达到的目的是非常重要的。这些目的包括它的初期目的和任何其他的第二目的。另外,在信息被广泛增值利用和发布的环境中,创作者不可能总是预见到所有潜在的下游使用。因此信息质量需要同那些希望增值利用它的人持续地交流,以便他们客观地评价信息的适用性。信息的实际质量也应当被规范地监督以确保它至少满足符合用途的水平。公共部门发布数据不仅要考虑机构自身的产出,更要从公众增值利用的需要出发传播符合用途的数据。如果公共部门传播的数据不具有增值开发的价值,那么其发布数据的行为就只能算作应付国家政策的要求。为了更好地贯彻国家信息资源开发利用政策,公共部门应当定期审视其传播数据是否符合用途,以反映不断变化的增值利用需求。
1.4 公共部门数据是标准化和可链接的
标准化与结构化信息(例如数据集)和非结构化信息(例如应用于文档的元数据标签)有关。通过标准化公共部门数据,一些价值会被揭示出来。标准化需要在多个层次来加以考虑,包括:格式的标准化(例如日期格式yyyy-mm-dd),内容的标准化(例如姓氏、地址等),概念的标准化(例如一个人的多重身份:病人、罪犯、原告等)。另外,当公共部门数据被提供以链接时,其价值也就被揭示出来了。
标准尤其是广泛接受的开放标准(Open Standards)的使用,通过以一致的、可比较的形式提供信息,使其他人理解和增值利用信息进而揭示了公共部门数据的价值。另外,文档的链接,就仿佛允许读者查到提供进一步信息的大量相关文档的参考文献和引文。当信息被链接到其他信息上时,公共部门数据的价值能够被提高。当公共部门数据是可链接的,用户能够使用和发现对他们需求非常有用的新信息[3]。
1.5 公共部门数据是及时更新的
公共部门数据能够被及时更新并发布出来,那么其价值就能凸显出来。因为公共部门数据常常涉及公众的普遍利益,而且基于部门业务发展速度的公共部门数据的实效性短暂,如果公共部门发布数据的速度过慢,那么其发布出来的数据就已经过时,也就失去了增值开发的潜力,进而可能会招致更大的经济损失乃至重大的社会问题。因此,公共部门数据必须及时更新,方能被增值利用。
这项质量要求的另一方面是考虑协调公共部门数据和它的支撑技术平台及数据格式的相称性。公共部门数据的支撑技术平台和数据格式应当跟得上技术的发展,要进行适时更新,这样,公共部门数据才能被顺利地增值利用。例如,如果在线统计分析需要公共部门数据,那么公共部门数据被锁定在专有的旧系统中,或者被离线存储在备份磁带上,或者仅以非结构化的PDF格式提供,都是不合适的。因此,公共部门数据支撑技术平台适时更新对于增值利用来说是非常重要的。
1.6 公共部门数据是客观的
公共部门数据如果不够客观,那么其价值也会丧失。公共部门数据多是经过加工处理的,其中难免会掺杂信息处理者的主观评价,对于意欲增值利用的那些人来说,其价值就不能彰显。首先,为了使信息能被视为客观的,信息必须以精确的、清晰的、完整的和公正的形式发布[4];公共部门数据必须连同数据所在的环境一起发布,以便增值利用者评价公共部门数据的客观性。其次,公共部门数据的实质内容必须是精确、可靠和公正的。公共部门必须主动地向公众提供完整、精确的数据出处、生产信息的方法以及外部同行评议的数据。
2 确保公共部门数据质量的信息策略
公共部门数据满足上述的质量要求,是其被增值利用的先决条件。因此,为了确保公共部门数据符合质量要求,笔者提出以下信息策略。
2.1 制定公共部门信息质量法及相关组织
公共部门数据的增值利用,涉及不同部门、不同行业、不同学科领域的资源,是一项政策性强、复杂程度高的工作,确保公共部门数据符合一定的质量要求是基础,因此需要国家层面的法律制度予以规范和保障。目前,利用法律制度的规范性功能来预防和约束信息质量问题,已成为当今世界各国的共识,例如美国《信息质量法》[5]。美国《信息质量法》主要是为处理联邦机构收集、使用和发布的信息质量问题而制定的。其主要内容包括:不得晚于制定指南发行日期的1年内,发布指南确保和最大化机构传播的信息的质量、客观性、效用和完整性;制定管理机制,允许受影响的人寻求和获得纠正不遵从指南的机构所维护和传播的信息;定期向主任报告机构收到关于传播信息精确性控诉的数量和性质,以及这些控诉是如何由机构处理的。形成鲜明对比的是,我国缺乏规范公共部门数据质量的国家级别法律,但是有两个行业规范,分别是科学技术部的《科学数据共享工程质量管理规范》和国家科技基础条件平台建设基础科学数据共享网项目组的《数据质量管理规范》。由于这两个规范存在适用范围限于特定领域、信息质量标准细则简略、监管机构空缺和法律效力不足等问题,所以,将其推广到规范和保障所有公共部门数据的信息质量是不现实的。
鉴于此,我国应当制定公共部门信息质量法规范意欲增值利用的公共部门数据的质量,第一,要求每个公共部门都要根据该法律制定适于自身的数据质量指南。第二,详细阐述公共部门数据的质量要求,比如公共部门数据是一项价值资产,是能被管理的、符合用途的、标准化和可链接的、及时更新的、客观的等。它是增值利用者评价公共部门数据质量进而决定是否增值利用的依据。第三,建立信息质量的管理组织,专门负责管理、评价和反馈公共部门信息的质量[6]。我国应当建立专门的信息质量管理组织,①配备具有信息质量专业知识和相关行业知识的工作人员,主要负责控制公共部门数据从发布、获取、处理等增值利用各个环节的质量问题。②同时制定质量责任制,明确公共部门和增值利用者等相关主体的相关职责,使其在各个环节中都主动关注信息质量问题,从而确保公共部门数据增值利用能够稳定进行。
2.2 建立信息质量控制准则
公共部门数据是一个巨大的信息宝库,因此为了各种目的被增值利用的频率越来越大。这些数据增值利用的例子包括各类大型分析,然而,在下游分析前评估数据集的适用性是重要的。这个选择过程本质上就是质量控制。在样本处理和数据获得的过程中执行质量控制,目的是立即删除不可接受的错误或假象。当获得数据被存在公共部门进行数据集中时,同样重要的是应当设置一组质量控制准则。此外,很多增值利用的公共部门数据处理方法的可靠性关键取决于公共部门信息的有效性。于是,为了选择和过滤可用的数据集,有适当匹配的、根据经验得出的参考标准(Reference Metrics)已经变得越来越重要。这似乎对计算用户和数据库管理者都是正确的,因为两者都有对发掘、理解数据集有既得的权利。这些标准甚至可以令人惊异的方式用来比较实验元数据注解。丢失的或不正确的注解对增值利用者来说构成了严重的问题,并且察觉可能的错误注解或分配注解的能力很可能对公共部门数据集来说是一个重要的管理功能[7]。信息质量控制准则中最重要的就是数据监管(Data Curation)原则,公共部门数据应当被保留服务于将来的使用和增值利用。可能有长期价值的数据应当被记载、注明出处和编制索引,以便其他人能够精确地找到和使用它们[8]。信息质量控制准则的设定,可以避免无法接受的错误、假象,纠正不正确的注解,使得可能用于增值利用的公共部门数据的质量符合利用者的信息需求。同时,信息质量控制准则,还可以提升公共部门、公众、增值利用者对公共部门数据的敏感性和评估信息质量的能力,进而对于公共部门数据的质量控制具有重要的参考作用。
2.3 设立公共部门数据共用寄存处
公共部门数据共用寄存处(Public Register)的主要使命是存储和维护各行各业所有公共部门的有价值的数据,目的是为了提供包括增值利用者在内的所有用户对其数据的集中访问和使用的通道,使用户能够及时地获取服务。我们应该设立一个全国性共用寄存处,其性质是非部门的公共机构。共用寄存处的活动由法规详细规定,其存取原则和使用条款(包括价格制度)由正式的法律或公共部门法令制定。设立共用寄存处的目的通常是为了改善公共部门内信息交换的质量和效率。大量的共用寄存处或数据集正在被转换成所谓的基本或真正的寄存处。这些来源会组成整个公共部门的“共享服务中枢”。公共部门将不得不使用来自这些寄存处的数据而不是自己维护数据。共用寄存处的运作会导致数据质量和可靠性的增加,并提高公共部门之间的效率。另外,它会为公众和企业等潜在的增值利用者减少行政负担。交通寄存处就是这样一个基本寄存处。根据提议的法案,它的一些数据将要被提供给普通公众在线洽谈。被授权访问数据的公共部门原则上是不收费的,但是其他增值利用者可能要收费。尽管提议的法案在成本问题上不是非常具体的,很可能公众或企业增值使用公共部门数据的成本模式费用不会在新的环境中改变[9]。由于公共部门数据的共用寄存处是由各个行业的基本寄存处组成,那么不可避免的是存有机构间的不兼容问题,但是应该看到它们在公共部门内的信息关系在改善公共部门内使用和数据增值利用上所起的重要作用。
2.4 建立信息质量反馈机制
系统反馈机制指根据过去自组织系统运行的情况调整未来行为的机制,是系统进行物质、能量和信息相互交换,改善系统行为和功能,排除干扰,实现协调有序、稳定优化的重要机制。任何一个开放系统要维持一定的稳定性,实现其自身的目标,都离不开反馈调节[10]。建立公共部门数据的信息质量反馈机制是实现公共部门数据增值利用稳定和持续进行的重要保证。信息质量反馈机制,可以要求增值利用信息质量管理组织定期对公共部门数据和增值产品的信息质量状况进行评估和监督,及时将信息质量状况反馈给提供数据的公共部门和利用数据的增值利用者,以有效地纠正增值利用过程中甚至是增值利用产品的质量问题,避免对增值利用者和公众造成不必要的经济损失。另外,增值利用者可以对公共部门数据的信息质量进行评论,并及时将相关问题反馈给公共部门或者信息质量管理组织,以纠正进行中或潜在的错误,净化增值利用的环境,强化有利于系统有序演化的发展机制,消除不利因素[11],从而使公共部门数据的增值利用逐步建立有序的自组织结构。
2.5 建立增值利用的质量认证机制
认证制度是证明某种产品达到某种质量标准的合格评证程序。我们可以设想建立质量认证机制推进公共部门数据的增值利用和增值产品的广泛普及。由专门质量管理机构(即增值利用信息质量管理组织)执行公共部门数据质量法中信息质量标准,对公共部门和增值利用者分别进行质量认证,在通过第三方的“资质认证”后,将在公共部门数据中心和增值利用者的产品网站上进行展示,以此分别获得更多增值利用者和公众的信任,使得公共部门数据增值利用的效率和效果更加显著。然而,这不是说没有质量认证的公共部门数据不能够进行增值开发,只要增值利用者对数据质量进行评价,基于此进行有选择性地增值利用。同样,没有质量认证的增值产品也可以利用,但是公众在使用时不能全部相信,只能把它作为参考。质量认证制度的制定和实施,对规范我国公共部门数据增值利用整个过程的质量,确保其预期目标的实现提供了保障。
3 结束语
明确公共部门数据增值利用的信息质量要求和实施相应的信息策略,不仅可避免增值利用过程中各参与方的信息不对称,还一定程度上促进了公共部门数据被广泛增值利用的可能性。因此可以说,确保信息质量是公共部门数据被增值利用的重要前提。
收稿日期:2013-04-17
标签:公共部门论文;