基于演化博弈论的政府开放数据质量控制机制研究论文

基于演化博弈论的政府开放数据质量控制机制研究

王 娟1,2李玉海3

(1.武汉大学信息管理学院,湖北 武汉 430072;2.武汉大学图书情报国家级实验教学示范中心,湖北 武汉 430072;3.华中师范大学信息管理学院,湖北 武汉 430072)

摘 要 :[目的/意义]政府开放数据质量是影响人们获取利用开放数据的重要因素,研究政府开放数据质量控制机制,对优化政府开放数据质量,促进公众更广泛地参与,实现政府开放数据宗旨具有重要意义。[方法/过程]本文运用演化博弈理论,构建了有限理性的政府开放数据提供者和使用者的复制动态模型,分析在不同的数据质量监管状态下博弈双方的进化稳定策略以及实现政府开放数据质量控制的均衡条件。[结果/结论]研究结果表明:高于一定阈值的监管激励能够有效控制政府开放数据质量,建立科学的数据质量评估标准和数据质量过滤机制,降低提供优质数据的额外成本以及完善数据发布机制有利于提高数据质量控制效率。

关键词 :政府开放数据;数据质量控制;进化稳定策略;演化博弈

政府数据开放(Open Government Data,OGD)是政府或政府控制的实体产生的,可以被任何人自由使用、重用和再分配的数据[1]。增加政府透明度和数据重复利用是开放政府数据的两个主要目的[2]:一方面政府开放数据可以提高政府机构的透明度,提升政府公信力,改善政府与公众之间的关系,并使公众能够直接获取数据并利用数据参与数据驱动型决策[3],将被动沟通模式转变为更为积极的公众参与[4];另一方面,开放政府数据供社会公众重复利用以增值和创新,从而有效盘活政府数据资源,创造巨大的社会公共价值,推动经济增长和社会发展,提升国家整体竞争力[5]

尽管开放政府数据旨在释放政府、公众的创新潜力,但其有效使用也面临着重大的挑战[6]。第四版开放数据晴雨表报告指出,政府开放数据通常是不完整的、过时的、质量低下且零散的。在政府机构中,政府数据开放的时间表、流程和责任往往不够明确。这使得整体开放数据管理和发布工作非常薄弱,而且容易产生多种错误[7]。学者Lourenco对美国、英国、加拿大等7国的政府开放门户网站进行评估,研究发现这些门户网站缺乏独立或外部数据质量控制机制[8]

数据质量是开放数据价值的关键[9],是影响政府数据开放实现增强政府透明度和数据重复利用两个目标的主要因素。开放数据的质量的不确定性对开放数据价值的实现造成巨大威胁。政府开放数据的使用者通常不是数据提供者,如果没有专业的数据科学的知识来甄别数据基础质量的能力,可能获取低质量的数据却无法意识到数据质量不足,从而影响根据低质量数据分析结果做出的任何后续决策[10]。此外,政府数据开放中的数据质量控制失败不仅会妨碍数据的再利用,还会给开发数据门户的访问和使用带来负面影响[11]

如表2所示,对问卷中所罗列的影响ESP课程的主要因素中,学生选择的主要影响因素包括需求分析(69.6%)、学生学习动机(53.7%)、学生学习能力(52.7%)、合适的教学材料和教学方法(48.4%),

(2)当时,为通项递减的正项级数.因为,所以当时,;当时,.由定理2可知,当时,级数收敛;当时,级数发散.

因此,在当下我国政府数据开放平台建设的关键节点,有必要对如何控制政府开放数据质量进行深入研究,探讨并实施可行的数据质量控制方案,从而促进政府开放数据的获取再利用,实现开放政府数据的宗旨,推进政府数据开放行动的顺利开展。

实际运行发现,高寒地区岩体内温度的影响,尤其在水位线变化附近的振弦仪器温漂现象明显。孔内水位较高的振弦仪器零漂现象严重。振弦仪器在安装过程中,施工者对仪器温度初始值的测量往往测取某时刻大气温度作为仪器温度初始值,不能真实的反应仪器所在区域初始。温度影响钢弦的受力从而影响测量精度。仪器P28在2015年6月4日测值和P29、P30在2015年11月1日测值出现温漂、零漂异常;P31在2015年9月10日测值出现温漂异常;P32、P33未发生异常现象。

从2009年至今,每年的“双十一”都是各大电商集中进行推广的大日子。天猫的成交额从2009年的0.52亿元到飙升至今年的2135亿元,同比2017年1682亿元增长26.93%。与此同时,今年“双十一”也刷新了多项纪录,物流订单于23点18分09秒突破10亿,宣告十亿包裹时代的到来!

本文从演化博弈角度出发,将政府开放数据提供者和使用者作为博弈双方,分析双方在政府数据开放与获取过程中的进化稳定策略,找出政府开放数据质量控制的均衡条件,进而探讨政府开放数据质量控制机制,以期从开放数据供给的源头上进行质量控制,从而提高数据质量以及政府开放数据的利用率。

1 博弈模型选择与构建

政府开放数据的供给与获取是个动态变化和重复的过程。由于数据质量通常是一个多维和相对主观的概念[12],数据质量的优劣也较难判断,并且大多政府开放数据普通用户和一般政府工作人员往往不具备专业系统的数据科学的知识,因此,政府开放数据参与者的理性通常是有限的,他们必须在博弈过程中学习,经过反复试错以寻找较好的策略,通常不是一开始就能找到最优策略。

有限理性博弈分析的关键是确定博弈方学习和策略调整的模式[13]。由于政府开放数据参与者普遍存在理性的局限性,在反复博弈过程中具有大群体随机配对的特征,适宜采用演化博弈中的“复制动态”模型来进行分析。

1.1 博弈方与策略选择

政府数据开放构成一个生态系统,开放政府数据(OGD)可被视为政府和公众之间的跨界信息共享,包括企业、非营利组织和个人[14]。因此,政府开放数据环境下最基本的参与者包括政府开放数据提供者和开放数据使用者。政府开放数据提供者包括各级政府部门、非盈利组织、承接政府外包业务的服务商等;开放数据使用者则是通过政府开放数据门户、平台获取并利用开放数据的任何用户,包括企业、非营利组织、科研团队和个人。

实验发现,利用金属电极(如铁、铜、锡)在电解的作用下,能够分别生成二价铁离子、二价铜离子、二价锡离子,然后进一步与溶液中的过硫酸铵发生氧化还原反应生成SO-4·自由基:

依据政府开放数据实践的实际情况,参与者还包括政府开放数据管理者,对数据的供给和利用起到一定审核、管理作用的组织和机构,通常是专门的政府开放数据管理部门或配备具有专业数据统计技能的专家的第三方部门机构[15]

本文依据政府开放数据质量的好坏将其分为优质数据和劣质数据两类,其中优质数据主要指具有规范性、完整性、一致性、准确性、及时性、可解释性和可信度高的高价值密度的开放数据,而劣质信息与之相反,主要指无序重复、缺漏、不一致、模糊、滞后的低价值密度的开放数据。在政府开放数据生态环境下,数据提供者根据自身拥有的数据资源状况选择提供优质数据或劣质数据,而数据使用者在无法判断数据质量优劣的情况下选择是否获取数据。

根据进化稳定策略的性质,一个稳定状态必须对微小偏离干扰具有稳健性才能称为进化稳定策略,以下分别对博弈方群体G 与博弈方群体U 分别进行进化稳定策略分析。分析公式(1-1)可知,由于x ∈[0,1],且e >0,所以可得x =0或x =1是稳定状态。分别对政府开放数据提供者这两种稳定状态具体分析如下:

1.2 研究假设

为了便于构建政府开放数据参与者针对数据开放与获取的演化博弈模型,结合政府数据开放实践的实际情况,本文做出如下假设。

当x =1时,即开始时G 群体中所有博弈方都提供g 类数据,那么采取提供b 类数据的策略的博弈方就不会出现。因为对有限理性的博弈方来说,一定要有模仿的对象才能进行模仿,而不会主动有意识地改变策略[13]

假设2:博弈群体G 若提供b 类数据,其成本C 1(C 1>0)是提供开放数据所需的基本成本,提供的数据价值为V 2;若提供g 类数据,其成本为C 1+e (e >C 1,为额外付出的成本),提供的开放数据的价值为V 1(V 1>V 2且V 1≥C 1+e )。如前文所述,政府开放数据提供者和使用者在政府数据开放与获取的过程中均需付出一定的成本,在此处抽象为使用者U 通过支付积分给G 来获取开放数据,G 期望以较低的成本获得最多的积分。

变换器总体设计方案如图1所示,用于5节锂电池储电和输电,以单片机为主控芯片,输出两路PWM控制信号,驱动MOSFET半桥电路实现升、降压的功能,按键调整工作模式和工作电流值,Buck/Boost双向DC-DC电路用于功率双向传输,直流母线上的采样电阻和分压电阻用来对电流与电压信号实时采样,液晶显示器可以实时显示系统参数,辅助电源为变换器各部分芯片提供稳定电源。

假设3:开放数据使用者(U )要获取所需的开放数据,需先在相应的政府数据开放平台进行信息搜寻,其成本为C 2。对于检索到的数据集,若获取数据,则视为支付F 2(C 1+e ≤F 2≤V 1)的积分给G ,否则支付为0。用户期望通过支付积分获取优质数据,从而获得数据的价值V 1(C 1+F 2≤V 1)。

假设4:开放数据管理者(M ):其职责主要是对G 提供的数据进行质量审核,依据判断结果来选择是否予以G 一定的积分。但由于开放数据的所属的领域千差万别,且除数据的表达形式即数据规范外,数据的内容优劣和实际效用都很难在使用之前正确判断,因此M 在对数据进行审核时,会出现一定概率的判断失误。因此,假定G 提供优质数据,则M 通过检查能完全识别,并给予激励积分F 1(F 1>0);若G 提供劣质数据,则M 以p (0≤p ≤1)的概率将其误判为优质数据,并给予激励积分F 1;否则,M 判断为劣质数据,其积分为0。

1.3 基本模型

根据上述研究假设,可得博弈双方的得益矩阵如表1所示,G 和U 分别代表数据提供者群体和数据使用者群体,他们是有限理性博弈方。

月分配的原则是降水量采用代表站各月降水量,山前侧向补给量按天数平均分配,河道排泄量按代表站各月基流量占基流总量的百分比进行分配,潜水蒸发量按代表站各月蒸发量占总蒸发量百分比进行分配,开采量依照不同用水种类按水文调查还原计算的分配方法进行分配。

表1 政府开放数据提供者 G 和数据使用者 U 的得益矩阵

根据表1得益矩阵,可知博弈方G 中提供g 类数据和b 类数据的两种博弈方成员的期望得益G g 、G b 和群体的平均得益分别为:

G g =y ×[F 1+F 2-(C 1+e )]+(1-y )×[F 1-(C 1+e )]=F 1+y ×F 2-(C 1+e )

G b =y ×[(p ×F 1)+F 2-C 1]+(1-y )×(p ×F 1-C 1)=p ×F 1+y ×F 2-C 1

同理,可得博弈方U 群体中选择“获取”、“不获取”两种博弈方成员的期望得益U a 、U r 和群体的平均得益分别为:

U a =x ×(V 1-F 2-C 2)+(1-x )×(V 2-F 2-C 2)=V 2-F 2-C 2+(V 1-V 2)x

U r =x ×(-C 2)+(1-x )×(-C 2)=-C 2

从表2中可以看出,对于4个局部均衡点,Det(J )和Tr(J )值分别受[F 1(1-p )-e ]、(V 2-F 2)和(V 1-F 2)的影响,由于假设中V 1≥F 2,因此(V 1-F 2)始终大于0。[F 1(1-p )-e ]取值可分为大于、等于和小于0三种情形,(V 2-F 2)取值可大于和小于0(暂不考虑等于0),因此组合可分为6种情况,下一章将对每一种情况进行讨论。

对博弈方群体G 进行复制动态公式分析,由此可得政府数据开放者的复制动态方程为:

同样对博弈方群体U 进行复制动态公式分析,可得博弈方U 的复制动态方程为:

根据D Friedman[16-17]提出的方法来研究均衡点的稳定性,可计算除该系统的雅克比矩阵J :

其中,∂(dx /dt )/∂x =(1-2x )(F 1-pF 1-e )

∂(dx /dt )/∂y =0

∂(dy /dt )/∂x =y (1-y )(V 1-V 2)

∂(dy /dt )/∂y =(1-2y )[(V 1-V 2)x -(F 2-V 2)]

由此可得,系统的4个局部均衡点的Det(J )和Tr(J )值见表2。

表2 局部均衡点的Det (J )和Tr (J )值

二氧化硫作为果酒生产的必备原料,在生产过程中起到了抑菌、抗氧化和护色的作用[29]。酒中的二氧化硫主要以两种形式存在。一种是游离二氧化硫,以亚硫酸和溶解二氧化硫状态存在,具有抗氧化能力;另一种是结合二氧化硫。两种状态间存在一个动态平衡[30]。

2 政府开放数据的博弈模型分析

针对上述政府开放数据的三大参与者,本文分别对管理者存在与否两种情况进化博弈分析,剖析政府开放数据提供者G和开放数据使用者U的进化稳定策略和实现政府开放数据质量控制的均衡条件。

2.1 无监管状态下的政府开放数据质量控制分析

在无监管状态下,即不存在开放数据管理者,因此第三方管理者给予的激励F1=0,即[F1(1-p)1-e]=-e<0。由公式(1)、(2)可推导出无监管状态下博弈双方的复制动态方程分别为:

现状排涝河道杂草丛生,淤积严重,过流断面不足,排涝能力降低。区域内无外排泵站,当入海水道行洪时,涝水只能靠上下游外排泵站抽排入大运河,加之泵站规模小,区域内涝灾不断。

同公式(2))

在情形1中,当(V2-F2)<0时,即劣质数据的价值小于开放数据用户获取数据的所支付的积分时,该系统均衡点的局部稳定性分析如表3所示。

表3 情形 (1 )的局部稳定分析

图1 情形 (1 )系统动态演化相位图

在此情形下,博弈模型中的(0,0)构成演化系统中唯一的ESS稳定均衡点,即{提供劣质数据,不获取}。这表明在无监督状态下,且劣质数据的价值远小于开放数据用户获取数据的所支付的成本时,最终的稳定策略是G 提供劣质数据,U 采取“不获取”策略。

在有限理性博弈的分析框架中,其核心不是单个博弈方的最优策略选择,而是有限理性博弈方组成的群体成员的策略调整过程、趋势和采用稳定性。此处稳定性指群体成员采用特定策略的比例不变,而非某个博弈方的策略不变[13]。因此采用生物进化的“复制动态”机制来模拟该博弈策略调整模式。

假设1:博弈中存在两类博弈群体,分别是政府开放数据提供者(G )和开放数据使用者(U )。博弈方群体G (以下简称G )的策略集合为{g =优质数据,b =劣质数据};其中提供g 类数据的比例为x (0≤x ≤1),则提供b 类数据的比例为1-x 。同时,博弈方群体U (以下简称U )在不明确其数据质量优劣的情况下,可选的策略集合为{a =获取,r =不获取};其中获取数据的比例为y (0≤y ≤1),则采取“不获取”的策略的比例为1-y 。

当出现干扰因素使0<x <1时,即个别博弈方由于偶然因素改变策略,提供b 类数据时。根据公式(1-1)可知,由于e >0,故这些博弈方会发现此时他们的期望得益大于平均得益,那么提供b 类数据的的博弈方会逐渐增多,最终使x =0。即干扰使少量博弈方偏离x =1的稳定状态时,复制动态会使结果越来越远,反而收敛于0,因此x =1不是进化稳定策略。

当复制动态过程达到x =0时,有限理性的博弈方G 找到本博弈的纳什均衡,且该稳定状态对少量扰动具有稳健性;因此x =0是唯一的进化稳定策略,即在博弈方G 群体中,所有成员均提供b 类数据。

对于博弈方U 来说,分析公式(2)可知,令即当时,y 总是处于稳定状态,即群体U 所有的博弈方都不会改变策略。又由于(V 2-F 2)<0,V 2<V 1,所以由上述分析可知,博弈方G 在该情形下的进化稳定策略是提供b 类数据(x =0),所以在复制动态机制演化下,最终此时令可得y =0和y =1为稳定状态。

政府开放数据提供者为保障开放数据质量,需要投入大量的技术成本、人力成本和资金成本等;开放数据使用者需对政府所发布的开放数据予以积极关注、跟踪参与、浏览检索下载等,甚至在某些情况下需要按规定取得许可才能访问获取,所以获取政府数据需支付资金、时间、技术等成本。从经济理性角度来讲,政府希望以较少的成本提供开放数据让更多的公众关注、获取、利用开放数据从而促进数据重复利用、释放数据潜能;而用户期望通过支付成本获取优质数据,并能通过数据开发利用实现数据价值,否则可能拒绝获取政府开放数据。可见,政府开放数据提供者与使用者间就数据质量问题存在着博弈。因此,针对政府开放数据质量控制研究引入博弈论的研究方法具有可行性与必要性。

以上资料是根据各地均衡试验场地中入渗仪观测数据求得的,在有地形起伏、洼地和沟渠入渗的情况下,表中的数据可能偏小。

当0<y <1时,即如果初始时刻开始时有部分博弈方采取“获取”策略,根据公式(2),由于即采取该策略的期望得益小于平均得益,因此采取该策略的博弈方会逐渐减少,最终回到U 所有博弈方均采取“不获取”策略状态。因此y =0为唯一的进化稳定策略。

上述分析证明,在用户获取政府开放数据成本高于低质量数据的价值条件下,如果没有管理者对政府开放数据质量进行监督控制,最终会导致整个政府开放数据处于劣质状态,而数据使用者无法使用、逐步退出,形成恶性循环,进而破坏政府开放数据生态。

在情形2中,当(V 2-F 2)>0时,即劣质数据的价值小于开放数据用户获取数据的所支付的积分时,该系统均衡点的局部稳定性分析如表4所示。

表4 情形 (2 )的局部稳定分析

图2 情形 (2 )系统动态演化相位图

这表明在无监督状态下,且劣质数据的价值大于开放数据用户获取数据的所支付的成本时,博弈模型中的(0,1)构成演化系统中唯一的ESS稳定均衡点,即{提供劣质数据,不获取}。

与情形(1)述分析类似,该演化博弈的进化稳定状态是博弈方G 在e >0,(V 2-F 2)>0的条件下始终提供b 类数据(x =0),且始终成立。令可得y =0和y =1为稳定状态。

当0<y <1时,即初始时刻有博弈方采取“获取”策略,根据公式(2),由于即采取该策略的期望得益大于平均得益,因此采取该策略的博弈方会逐渐增多,经过复制动态演化,最终会实现y =1,即U 所有成员均采用“获取”策略。因此y =1是唯一的进化稳定策略。

这说明即便“劣质”数据质量存在某些方面的缺陷,例如格式一致性、或规范性等方面欠缺,若“劣质”数据的价值大于政府开放数据用户获取所需支付的成本,依然具有一定的价值,用户仍倾向获取该类开放数据。

2.2 监管状态下的政府开放数据质量控制分析

在监管状态下,政府开放数据管理者M 对G 提供的数据进行审核。若审核为优质数据,M 给予G 激励积分F 1即(F 1>0),否则积分为0。分析公式(1)可知,由于x ∈[0,1],当时,始终成立,此时x 的所有状态都是稳定状态。

在情形3中,当[F 1(1-p )1-e ]>0且(V 2-F 2)<0时,该系统均衡点的局部稳定性分析如表5所示。

表5 情形 (3 )的局部稳定分析

图3 情形 (3 )系统动态演化相位图

在此情形下,该演化系统中唯一的ESS稳定均衡点是(1,1),即{提供优质质数据,获取}。

对G 进行复制动态分析,当时,令可得x =0和x =1是稳定状态。根据公式(1),当0<x <1时,由于因此即初始状态时群体G 有部分博弈方提供g 类数据,该策略的期望得益被发现大于平均得益,因此采取该策略的博弈方会逐渐增多。经过复制动态的学习过程,最终所有博弈方都会提供g 类数据,达到x =1的稳定状态,因此x =1为唯一的进化稳定策略。

然而,政府数据有别一般的网络数据,某种情况下存在一定的特殊性和敏感性,因此这种数据质量监控机制也需要考虑制定一系列保密协议等事项,以确保政府数据开放共享在充分的数据安全内推进。

在情形4中,当[F 1(1-p )1-e ]>0且(V 2-F 2)>0时,该系统均衡点的局部稳定性分析如表6所示。

表6 情形 (4 )的局部稳定分析

图4 情形 (4 )系统动态演化相位图

由图4可知,情形(4)中的博弈双方的唯一ESS 稳定均衡点也是(1,1),即{提供优质数据,获取},但与情形(3)的演化路径有所区别。具体而言,根据公式(1)博弈方的G的演化博弈策略分析结果同情形(3),经过多次演化,最终所有博弈方G达到x=1的稳定状态。

而当(V2-F2)>0时,可知恒成立;在此条件下,博弈方U复制动态分析结果类似情形(2),将总是倾向采取“获取”策略,因此y=1是唯一的进化稳定策略。

说明,在有政府开放数据质量控制的情况下,如果劣质数据的价值大于用户的支付,博弈方G总是愿意提供优质数据,而博弈方U始终采取获取数据策略。

在情形5中,当[F1(1-p)1-e]<0即且(V2-F2)<0时,该系统均衡点的局部稳定性分析如表7所示。

表7 情形 (5 )的局部稳定分析

由表7和图5可知,该条件下进化稳定策略(0,0)以及博弈演化路径与情形(1)是完全一样的。这表明在监督状态下,监管者给予数据提供者的激励小于一定阈值时且劣质数据的

图5 情形 (5 )系统动态演化相位图

价值小于开放数据用户获取数据的所支付的积分F 2时,最终的稳定策略是博弈方G 群体提供劣质数据,博弈方U 群体采取“不获取”策略。

在情形6中,当[F 1(1-p )1-e ]<0即且(V 2-F 2)>0时,该系统均衡点的局部稳定性分析如表8所示。

表8 情形 (6 )的局部稳定分析

图6 情形 (6 )系统动态演化相位图

同样,由表8和图6可知,该条件下进化稳定策略(0,1)以及博弈演化路径与情形(2)是完全一样的。这表明在监督状态下,监管者给予数据提供者的激励小于一定阈值且劣质数据的价值大于开放数据用户获取数据的所支付的成本时,博弈双方最终的稳定策略是G 提供劣质数据,U 采取“获取”策略。博弈方双方的博弈策略调整和最终稳定策略会与无监管状态时一致,无法发挥政府开放数据质量控制的作用。

3 研究结论与启示

通过上述6种情况(见表9)对博弈双方政府开放数据提供者群体和政府开放数据使用者群体进行复制动态分析,可得出相关的结论与启示。

从图1可以看出,虽然职业技术教育学属文科性质的学科,但大部分学生认为本专业应当培养的是复合型人才,而不是单一的理论型人才。还有较少一部分学生认为是以培养学术型人才为目标的,在访谈中得知,这些学生均有考博深造的想法和意愿,他们更重视对专业理论的学习。因此,从多数学生来看,职业技术教育学专业的人才培养目标应该更注重培养学生的综合能力,课程目标应该考虑以培养复合型人才为主。

表9 6种情形的假设条件与博弈均衡结果汇总

通过上述6种情况对博弈双方政府开放数据提供者群体和政府开放数据使用者群体进行复制动态分析,可得出相关的结论与启示。

3.1 研究结论

首先,启用第三方数据质量监控机制有助于实现政府开放数据质量控制。对比所有情形,唯有情形(3)与情形(4)的进化稳定策略为{优质数据、获取},达到政府开放数据生态环境下的理想状态。即当政府开放数据质量处于监管状态下且激励时,才会导致博弈双方的进化稳定策略为分别是政府数据开放提供者提供优质数据,而政府开放数据使用者采取“获取”策略。

式中:和分别表示换流站l有功可调节范围的上下限。通过式(16)和式(18)可实现对故障后支路j潮流的修正,其实质是通过对换流站有功设定值的调节,影响线路潮流分布,使非故障线路潮流通过故障后调节,不超过短时允许载流量。

其次,对比情形(3)与情形(5),可以发现在监管状态下,监管者提供的激励只有达到一定阈值即才能达到数据质量控制目的这一条件,反映了管理者M 提供的激励w 1、误判率p 和博弈方G 为提供优质数据额外支付的成本e 之间的关系。它说明:①在博弈方G 为提供优质数据所额外付出成本e 为定值的情况下,博弈方F 是否提供优质数据主要取决于与监管者M 相关的两个变量:误判率p 和激励F 1。当M 将劣质数据误判为优质数据的概率较大即p 值较大时,需要支付更多才能激励G 提供优质数据。②博弈方G 是否提供优质数据与提供优质数据所付出的额外成本e 的大小有关。只有当e ≤F 1×(1-p )时,G 才愿意提供优质数据。

这表明,在进行政府开放数据质量管理监控时,需要建立较为完善的数据评估标准,强化数据质量判断过滤机制,降低数据质量的误判率p ,真正将优劣数据甄别开来,则可减少相应的监控管理激励支付,进而提高数据质量控制效率。另外,减少政府部门提供优质数据的额外成本也是促进政府开放数据提供者尽可能提供优质数据的有效途径之一。

最后,综合情形(1)~(6),可以发现在情形(2)与情形(4)、情形(6)中,即用户支付小于劣质数据的价值的条件下即(V 2>F 2),可以发现所有的博弈方U 最终都会采取“获取”的稳定性策略。这启示我们两点:①降低用户获取政府开放数据的成本有利于促进公众获取利用政府开放数据;②尽管“劣质”数据质量存在某些方面的缺陷,但在一定程度上仍具有价值,只要大于用户获取的支付,则应及早发布出来,可以“先发布出来,再改善”[18]

3.2 研究启示

根据上述研究结论,结合对博弈模型的分析,本文提出如下建议:

3.2.1 启用第三方数据质量监控机制

根据本文对政府开放数据参与者的演化博弈分析,外部独立的第三方数据质量监管机构对政府开放数据提供者予以一定的激励,能够有效地促使其发布优质数据,实现数据质量控制。第三方数据质量监管责任可以由具备专业数据科学知识、技术以及政府开放数据领域专家等组成的团队或组织机构承担。

对U 进行演化博弈的复制动态分析结果类似情形(1)、(2),令由于x =1是博弈方G 唯一的进化稳定策略,在复制动态机制演化下,最终所以在此条件下,博弈方U 将采取“获取”策略。该演化博弈的最终将达到G 提供g 类数据、U 选择“获取”这样一个理想的稳定均衡状态,实现双赢。

在她还是一个19岁的艺术院系学生时,她在巴黎待了一年,着迷于电影艺术的种种可能性。她熟悉新浪潮派,看克劳德·夏布洛尔(Claude Chabrol)和让-吕克·戈达尔(Jean-Luc Godard)的电影,玩味着做电影的想法。但在电影制作中,具体工作与创作者的责任往往是割裂的,这与她完美主义的个性存在矛盾。桑迪·斯各格兰德需要对每一个步骤、每一个细节实现绝对的控制。她在美国完成学业,搬到纽约,拾起极简抽象主义绘画。

3.2.2 建立科学的数据评估标准和数据质量过滤机制

根据研究结果,建立科学的数据评估标准和数据质量过滤机制有助于提高政府数据质量的控制效率。数据质量评估标准在过去被学者和相关从业者研究的比较充分[19]。政府开放数据的评估标准可以结合实践,调查分析用户和管理者的数据质量需求,合理的借鉴已有的研究成果,从而制定科学的数据评估标准。

数据质量监管机构则可以利用其专业知识设置多维度审查机制,并内化在数据质量检查程序中,以降低数据质量误判率。此外,针对数据质量核查采取二级或多级复核制,也能从流程层面提高判断准确率,从而达到政府开放数据质量控制的目的。

3.2.3 降低提供优质政府开放数据的额外成本

本文中的博弈模型分析证明了降低政府开放数据提供者发布优质数据所需支付额外成本,有助于控制政府开放数据质量。具体可从以下两方面展开:

1)制定并实施统一的元数据规范,不仅有利于从标准层面提升数据质量,提高数据标准化程度、关联度和一致性,有利于大规模处理和分析数据,更能从政府开放数据供需层面提高生产和消费的效率[20],从而减少政府开放数据提供者为发布优质数据所额外付出的成本。

2)通过统筹划分政府开放数据类别,制定标准化数据生命周期管理流程,从而系统地规范与控制数据产生—收集—组织整理—存储—发布整个周期,将数据质量管理流程贯穿所有环节。

3)将数据自动发布流程嵌入IT系统中,确保实现数据集的最新版本和最完整版本始终直接从源代码获得,能够减少对手动上传发布数据的依赖[7],也有助于降低为提供优质数据而产生的额外成本。

3.2.4 完善数据发布机制

尽管部分“劣质”数据质量存在某些方面的缺陷,但在某种情况下具有一定的价值潜力,一些具备相当数据处理技术的用户对及时获取原始数据具有强烈渴求,他们擅长从不完善的数据中获取价值。但是在政府数据开放实践过程中,常常由于官方谨慎的态度阻碍数据开放的执行,从而迟缓发布数据。

本文认为开放政府数据应兼顾质量与效率,可以借鉴Stephan Shakespeare提出的“数据双轨发布”[18]的办法,能兼顾政府数据开放“快速及时发布”和“以高质量为核心”的双重目标,是一种既实用又实际的双效方式[21]

此外,应将传统的自上而下的政府开放数据发布机制与“自下而上”的市场需求拉动数据发布的机制结合起来[22],依靠自上而下的数据发布方式将优先级别高,影响范围广的数据高质量的发布出来,以推动经济增长;同时针对用户的请求进行合理性、可行性评估分析后,发布相应的数据集,以充分释放政府开放数据能量。

3.2.5 设置政府开放数据事中控制机制与事后控制机制

上述演化博弈,分析了监管状态下政府开放数据可实现质量控制的条件。从控制获取的方式和时点上讲,这种监控机制属于事前控制。这种进化博弈分析思路可以衍生到事中控制和事后控制机制。事中控制方式例如充分纳入用户参与机制[23],在政府数据开放平台设置互动交流版块,供用户点评、分享、评论数据以及对数据质量进行评价打分等方式,这样的即时反馈可以促使政府开放数据发布优质数据,推动政府数据开放、获取利用发展步入良性循环。

在宏观管理层面,中央政府专门大数据管理部门或者机构,设置一定的激励机制,对地方政府开放政府数据实践的优秀案例给予相应奖励,从而促进全国各地积极推动政府开放数据工作,优化开放数据质量,推动政府开放数据事业的蓬勃发展。

4 结束语

政府开放数据受到全世界各国的高度重视,已成为不可逆转的趋势[2]。在政府开放数据生态环境下,开放数据质量是影响用户获取与利用数据的关键因素。实施政府开放数据质量控制,有利于促进政府开放数据提供者发布优质数据以及使用者积极获取利用开放数据创造公共价值,形成良性循环,从而优化开放数据生态系统的健康发展,构建可持续的政府数据开发生态系统。

本文从博弈的视角,针对政府开放数据的提供者群体和使用者群体就政府开放数据供给与获取进行了演化博弈分析,剖析了实现数据质量控制的条件,得出相关结论与启示,对优化政府开放数据质量,促进公众更广泛地参与具有一定的指导意义。本文的博弈在一定的假设环境下进行,并假设以积分形式奖励提供优质数据,未考虑其所需耗费的成本因素,存在一定的局限性,有待后续进一步完善研究。

参考文献

[1]Open Government Data[EB/OL].https://opengovernmentdata.org/,2018-04-08.

[2]Attard J,Orlandi F,Scerri S,et al.A Systematic Review of Open Government Data Initiatives[J].Government Information Quarterly,2015,32(4):399-418.

[3]Torchiano M,Vetro A,Iuliano F.Preserving the Benefits of Open Government Data by Measuring and Improving Their Quality:An Empirical Study[C]//IEEE Computer Software and Applications Conference,2017.

[4]OECD.Annex B.Reaping the Benefits of Cloud Computing,Web 2.0 and Open Data:OECD Country Experiences[J].Sourceoecd Science & Information Technology,2010:172-185.

[5]郑磊.开放政府数据的价值创造机理:生态系统的视角[J].电子政务,2015,(7):2-7.

[6]Sadiq S,Indulska M.Open Data:Quality Over Quantity[J].International Journal of Information Management,2017,37(3):150-154.

[7]Global Report | Open Data Barometer[EB/OL].https://opendatabarometer.org/4thedition/report/,2018-04-09.

[8]Rui P L.An Analysis of Open Government Portals:A Perspective of Transparency for Accountability[J].Government Information Quarterly,2015,32(3):323-332.

[9]Murillo M J.Evaluating the Role of Online Data Availability:The Case of Economic and Institutional Transparency in Sixteen Latin American Nations[J].International Political Science Review,2015,36(1):42-59.

[10]Yeganeh N K,Sharaf M A.A Framework for Data Quality Aware Query Systems[M].Springer Berlin Heidelberg,2011:478-489.

[11]Detlor B,Hupfer M E,Ruhi U,et al.Information Quality and Community Municipal Portal Use[J].Government Information Quarterly,2013,30(1):23-32.

[12]O Hara K.Enhancing the Quality of Open Data[M].Springer International Publishing,2014:201-215.

[13]谢识予.经济博弈论[M].第3版.上海:复旦大学出版社,2007:210-211.

[14]Yang T M,Jin L,Jing S.To Open or Not to Open?Determinants of Open Government Data[J].Journal of Information Science,2015,41.

[15]徐双敏,崔丹丹.完善社会组织第三方评估工作机制研究——基于5市调查数据的分析[J].中南财经政法大学学报,2016,(6):52-57.

[16]黄如花,李白杨,周力虹.2005~2015年国内外政府数据开放共享研究述评[J].情报学报,2016,35(12):1323-1334.

[17]Friedman D.On Economic Applications of Evolutionary Game Theory[J].Journal of Evolutionary Economics,1998,8(1):15-43.

[18]Shakespeare Review of Public Sector Information[EB/OL].https://www.gov.uk/government/publications/shakespeare-review-of-public-sector-information,2018-04-04.

[19]Sadiq S.Handbook of Data Quality[M].Springer Berlin Heidelberg,2013.

[20]The State of the Union of Open Data[EB/OL].https://static1.squarespace.com/static/56534df0e4b0c2babdb6644d/t/5832fba103596e27e24fb969/1479736237872/the-state-of-the-union-of-open-data.pdf,2018-04-08.

[21]贾一苇,刘鹭鸶.英国完善数据开放提升政府服务质量经验借鉴[J].电子政务,2015,(12):105-116.

[22]Government Response to Stephan Shakespeare’s Review of Public Sector Information[EB/OL].https://www.gov.uk/government/news/government-response-to-stephan-shakespeares-review-of-public-sector-information,2018-04-08.

[23]Zuiderwijk A,Janssen M.Participation and Data Quality in Open Data Use:Open Data Infrastructures Evaluated[J].Acpi,2015.

The Open Government Data Quality Control Mechanism Based on Evolutionary Game Theory

Wang Juan1,2 Li Yuhai3

(1.School of Information Management,Wuhan University,Wuhan 430072,China; 2.Laboratory Center for Library and Information Science,Wuhan University,Wuhan 430072; 3.School of Information Management,Central China Normal University,Wuhan 430072,China)

Abstract :[Purpose/Significance]The quality of open government data(OGD)is an important factor that affects people’s access to data.It is significant to study the OGD quality control mechanism,which is helpful to optimize the quality of OGD the government,promote wider public participation.and achieve the goals of OGD.[Methods/Procedures]In this paper,evolutionary game theory was used to construct a copy dynamic model of boundedly rational open government data providers and users,to analyze the evolutionary stability strategies of both sides of the game and equilibrium conditions of the OGD quality under different data quality supervision conditions.[Results/Conclusion]It was found that regulatory incentives above a certain threshold could effectively control the OGD quality.In addition,it established scientific data quality assessment standards and data quality filtering mechanisms,reduced the additional cost of providing quality data and enhanced the data release mechanism which would improve data quality control efficiency.

Key words :open government data;data quality control;evolutionary stable strategy;evolutionary game

DOI: 10.3969/j.issn.1008-0821.2019.01.012

中图分类号 〕D63-39

〔文献标识码〕 A

〔文章编号〕 1008-0821(2019)01-0093-10

收稿日期 :2018-08-25

作者简介 :王娟 (1990-),女,博士研究生,研究方向:信息资源管理与配置、信息行为、竞争情报。李玉海 (1962-),男,教授,博士生导师,研究方向:管理信息系统、信息资源管理与配置、竞争情报。

(责任编辑 :郭沫含)

标签:;  ;  ;  ;  ;  ;  ;  

基于演化博弈论的政府开放数据质量控制机制研究论文
下载Doc文档

猜你喜欢