基于DEA的政府开放数据网站效率评价_dea论文

基于DEA的政府开放数据网站效率评价,本文主要内容关键词为:效率论文,评价论文,政府论文,数据论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       1 引言

       政府部门在履行行政职能、管理社会公共事务的过程中采集和储存了大量数据。政府数据网站的开放,不但能帮助政府提高自身管理透明度,还能够提升治理能力和效率,这也是促进经济发展和社会创新的重要推动力。自2014年,上海市政府数据资源向社会开放工作计划,建立第一个政府开放数据网站以来,我国政府开放数据网站如雨后春笋般萌芽,并得到政府的重视。如何对政府开放数据网站进行评价,是发展政府开放数据必须要解决的问题,对此国内外的政府部门、研究机构和大学等均进行了有益的尝试。

       黄思棉等以上海市和北京市为研究对象,通过人工的方式收集了这两个网站的数据项个数、数据下载量、网页更新时间和频率等数据集[1]。通过分析得出,政府开放数据网站存在更新时间较长、数据的价值性小且涵盖的范围比较窄等问题,并据此提出改进意见。徐慧娜等以纽约市和上海市的开放政府数据平台为例,引用技术接受模型,收集了13个指标,比较了两大城市政府开放数据网站的有用性、易用性和用户数据利用效果,分析了影响开放政府数据效果的关键因素[2]。卫军朝等全面分析了上海市政府开放数据建设的基础背景、数据开放情况,并对比了国际政府开放数据建设的现状[3]。陈涛等以武汉市政府数据开放平台建设为例,采取案例研究法,对武汉市正在筹建的政府数据开放平台开展实证研究,分析了武汉市政府数据开放平台建设的政策环境、建设目标、内容以及面临的挑战[4]。已有的研究主要集中于对开放数据网站的案例研究,一般会选取北京市、上海市这种成立时间较早,运营时间较长的网站作分析,少数研究者会关注到所有已经开放的政府开放数据网站,但仅抓取主要几项网站数据进行简单的描述性统计分析。本文基于前人网站评价体系和开放数据评价体系的研究,将DEA分析法方法应用于开放数据网站效率的评价。通过因子分析进行指标的整合、确立,并利用相关效率模型进行分析,从而构成系统性的网站效率评价。

       2 样本与指标选取

       2.1 DEA简介

       数据包络法(Data Envelopment Analysis,DEA)是著名运筹学家Charnes和Copper等学者以“相对效率”概念为基础,根据多指标投入和多指标产出对相同类型的单位(部门)进行相对有效性或效益评价的一种新的系统分析方法[5]。它是处理多目标决策问题的好方法,主要应用于处理多决策目标的情况,通过数据规划模型计算并比较决策单元间的效率,从而对决策对象作出评价。

       2.2 样本选取

       我国的数据开放平台主要包括大型公共政府数据库的开放数据网站(如天气数据、路程导航数据、普查人口数据、证券交易信息数据、医疗数据等)和各级地方政府的公共数据开放网站。考虑到各级地方政府数据开放网站往往采用专门的数据网站形式,网站内容相对统一,便于社会公众对数据进行访问和下载。本文将研究范围限定为地方政府的开放数据网站,通过搜索引擎以“数据+gov.cn”和“data+gov.cn”为关键词进行查询,以政府数据信息公开内容为主,选取8个符合研究条件的政府开放数据网站作为研究样本,结果见表1。

      

       2.3 指标选取

       从效率的角度评价网站,很大程度上依赖于评价指标的选取是否有效、合理。万维网基金会所组织开展的“开放数据晴雨表”(Open Data Barometer)基于“准备度”“执行度”和“影响力”层面进行评价[6]。郑磊等基于“开放数据晴雨表”建立的评价指标包含组织和管理、数据数量、开放性、元数据、时效性、易用性、数据导引、数据获取、数据应用、互动交流及界面体验[7]。闫现洋等在评价网站效率的研究中总结了4个维度:网站内容、网站易用性、网站影响度、网站结构,共包含9个可测的指标:内容丰裕度、网页的更新率、网站的连通率、下载速度、网站的总页面数、网站页面的平均大小、平均日点击访问量、外部网站指向链接的数及网络外链接数[8]。已有研究鲜有学者对政府开放数据网站给出较为完善的评价指标体系,只是从政府开放数据的角度进行研究。因此,本文基于以上政府开放数据评价体系的特征,并结合网站效率评价的特点从内容、技术、网站结构等角度选取相应的指标,构建评估政府开放数据网站效率的9个测度指标,结果见表2。

      

       其中数据量、数据内容、连通率、下载速度、网站的总页面数、网站的不重复链接数为输入指标,下载量、访问量、网站外链接量为输出指标。网站内容指标主要考虑网站数据内容涵盖范围是否广泛;数据格式、编排是否清晰等因素,采用专家调查法和层次分析法进行定量和定性相结合的研究,最终得出网站的排名和分数。网站的下载速度利用站长工具测量。数据量、下载量和访问量通过火车采集器进行网站后台的数据抓取。网站连通率、网站的总页面数、网站的不重复链接数量通过Maxamine web analyst软件获取。网站外链接量通过搜索引擎bing抓取。本文于2016年5月3日13:00点,同时抓取上述所需要的分析数据。由于所抓取的数据量纲不同,不具有可比性,因此要进行标准化处理。

       3 数据处理

       首先应用spss统计软件,对上文采用Maxamine web analyst软件、搜索引擎bing、火车采集器、站长工具和打分方法采集的DEA输入输出指标数据进行标准化处理。本文采用spss中最常用的“Z”方法,该方法是将每一变量值与其平均值之差除以该变量的标准差。通过这种标准化处理可以消除量纲和数量级的影响,从而去除数据的单位限制,将其转化为无量纲的纯数值。政府开放数据网站DEA输入输出指标数据标准化结果见表3。

      

       DEA法在分析过程中,输入指标和输出指标的乘积最好低于决策个数,因此通过因子分析对输入输出指标进行降维处理,使原有的评价指标聚类为有代表性的体系指标。首先采用KMO(Kaiser-Meyer-Olkin)和Bartlett对是否适合进行因子分析进行检验。KMO检验用于研究变量间的简单相关系数平方和与这些变量间偏相关系数平方和的差值。KMO值越接近于1,越适于因子分析;KMO值过小,则不适合。本研究中的KMO检验输入变量值为0.638、输出变量值为0.756,二者都比较适合进行因子分析。

       巴特莱特球体检验(Bartlett test of Sphericity)的目的在于检测相关矩阵是否为单位矩阵,若显著性概率Sig小于0.05,即否定相关矩阵为单位矩阵的零假设,表明适合因子分析[9]。经过分析,研究中的Bartlett球型检验输入变量和输出变量统计量的显著性概率是0.001、0.000,都小于0.05,表明适合进行因子分析,因此可以提取公共因子。确定公因子的一般原则是选取spss因子分析结果中,解释的总方差中特征值大于1的值。从表4的分析结果可以看出,输入变量的前两个因子特征值均大于1,累积贡献率达到88.676%,较为充分地保留了原始变量信息,因此提取这两个主因子。输出变量只有第一个因子的贡献率大于1,因此提取这个主因子。

       使用DEA方法进行效率评价要求全部投入产出的数据非负,因此对新指标数据全部进行取e的指数处理,得到输入输出指标数据的非负处理结果,如表5所示。

      

       4 效率模型应用分析

       目前学术界应用最为广泛成熟的,也是最基本的两个DEA模型是CCR模型和BCC模型,其中CCR模型可以评估综合技术效率,也称综合效率。综合技术效率=纯技术效率×规模效率。BCC模型可以评估纯技术效率。纯技术效率是指在给定投入的基础上,由于管理和技术等因素影响的生产效率,规模效率是由于规模因素影响的生产效率[10]。本文采用CCR模型和BCC模型对网站的综合效率、纯技术效率和规模效率进行评价,由此可发现网站存在的问题以及与其他相同类别网站间的差距,从而提出改进意见,提高效率。

       将8个样本的各输出、输入指标数据导入DEAP2.1软件,进行政府开放数据网站相对效率分析。对开放政府数据网站指标进行输入、输出的CCR模型和BCC模型分析,得到综合效率、纯技术效率和规模效率的输出结果见表6。

       从表6可见,这8个政府开放数据网站发展得非常不均衡,总体来看综合效率偏低。但其中上海市的综合效率达到满分值,可见发展水平较高。作为起步最早的数据开放平台,上海市政府数据服务网领跑所有的政府数据开放网站,值得学习和借鉴。另外,北京市和湛江市的数据开放网站效率也超过平均水平。北京市作为我国的首都,其网站建设应该具有雄厚的实力,但是网站综合效率来看,并不是非常令人满意。造成这一现象的原因可能是北京市政府开设的相关部门政府网站过于冗杂,在技术的应用和拓展方面并不能做到均衡,因此对于开放时间较晚的北京政府开放数据网站没有足够的重视和投入,使得纯技术效率低于平均水平,从而整体综合效率受到影响。相对而言,湛江市作为一个地级市政府的网站,它的开放数据网站在所有开放数据网站的排名比较靠前值得关注。不难发现,湛江市数据服务网数据下载流程方便快捷,网站所发布的数据范围广且数据量大等,这些都可以看出湛江市政府在开放数据网站方面的重视程度。从纯技术的角度出发,抛开上海市政府数据服务网来看,湛江数据服务网、浙江政务服务网、贵阳大数据开放服务平台的纯技术效率也达到1.000,说明在投入不变的情况下,它们的管理和技术水平都较为突出。若想在今后全面地提高网站建设效率,需要注重规模效率的改进。最后从规模效率的角度入手,北京市政务数据资源网、上海市政府数据服务网位于前列,其他网站规模效率值均低于平均水平。因此,对于其他政府开放数据网站而言,要提高综合效率,需要着手整体网站的投入资源配置问题,进一步优化整合已有的资源。

       5 结论及建议

       本文采用DEA法对我国为数不多的8个具有代表性的政府开放数据网站进行效率评价和比较。较之以往单纯运用描述性统计来横向比较网站的发展而言,避免了衡量角度单一化、片面的问题,提出了一个全新的视角。这样不仅能够对网站的效率水平进行综合比较,还能从技术效率和规模效率入手,分析现存状况的不足和待改进的地方,对其今后提高运行效率,改善运行效果提出合理化的建议,从而不断地推进开放数据的信息公开,使我国政府更好地为民服务。因此结合以上分析,认为可以从如下方面提高政府开放数据网站的效率。

       首先,政府相关部门应该加强管理,注重网站技术水平的提高,使网站用户能够切实感受到整体网站的服务水平。例如,当网站的连通率提高,用户可以在第一时间进入网站;当网站的下载速度加快,用户可以及时获取所需的开放数据资料等。因此,为确保政府开放数据网站的效率,要提高相关技术人员的素质,及时进行网络技术的更新,从而提升网站的整体建设。

       其次,提高政府开放数据网站的资源配置效率。政府开放数据网站作为近几年才得以发展的网站,在经费、技术和控制信息等方面都有所局限,因此要提高网站的整体效率,需要尽量实现资源的最佳配置。要在逐渐扩大网站规模的基础上,注重整体的规模效率,使政府开放数据网站的效率影响因素之间优势互补,产生系统效应,实现网站的总体效率提高。

       最后,要针对不同网站建设出现的问题,对症下药。应依据各地区经济、文化和政府开放程度等状况的不同,制定相应的调整方案。例如,对于某些发展水平较低的地级市,要注重整体网站建设的资源配置,注重规模效率。而像北京市、上海市等经济发展水平较高的城市,则更需要通过增加财力投入,全面提高技术水平和扩大网站规模。

标签:;  ;  ;  

基于DEA的政府开放数据网站效率评价_dea论文
下载Doc文档

猜你喜欢