优质开放与高效利用:交通开放数据现状研究论文

优质开放与高效利用:交通开放数据现状研究*

汤志伟1郭雨晖2黄怡芸1

(1.电子科技大学公共管理学院 成都 611731;2.电子科技大学经济与管理学院 成都 611731)

〔摘 要〕 文章以交通数据为切入点,选取来自省、市两级共43个数据开放平台中的1 095个交通类数据集,从优质开放和高效利用两个维度对其进行现状分析与问题发掘,提出以下建议:确保数据内容规范,鼓励多元数据创新;促进静态数据升维,提升流量数据占比;政府数据思维转变,强化政企深度合作;激励社会以赛促用,挖掘数据潜在价值。以期为有效利用开放数据提供指导和借鉴。

〔关键词〕 开放数据 交通 利用

1 问题的提出

在数据时代,各国政府陆续开展开放政府数据(Open Government Data)战略,向社会公开政府资源,以期促进数据利用、释放数据红利,实现社会、经济的创新发展。在我国,随着《促进大数据发展行动纲要》(2015年)、《公共信息资源开放试点工作方案》(2018年)等相关政策的逐步颁布,越来越多的地方政府开始建立开放政府数据平台,并有序上线覆盖生态环境、政府机构、企业服务、交通运输、卫生健康等各个领域的数据集。据统计,截至2018年8月20日,我国已上线省市两级地方政府开放数据平台共47个,累计开放数据集接近5万个。然而,开放政府数据本身并不是该战略的核心目标,能否将开放后的数据进行有效利用,才是使数据发挥其价值的关键一步。

随着相关研究的不断推进,学术界也逐渐开始关注开放数据利用的话题:Mila等认为开放数据利用率低的原因之一是使用者缺乏灵活运用数据的能力,而通过培训与干预的方式可以提高用户对开放数据的认识、理解和掌握[1]。Antonio等通过构建开放政府数据评估框架,指出提高数据质量、及时更新数据等有助于数据的有效利用[2]。陈美认为应从商业应用角度出发,鼓励政企合作,实现开放政府数据收益最大化[3]。汤志伟等对国内开放政府数据利用研究进行了系统性文献综述,发现平台、数据等直接条件与政策、文化等间接条件,对开放政府数据利用的各个环节都会存在潜在影响[4]。而在地方政府数据开放平台中,最有可能通过广泛利用,率先释放数据红利的当属交通数据,其缘由有三:第一,国务院常务会议上强调,我国要优先推动包括交通在内的民生领域政府数据向社会开放,可见交通数据具备必要的国家助力[5];第二,随着我国城市化建设和交通运输业的高速发展,人均汽车拥有率、铁路公路里程、公共交通设施数量等逐年攀升,由此带来的交通拥堵问题、道路规划欠佳问题、环境污染问题等引起了公众的广泛关注,因而由交通带来的城市病亟待通过数据科学的方式进行解决[6];第三,交通数据相对于教育、卫生、社保、服务等其他民生数据来说,更具备大体量、高质量、实时性等特征,对于分析和解决当前城市问题、建设新型智慧城市等具备明显的数据优势。

因此,深入研究打响开放政府数据利用环节第一枪的交通数据,具有显著的现实意义和理论意义,可为探讨其他种类的数据如何进行有效利用和价值发挥提供指导与借鉴。基于此,文章从交通类开放数据入手,选取来自省市两级共43个政府数据开放平台中的交通数据集,参考了郑磊等人从“数据、使用、效果”几方面评估政府开放数据的研究成果[7],探索交通数据开放和利用的现状与所存在的问题。同时还参照了OECD的开放政府数据指数(OGD)评估框架,从数据可用性(Data Availability)、可获取性(Data Accessibility)和数据再利用(Re-use)三个维度进行数据收集和评估[8],试图通过数据的优质开放来打开高效利用的大门,以创造较高的社会、经济价值。

2 从开放到利用:交通数据概览

2.1 整体性介绍

截至2018年8月,全国共计开放47个政府数据开放平台,除去苏州、威海、烟台、淄博这四个平台未提供交通数据以外,文章对其余43个来自省市两级政府数据开放平台的交通数据集进行爬取和分析。以平台分类为依据,采集“交通出行”“城市交通”等板块内的交通数据集共1 375个,其中山东省的省、市两级平台中重复数据集达280个,有效数据集1 095个。表1首先列出了交通类数据集个数大于40的平台与其占总数据集的比例情况,其中山东、上海、武汉、广东的交通数据集总量均已超过100,上海、宁波、中山的交通数据集占比分别达到12.23%、12.81%和19.81%,虽然部分城市交通数据开放数量情况较为乐观,但仍有大量城市并未对此给予重视。

海冰密集度分为1~10级,级别越高,船舶航行越困难。在8级以上的海冰密集度时,船舶没有破冰船的协助难以航行。北极理事会在2009年气候影响评估报告(Arctic Climate Imqact Assessment, ACIA)中指出,到2020年,东北航线海冰密集度均低于20%,夏季可全面通航。

表1 主要交通类数据集发布平台情况

“高效利用”维度。主要从数据集使用情况进行考察,既包括数据集自身的浏览量、下载量、评论量,也包括类似APP等数据集产品的落地。同时,文章还将相关数据应用竞赛纳入调查范围内,最大程度解析当前开放数据的应用和产出。

图1 交通数据集发布部门统计

2.2 调查维度界定

目前国内外都有科学的评估体系,对各个国家和地区的开放政府数据能力进行综合评估。国外如由万维网基金会和开放数据研究会发布的开放数据晴雨表,从准备度、执行力和影响力三个角度对世界各国进行评价[9];国内如复旦大学数字与移动治理实验室发布的《中国地方政府数据开放报告》,从基础层、数据层和平台层对中国各省市政府数据开放水平进行横向评估[10]。无论是国外评估体系还是国内评估体系,都全面评价了开放政府数据的各个维度,对各国政府都有较强的现实指导意义,但其问题诊断和对策建议却往往是针对整个开放政府数据生态系统进行的综合性、全面性考量,作为报告本身还难以回答如何促进数据高效利用和价值体现的现实问题。基于此,文章在综合各类评估体系的指标前提下,专注于数据本身及其使用情况,构建与开放利用有关的数据集调查维度——“优质开放”和“高效利用”,来对我国地方政府所开放的交通数据进行调查研究。

在算例1的基础上,算例2将提出的负荷频率协调控制和滑模负荷频率控制器应用于柴储混合电力系统中,对系统频率进行优化控制。算例2的系统负荷频率偏差值如图4所示。

其次,文章对1 095个交通类数据集的发布单位进行了统计分析,发现目前数据来源主要集中于交通委员会、公安局、交通运输局这三个部门(交通委员会和交通运输局因地域行政文化差异的原因,大部分市级政府中只存其一),其数据总量高达574个,已超过所有交通类数据集的50%,是交通数据开放的主要推动者。除此以外,交通类数据集还有来源于统计局、港航局、公路管理局等多个部门的数据,图1列出了发布数据集超过10个的单位。

3 优质开放维度现状与问题

3.1 数据介绍

数据介绍包括数据集的名称、关键词、摘要等基本信息,完备的数据介绍是使用者准确找寻所需数据集的前提,也可谓是促进数据充分利用的第一步。首先,文章对所有交通数据集名称进行了词云分析。如图2所示,“机动车”“运输”“企业”“道路”“公路”等出现频率最高,形成了交通数据集词云的主干,体现了各地方交通数据以车辆数据、运输情况数据、城市道路数据和相关运输企业数据为主。与此同时,“客运”“驾驶”“许可”“车辆”等词作为交通数据领域的第二梯队关键词出现,指出了交通运输服务和车辆驾驶许可等公众参与较多的领域也易形成数据积累。通过数据集关键词的词云分析,不难发现目前政府部门对交通数据开放的价值取向,既对后续数据分类、数据目录制作大有裨益,也为未进行交通数据开放的城市指明了道路。其次,在全部交通类数据集中,有175个数据集并未提供关键词,占全部交通数据集总量的15.98%,涵盖15个城市,其中山东省各市尤为严重。摘要(部分城市为数据描述、简介)部分,是对数据集整体情况的概述,目前主要存在三种类型:其一,信息缺失,并未提供数据摘要内容;其二,对数据集名称的简单重复;其三,包含数据发布单位、名称、数据集具体指标的简要描述,这也应是目前政府数据开放平台的基本要求。

图2 交通数据集的词云图

3.2 数据内容与质量

数据内容与质量是数据能否产生价值的关键环节,低内容、低质量的数据集发布得再多,其价值量也难以企及一个保质保量的数据集。因此,为了深入了解交通数据集的开放质量,笔者切实下载并打开了1 095个数据集,将所有数据集内容进行分类梳理,以便客观地分析问题。

[本刊讯]上海市护理学会第八届护理优秀论文评选活动已顺利落下了帷幕。此次评选活动共收到来自上海各级医院、护理院校及部队医院近 200篇护理论文,经过上海市护理学会组织的专家评审委员会的初评与复评,评选出上海市护理学会第八届优秀护理论文各奖项,具体名单如下。

文章结合数据介绍与数据实质内容,对所搜集的数据集进行系统分类,其主要分为道路站点信息、企业信息、人员信息、车船信息、统计数据、执法机构信息、路况数据、费用信息等,具体见表2。由此可知,目前我国各地交通数据集的发布,主要趋向于道路、企业、人员、车船四个方面,且占有较大比重,与关键词词云相互契合。仔细观察各数据集实际内容,存在的问题也十分典型:其一,信息与数据的边界尚不明确,大量数据信息公开、新闻发布的内容被以数据集形式强硬进行发布。其二,统计数据与数据开放混淆,多数地方平台均有由统计局发布的历年统计数据,并将其分行业分年份进行强行拆分。其三,动态数据比例明显少于静态数据,含金量较高的动态数据或实时流量数据较少,对于数据实时调用与展现较为困难。

表2 交通数据集内容分类

其次,在数据容量方面,总体出现数据容量体量偏小、字段数维度狭窄的问题。《中国地方政府数据开放报告》中首次提出“数据容量”这一概念,即将字段数(列数)乘以条数(行数)得出数据的总量,以衡量数据集的实际数据量大小[10]。在文章统计的交通类数据集中,数据容量突破10 000的仅有116个数据集,占总数据集个数的10.59%,而数据容量低于100的多达293个,占比26.76%。虽然低容量数据可能存在数据搜集的现实局限性,但不可否认的是,它们所产生的价值是微小而有限的,甚至在大数据时代中,这样的数据集其含金量几乎为0。其次,部分城市为了在数据集“量”上做文章,将数据集刻意拆分,如武汉市地铁运行时间数据,按不同地铁线路拆分为多个数据集;又如扬州市按月发布邮政业经济运行情况,以月为单位分割为多个数据集;再如中山市沙口大桥交通量数据,以地点为单位分割为上、下桥位两个数据集。如此种种,不胜枚举。其本质是对数据集进行降维处理以增加数据集数量。这种做法严重缺乏促进数据利用的大局观,也加大了使用者的利用成本。

数据分析工具是由政府数据开放平台所提供,用以帮助用户对数据集进行简单分析和程序开发。目前国内政府数据开放平台提供的工具主要包括三类,分别是:可视化分析工具、开发工具和地理空间工具。

3.3 数据格式

数据格式关系到用户利用数据的方式手段,最直接影响到用户分析数据的效率和效果,不同格式的数据集对发布者和使用者具有不同的成本效益[11]。文章从可机读格式和开放格式两个角度入手进行分析:可机读格式是指能被计算机自动读取与处理的格式,包括XLS、CSV、JSON、XML等,而不可机读格式包括DOC、PDF、JPG等。其次,开放格式是指可下载数据集应以开放的、非专属的格式提供,不得在格式上排除他人使用数据的权利。在Berners Lee提出的开放数据五星标准中,指出数据格式应满足可获取、非专属的要求,即可达到三星标准[12],如CSV、XML等,该标准在我国各地政府中多有实践,同时也是开放格式的题中应有之义,因而作为文章调查交通数据格式的重点观测指标。

在各省市开放数据平台中所检索到的1 095条交通数据集中,有100条数据尚未提供任何可下载获取的数据格式,仅能检索到名称和简介,其主要出现在日照、泰安、潍坊、枣庄和济南。在可下载数据集中,存有88.28%的可机读数据,但其中仅有66.60%满足可获取、非专属的开放格式要求。其中,贵阳、济南、东莞、广州、山东等24个地方平台上提供的交通数据集已全部满足开放格式的标准。例如贵阳交通运输建设从业人员信息提供了xls,csv,xlm,json,rdf等5种数据格式,用户可根据自身需求选择不同格式下载使用。在整体数据格式形势较好的情况下,仍有浙江、武汉、肇庆等6个开放数据平台存有58条(占总量5.2%)数据集提供的是不可机读格式。例如2016年肇庆市邮电业务总量,数据容量小且采用DOC格式展示表格数据,其实这类数据完全可以采用XLS格式,以方便用户下载利用。究其原因,一方面是部分交通数据集内容使然,如湖北省已建高速公路图、汉口汉阳片区堵点绕行图等通过JPG的方式呈现更加直观,另一方面则是可用机读格式实现的数据却未使用,如武汉市车管所及其分所、荆门市交通运输局行政执法持证人员信息公示、肇庆市运输工具拥有量等。除此以外,部分省市还出现所展示数据格式与可供下载的数据格式并不匹配的问题,如某市“道路运输从业人员查询”数据集,展示了xls,csv,xlm,json,rdf五种格式,却只提供了csv格式下载渠道。

3.4 数据持续

可视化分析工具是指平台提供了实现数据集可视化或统计分析的工具。用户可以在数据集页面通过设置不同条件,对数据进行初步的统计分析,还可以对统计结果进行可视化呈现,如饼状图、柱状图和曲线图。其次,开发工具的提供以便利开发者为目的,但部分地区仅提供了付费下载的跳转链接或仅有对工具的文字介绍,性质更接近于开发工具的推荐者,而不是开发工具的提供者。地理空间工具是指平台提供了将政府开放数据和地理信息进行融合应用的功能。目前,长沙、东莞、佛山、山东等平台提供了地理空间工具,这类地图工具多与高德、百度等企业合作,提供导航功能,或将一些公共部门的位置叠加在地图上提供服务。以山东公共数据开放网为例,用户可在页面上自行检索或根据主题分类查找地理数据集,然后叠加在地图上显示。

“优质开放”维度。主要从数据集本身进行考察,包括数据集的内容、质量、种类、更新情况等方面。这些指标均以“用”为最终导向,探索怎样的“开放”才能促进利用效率的提升。

表3 交通数据集更新情况

调查发现,在各数据开放平台所提供的1 095条交通数据集中,共有183条(16.71%)数据集并未承诺更新频率,导致用户无法寻求数据更新时间以持续利用数据;另有178条(16.26%)数据集承诺更新频率类型为自定义和不定时更新,即不能提供准确更新频率。上述现象皆容易造成数据的维护与更新缺乏监督机制,从而导致数据集发布形同虚设,无法持续产生数据价值。实际情况也印证了以上观点:在承诺更新频率为自定义的数据集中,有85%以上的数据都未再进行更新。除此以外,承诺更新频率以年为周期所占的比重最大,达到41.37%,相比之下以半年、季度、月、周为承诺更新频率的数据集占比较少,如表3所示。一般来说,更新周期越短,更新频率越快,用户利用数据的可能性也越大,从而更能推动相关部门更新数据,形成良性循环。不可否认,部分数据确实存在收集成本大、难度高,并不适用于短频更新。但在承诺更新的数据集中,共有38.54%的数据集并未履行承诺,直接影响了各平台数据持续性的整体水平。其中,贵阳、山东各地、上海等市的交通数据更新情况较好,但大部分省市在数据持续方面仍然存在未及时更新的情况,且无法找到其历史存量数据的情况。

4 高效利用维度现状与问题

4.1 浏览量和下载量

数据浏览量和下载量直观展现了数据利用情况,反映出用户对数据信息的需求导向和使用意向,有助于平台运营维护者根据用户需求有针对性地完善数据集内容,逐步提升平台数据利用率。

试验台的测控系统中每一块采集卡的实例应该只有一个,否则,如果测控系统中存在多个独立的对象,则会造成采集设备的误操作和数据采集、设备管理的混乱,进而影响试验台的正常运行。因此,为了避免此类问题,采用单例模式是最佳的选择。

从交通数据浏览量上看,各数据集浏览量普遍偏低,其中低于500人次浏览的共有758条,占比达69.22%;数据集浏览量在5 000以上的仅占2%,主要体现为北京轨道交通路线、广州市机动车交通违法监控抓拍位置信息、高架上匝道关闭时间等信息,其浏览量均超过10 000,其中北京轨道交通路线浏览量达到了22 968,这类信息与市民日常交通出行密切相关,因此其利用率较高。

数据应用比赛是政府和企业从推动数据利用、鼓励公众参与、宣传数据开放的角度出发,所筹办的大数据应用创新设计大赛。由于城市交通问题日益突出,很多数据应用比赛都从交通层面出发,开展以交通为主题的应用比赛,例如贵州省2017年举办的“云上贵州智慧交通大数据应用创新大赛”,贵阳市2016年举办的“贵阳交通大数据系列竞赛”和上海市2015年举办的以城市交通为主题的“上海开放数据创新应用大赛”。这类比赛都是以解决交通问题为目的,有针对性地利用交通数据研发新应用,形成以公交线路优化、出行行为分析、路网流量预测、高速路异常事件监测等交通主题作品,既实现了对数据的跨越融合和创新应用,释放了数据隐含的价值,也为城市交通治理的智能化、数据化发展提供了探索思路。

陶艺家刘伟是景德镇人,他擅长瓷画,人们在欣赏他的作品时极易引起乡愁式的共鸣。故乡是每个人心中永恒的眷恋,古今中外几乎所有的艺术形式都反复表现过这个主题,有语文课本里的余光中的诗歌《乡愁》,还有大家耳熟能详的费翔的歌曲《故乡的云》等。而陶艺家刘伟以其所长之陶艺来表达乡愁。他的作品很多典型,如釉上彩瓷板《春风又绿》、新彩作品《雨沐春山》,釉上粉彩瓶《月光曲》、窑变高温色釉粉彩综合装饰箱器《徽乡情》等等。刘伟对他的作品在形式上和内容都做了极认真的研究,在他的作品中我们能看到立意高远的构图,瑰丽变幻的色彩,兼工带写的手法。“乡情”系列是刘伟作品的重要组成部分,成为他的鲜明标签并为海内外藏家所熟知。

值得注意的是,部分数据集出现下载量严重大于浏览量的奇怪现象,通过政府信箱反馈后,被告知为技术问题,但并未做出修正。

4.2 调用接口

应用程序编程接口(Application Program Interface)是各地数据开放平台都会普遍提供的一种数据调用形式,相比于数据集下载,API更能使用户高效获取所需要的数据条目,以满足开发者的数据需求。在文章所搜集的交通类数据集中,有112个数据集提供了调用接口,占10.23%。同时,部分城市借鉴数据下载量的形式,展示了API调用统计量,以便于更加深入了解数据集的利用程度与开发程度,如北京市政务数据资源网和东营市公共数据开放网。

目前,虽然大量城市的数据开放平台已认识到数据接口对促进数据活化的重要性,但总体实施仍处于初级阶段,以致数据调用接口提供的规范性较差、自主性较强。主要问题有:其一,数据调用和下载的混乱,部分城市分别提供了数据和接口两个栏目,但具体数据集分配交叉,如上海“快速路路面网流量”数据集在数据产品中提供了普通下载渠道和调用渠道,但在数据接口中却无法检索到该数据集。相对而言,北京市整体较为规范,所有交通数据集都可进行下载和调用。其二,数据调用说明缺失,增大数据利用难度。部分城市提供了以json和xml为主的可调用格式,但却未提供涵盖接口描述、错误代码等数据调用说明,增大了数据利用难度。

4.3 数据分析工具

肥料对于任何作物的生长都有非常重要的意义,对于花生种植也不例外。在花生种植的过程中,肥料的使用是否科学合理,对于其产量有着非常直接的影响。首先,为了更好的增加土壤中的有机质含量,提升土壤的供肥能力,改变土壤的性质。在花生种植的过程中增施有机肥是非常有必要的。通常情况下,常规花生田地每亩需要施用圈肥2500kg或者商品有机肥100kg。高产花生田需要3500kg圈肥或者150kg以上的商品有机肥。在进行有机肥的使用过程中,农户应该注意使用经过腐熟的动物粪便,如果有机肥料较为匮乏,也可以通过秸秆还田等方式来增加土壤有机质的含量。

数据持续是指各个数据集更新的时间频率,关系到数据本身的时效性和用户对数据的持续使用。政府数据开放平台管理运营是一项持续性和常态化工作,平台上线后应持续更新和添加数据集,以满足社会对开放数据日益增长的需求。文章跟踪考察各个数据平台在截至2018年8月20日更新的交通类数据集情况,发现大量平台能基本保持新增数据集持续增加与存量数据集动态更新,但仍有不少地方平台存在交通数据集延迟更新或停滞现象。

4.4 APP应用程序与数据应用比赛

交通数据开放的利用成果主要包括APP应用程序、数据分析结果和各项研究成果,其中APP应用程序使用范围最广,对于公众来说实用价值最高。纵观43个数据开放平台,仅有贵阳、济南、无锡、成都等12个平台在应用栏目中提供了交通领域的APP应用程序,但都未直接提供下载链接,用户最便捷的方式是在手机应用下载中搜索APP名称进行下载。通过下载该类APP发现,超过一半的应用程序存在闪退、系统不兼容、更新慢、用户体验感差等问题。例如成都熊猫驾信APP,是一款实现驾驶人和机动车违法查询、处理、缴费的一条龙处理软件,拥有高达171万次的下载量,但却存在评分低、数据处理能力弱、缴费慢、广告多、高额代办费等各项问题。

在数据下载量方面,下载量在500以内的数据集占到73.97%,其中有近19.36%的数据集下载量为0。零下载量数据集的存在一方面是由于数据不满足用户需求,另一方面是该部分数据集未提供可下载的文件,用户无法进行下载和使用。另外,数据下载量高于500的仅占7.03%,主要体现为广东机动车临界未检验通告、上海城市道路信息、上海车辆统计等信息,尤其上海高架上匝道关闭时间信息下载量达到5 603,居所有交通数据下载量榜首。

5 对策:开放与利用的互促互进

5.1 确保数据内容规范,鼓励多元数据创新

数据始终是开放政府数据战略的基本元素,没有优质的、可用的、规范的数据,那么数据开放也仅仅是变相的进行统计数据发布或数据信息公开。因此,文章认为要想提高交通数据利用率,首要解决数据本身的问题。在数据内容方面,各部委应对一部分在各省市中都广泛涉及的数据集类型进行统一化和标准化,具体如介绍、格式、更新频率、数据维度等,以做到各平台交通数据横向可综合利用。而对于非统一标准的数据集,应尽可能的向“统一标准”靠拢,最大程度提升数据质量,以实现各平台纵向创新发展。其次,对属于信息公开和统计数据等非“开放数据”进行严格的审查和追责,确保各平台开放的是真正有价值的数据。在数据主题分类方面,交通部门应设置规范的数据目录,对各平台发布的各类交通数据进行明确规定,而针对各平台创新特色的交通数据集,则可先在已分类基础上进行划分,不属于任何分类的则划入其他类型中,如北京市将交通数据划分为飞机、汽车、火车等。

为保持法律语言的权威,一些法律翻译研究者提出以直译为主的法律翻译策略,侧重贴近原文、贴近法律文本制作者的意图[13]17-19。Weisflog认为法律翻译应遵从奈达的形式对等理论,即法律翻译需注重源语的形式与内容,应尽可能地贴近源语。Weisflog还认为在法律翻译中,译者几乎没有任何发挥空间。Didier也提出绝对直译,他认为无论文本属何种类型或功能,都应采用直译。中国学者李克兴颇具创见地提出了静态对等的翻译理论,他认为:“法律翻译应追求深层意思、表层意思、语言结构、风格与原文完全一致,还要求译文最大程度地再现原文作者的写作意图。”[14]

5.2 促进静态数据升维,提升流量数据占比

当前各平台中80%以上的交通数据集属于静态数据,且降维增量的情况频出。因此,各平台应整合已发布的交通数据,扩充数据维度,如时间维度、区域维度等,而非为图方便和数量,而以某某年某某数据集的形式进行数据开放。例如某市公交类数据集,应尽可能包含各路公交站台名、收发车时间、每日班次、收费标准、车型等数据,而非形成路线数据集、收费数据集、车型车检数据集等。

对于路况流量数据,其数据粒度更小、更新频率更高,对于数据利用与数据价值产生的作用较大,也更能开发出高质量的交通数据应用程序。例如地铁线路流量数据集、高速收费站流量数据、路口违章数据等,是有条件形成优质数据集并向社会公众开放的。相较于其他类型的数据集,交通数据中动态流量数据来源渠道多、种类多,且目前多由人工智能设备采集统计,从而增加流量数据占比,并促进交通数据的高效利用。

5.3 政府数据思维转变,强化政企深度合作

交通数据的开放和利用,乃至更为广泛的政府数据的开放和利用,其主要推力仍来自于政府部门对数据开放的正确认识,包括开放什么、怎么开放、如何追责、如何评估等。以交通数据为例,其开放的目的在于和社会公众一起探讨和解决城市拥堵问题、公路运输问题、尾气排放问题等,以期实现智慧交通、智慧城市。同样,为促进交通数据活用,政府交通部门可通过政府采购、服务外包、社会众包等方式,将数据量大、敏感度高的数据集,依托企业、高等院校、科研机构来开展交通数据应用,创造更多新产品和新业态。目前,由交通运输部采用政企合作模式建设的、基于公共云服务的综合交通出行服务数据开放、管理与应用平台——出行云(综合交通出行大数据开放云平台)已上线,其汇聚了交通部门、院校、企业等搜集的交通数据,并联合了各单位提供的决策服务与开发服务,为各类数据集的开发应用提供了借鉴[13]

荧光镜下观察检测到标记的Piwil2-iCSCs外泌体以时间依赖的方式进入细胞,共培养3 h及6 h后外泌体已进入细胞并在胞质中弥散分布,12 h时外泌体已大部分聚集于核膜,24 h时细胞核周围依然可见红色荧光聚集(图3)。

5.4 激励社会以赛促用,挖掘数据潜在价值

交通数据开放的根本目的在于促进数据利用,大力提倡和鼓励举办各类数据大赛,有助于挖掘数据潜在价值,可为交通领域带来巨大的商业价值和社会价值。目前各地数据大赛以数据开放为切口,通过政府搭台、政企合作等方式,发动公众参与和协作来共同解决公共问题。在举办大赛的过程中,政府部门感受到了开放数据的巨大潜能,加大了对开放数据的支持力度,有助于政府部门拓展思路,促使决策实现科学化和精准化;而社会各界基于开放数据提出的创新方案,也为解决实际交通问题提供了实证依据和新思路。从比赛效果来看,各类数据大赛吸引了企业、高校和社会组织的广泛参与[14],对解决实际问题、宣传普及开放数据文化、提升公众数据素养具有深刻意义[15]。举办大赛的成果也对其他尚未开放数据的政府部门起到了示范效应,加速各行各业数据开放的深入推进。

②利用机械变频机组进行变频。购置极数、频率不同的两台卧式电机,同轴连接。其中一台电动机接电网侧,工作在发电机状态,在50Hz工频下运行;另一台电动机在低于工频的某一频率,产生一个低频小电网,带动同步机组倒转发电,从而将水泵机组由额定转速降低至相应的发电转速,从而提高发电效率。这种方式在刘老涧站、泗阳站都有成功的运用经验。

6 结语:以利用为目的的省级数据开放统筹建设

随着各省市数据开放平台的陆续推出,不少专家学者提出在重视数据质量的同时,更应关注对数据的充分利用。文章以交通数据为切入点,对广东省及其各市、贵州省及其各市、山东省及其各市平台的数据利用情况进行省、市两级的对比调查,发现当前省市两级政府存在普遍使用不同平台、市级数据无法在省级平台中找到、同省各市级平台各自为营等现象,唯有山东省较为乐观,能够实现省市两级同一平台、数据共享。上述省市分离现象虽在开放数据前期易形成各平台创新发展趋向,但若长期如此,势必造成网站运营成本高昂、数据共享难以贯通、用户查找困难、数据标准不一等现象,无形之中为数据跨区域利用增加了难度。正如目前政务服务网站一般,省市分离情况严重,全面实现省级统筹非一朝一夕之功。因此,在政府数据开放平台建立初期,各地政府如何以实现数据充分利用为目的,兼顾省级统筹建设与地方创新发展,将会成为后续探讨数据横向跨区域利用的重要话题。

(来稿时间:2018年12月)

参考文献:

1. Gasco-Hernandez M, Martin E G, Reggi L, et al. Promoting the use of open government data: Cases of training and engagement[J].Government Information Quarterly, 2018.

2. Martin A S, Rosario A H D, Perez M D C C. An International Analysis of the Quality of Open Government Data Portals[J]. Social Science Computer Review, 2015, 34(3):298-311.

3.陈美.开放政府数据价值:内涵、评价与实践[J].图书馆,2018(9):27-32.

4.汤志伟,郭雨晖.我国开放政府数据的利用:基于CNKI的系统性文献综述[J].情报杂志,2018, 37(7):176-181,65.

5.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2015-08-31].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

6.杨青,谢媛.大数据时代政府数据开放在公共交通中的应用研究[J].新闻传播,2016(8):18-20.

7. Ubaldi B. Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives[C/OL] // OECD Working Papers on Public Governance, No. 22, 2013, OECD, Paris. [2017-08-20]. http://dx.doi.org/10.1787/5k46bj4f03s.

8. Parr C S. Open Sourcing Ecological Data[J]. Bio Science, 2007(4):309-310.

9.夏义堃.国际组织开放政府数据评估方法的比较与分析 [J].图书情报工作,2015(19):75-83.

10.中国地方政府数据开放平台报告[EB/OL]. [2018-05-26].https://mp.weixin.qq.com/s? biz=MzA4NTgxMzQzNQ%3D%3D&idx=1&mid=2649184724&sn=de373ebb1ee35c40947505f1f8a3a087.

11.李姣,郭海红,郭珉江,等.美英政府开放健康医疗数据的主题分布与开放程度量化研究[J].图书情报工作,2015(20):132-137.

12. Berners-Lee T.Linked data:Design issues[EB/OL].[2018-05-16].http://www.w3.org/Design Issues/Linked Data.html.

13.王翔,刘冬梅,李斌.我国公共数据开放的促进与阻碍因素——基于交通运输部“出行云”平台的案例研究[J].电子政务,2018(9):2-13.

14. Snaith B. Data’s value: how and why should we measure it? [EB/OL]. [2018-08-10]. https://theodi.org/article/datas-value-how-andwhy-should-we-measure-it/.

15. Meijer R, Choenni S, Alibaks R S, et al. Bridging the contradictions of open data[C]. European Conference on Egovernment,2013:329-336.

High Quality Open and Ef ficient Use : Research on the Status Quo of Traf fic Open Data

Tang Zhiwei1 Guo Yuhui2 Huang Yiyun1
( 1.School of Public Affairs and Administration, University of Electronic Science and Technology of China; 2.School of Mangement and Economics of UESTC )

〔Abstract〕 This paper takes the transport open data as the point of penetration,in order to provide guidance and reference for exploring how to effectively use and value open data, selecting 1 095 traf fic data sets from 43 government data open platforms at the provincial and municipal levels, and analyzing the status quo and problems through the high-quality open and ef ficient use of data. It is found that data open and utilization have various problems that restrict the generation of data values. Therefore, this paper proposes to ensure data content speci fication, encourage multivariate data innovation; promote static data to improve,increase the proportion of traf fic data; change the thinking of government data , strengthen the deep cooperation between government and enterprises; motivate society to hold competition for promoting the utilization and tap the potential value of data.

〔Keywords〕 Open data Traf fic Utilization

〔中图法分类号〕 G350

〔引用本文 格式〕 汤志伟,郭雨晖,黄怡芸.优质开放与高效利用:交通开放数据现状研究[J].图书馆,2019(8):039—045.

* 本文系国家社科基金专项课题“建设智慧社会的顶层设计与实现路径研究”(项目编号:18VSJ057)成果之一。

〔作者简介〕 汤志伟(1969—),男,博士,电子科技大学公共管理学院院长、教授、博士生导师,研究方向:电子政务与智慧城市;郭雨晖(1992—),男,博士研究生,电子科技大学经济与管理学院博士研究生,研究方向:电子政务与智慧城市;黄怡芸(1994—),女,电子科技大学公共管理学院硕士研究生,研究方向:电子政务与数据开放。

标签:;  ;  ;  ;  ;  

优质开放与高效利用:交通开放数据现状研究论文
下载Doc文档

猜你喜欢