浅谈上海交通行业大数据应用架构及方向论文

浅谈上海交通行业大数据应用架构及方向

刘 弘

上海市交通委员会科技信息中心

摘 要: 随着计算机技术、网络和城市交通系统的发展,数据数量正在按指数增长。该文分析了上海交通行业大数据发展的背景和必要性,在分析上海公共交通大数据资源框架的基础上,通过实例介绍了上海公共交通大数据的应用情况,并建立了上海公共交通大数据总体业务框架和技术框架,以及未来上海交通大数据的主要应用方向。

关键词: 交通行业大数据;公共交通;业务框架;技术框架;应用方向

0 引 言

上海交通是一个极其复杂的系统,要掌握其复杂的进化规律是很困难的,而非线性特性使它难以预测。相比于其他城市管理领域,与城市交通相关的细粒度精细化数据较多也较丰富,在城市交通运营中正在产生越来越多的视频监控、卡口电警、路况信息、管控信息、营运信息、GPS定位信息、RFID识别信息等数据,每天产生的数据量可以达到PB级别,并且呈现指数级增长。面对如此量级的数据如果再沿用行业内传统的数据分析,将导致分析与应用方式还是集中在事后处理环节,而对事前预防与事中监控等缺乏有效的手段与方法。我们必须以大数据为手段,不断提升上海城市交通管理的广度、深度和精细度,以达到四方面的目标:提高通行能力、减少交通事故、打击违章事件、出行信息服务。

将水热预处理后的微藻生物质离心15 min,离心机转速为 5 000 r·min-1(RCF=5 000×g),取离心后的固体物质用于DSC的实验分析。

1 上海交通大数据整体架构

1.1 整体业务框架

为了实现上海智慧交通大数据应用,需要采用云计算服务技术,按照云计算架构的技术要求和数据服务层的需求,构建智慧交通大数据云服务平台,主要包括:计算机基础设施建设(IaaS),公共应用支撑平台(PaaS),应用服务平台(SaaS),数据交换、数据产品服务(DaaS)。其总体框架由云计算基础设施、数据资源池、公共服务平台、应用软件、数据应用、标准规范体系和信息安全体系组成[1]

智慧交通大数据平台总体框架如图1所示。

土地利用类型的重心迁移是区域土地利用空间变化的总体特征,通过对研究期初和期末各种土地利用类型的分布重心进行比较,将重心的转移方向、转移距离与转移区域的自然条件与社会人文条件相关联,可在一定程度上反映土地利用的总体变化趋势和空间格局变化规律,可以为合理配置土地资源、土地利用变化的驱动力及演替规律分析提供支持。

图1 上海公共交通大数据整体架构

采用SPSS 23.0统计学软件对数据进行处理,计量资料以“±s”表示,采用t检验;计数资料以百分数(%)表示,采用x2检验。以P<0.05为差异有统计学意义。

1.2 大数据技术框架

因为数据流量很大、复杂、无序,它需要强大的计算能力和支持。使用高性能的并行计算模型可以使许多服务器形成一个稳定而强大的集群,Hadoop分布式计算机可以存储和计算大量的数据流[2]

智能公交营运管理系统已基本实现以下功能:

图2 大数据技术框架

2 上海交通大数据基础数据和应用研究方向

2.1 数据来源与分类

单次观测数据:浮动车GPS数据、道路卡口数据、停车管理数据等。

连续观测数据:手机信令数据、LBS(Location-based service)数据(如使用微信、百度时留下的位置数据)、道路路况数据(如高德、百度等公司发布的拥堵指数)、公交刷卡数据。

(4)自动多源数据收集。有实时车辆数据采集、获取车辆定位数据、RFID总线检测、智能自动售货机、获取POS旅客流量、获取旅客视频流。自动视频监控电子电路采集DVR:使用RFID固定点信号和GPS /北斗同步信号并行趋势计算,电子路单采集超过98%;避免人工干预,得到行业管理部门的认可。

以上的“单次观测”和“连续观测”,是基于对个体出行(或交通设施)观测的角度进行区分的。有些数据在不同语境下所属的类别不同,比如浮动车GPS数据,对于个体出行而言是“单次观测”,而对于出租车运营而言则是连续观测。

2.2 应用方向

大数据、数据挖掘在交通领域的应用可包括辅助交通规划、交通管理、交通监测和相关决策等,又可根据研究对象空间尺度分为城际尺度和城市交通尺度。总体来说,大数据可以精细化地回答交通领域关心的诸多基本问题,比如:“人在哪儿”、“从哪儿来,到哪儿去”、“怎么去”、“什么时候发生”等,以及由此衍生出来的,比如:“挤不挤”、“远不远”、“单调不单调”、“利用充分不充分”、“够不够”等。还有可能为回答更深层问题提供一些思路,比如“为什么”、“有关吗”、“怎么办”等[3]

网络拓扑。通信网络应在充分利用现有网络资源(上海市政务外网)的基础之上,建设交通专用通讯网络,保证网络的稳定性。交通专用网络由上海交通信息中心、上海市交通委员会科技信息中心、上海大数据中心、交通云平台核心节点组成,交通云平台核心节点连接交通行业外的各相关部门,实现交通行业内外数据互联互通。

具体表现在以下几个方面:

人口活动:通过手机信令数据、LBS数据等个体连续观测数据,分析人群聚散、出行特征等,并量化地理空间的联系等。

城际尺度:城市群分析、城际联系(如经济活动、异地就业)等。

城市尺度:人口分布、职住关系、人口流动和聚散变化等。

交通运行:利用上面提到的浮动车GPS数据、公交刷卡数据、道路卡口数据、牌照识别数据、道路运行数据等,分析不同交通方式下的城市交通运行,反映出行者出行需求特征、交通供给情况和供需匹配程度等。此类分析由于受到数据本身影响,多为城市尺度分析,城际分析较少。

近日,美国马里兰大学和哈佛大学共同发起的一项研究发现,父母常常向婴儿重复词语将有利于他日后语言表达能力的增强。研究人员对7个月左右的婴儿进行了语言理解测试,并在被试2岁时再次测试其词汇量。他们发现,拥有较强语言能力的幼儿在婴儿期常常接受父母“磨耳朵”,即父母常常向他们重复一些词语。这些幼儿的语感和语言理解力也比同龄人要强。

公交运行特征:可以通过构建指标体系,利用丰富的数据资源对相关指标进行计算,实现细粒度的精细化分析。

城市监管与应急:同样,通过建立监管指标体系,结合数据实时采集、传输、计算和可视化等,也可能涉及到数据融合、叠加分析等,实现城市监管与应急。

城市规划相关分析:交通规划或者说交通问题的缓解不能只着眼于交通系统本身,城市空间格局及其产生的社会活动对交通需求同样有深层影响。所以,利用多源数据(如POI数据、房屋价格数据等),对城市产业、设施、用地等的分析,也是大数据、数据挖掘等在交通领域应用的重要组成部分。

语文课堂更加需要注入新的活力,更加的需要翻转课堂的引入。语文教师可通过多媒体信息资源提供层次化微课的引入,对良莠不齐的学生进行知识的引导,循序渐进、由浅入深的引入,带领学生进入中国传统文化、世界文化的知识海洋,这样的教学思想、教学理念能够满足不同知识结构学生的需求,符合了广大学生的认知能力。[3]通过课堂的互动性教学,形成知识的互动,通过任务启动性教学,让学生在任务中发现问题,解决问题,针对性的破解问题,使学生成为教育的主体,帮助学生理解知识,消化知识,更加形成对知识的渴求。

因此,要真正实现智能手机在课堂教学中深入、广泛地应用,实现“互联网+”时代背景下提倡的个性化、互动化、智慧化的教育和探究式、参与式的学习,就需要智能手机不再作为简单的学习资源传递工具、多媒体播放工具和通信交流工具,而应该是能够为学生提供知识共享、知识构建的交互式学习环境。

决策辅助:利用多源异构数据,搭建多维指标体系,构建可信、可靠的模型,提供决策支撑。当然,这个会涉及到更多的模型搭建、算法开发等。

3 上海公共交通大数据应用实例

3.1 智能公交营运管理系统

目前,上海公交公司的GPS/BDS数据是每天10亿次,已经存储了将近8年。直接和间接连接到公共交通,还包括手机信号、IC总线卡、APC数据,在多源总线数据的支持下,发送量已从传统发送量转变为智能发送量,可以降低客车企业的成本,提高效率,提高行业的一般服务水平。

上海公交智能运营管理系统总体框架如图3所示。

EFL学习英语作为外语,学习词汇既是万里之行的第一步,积累词汇也是学习过程中必不可少的内容。学习者究竟有多大的词汇量,单词学习学到哪一步是师生都共同关心的问题。词汇测试用来检测语言学习和语言教学的效果。传统在国内用得最多的词汇测试形式有多项选择题(multiple choice)和填空题(或完形填空中的词汇题)。提供参考用词的写作题也是词汇测试的一种形式。但这些测试形式都不适用于测试大量的单词、想要调查词汇量的大小、衡量词汇量的增长,国际上使用的测试方式为Yes/No测试。本文从词汇知识的分类和单词使用频率分级来介绍使用Yes/No测试的必然性。

有学者对EKC实证检验中的数据来源也提出了质疑。首先,EKC“倒U形”上升段的数据主要来自发展中国家或正处于工业化进程中的国家,而下降段的数据则主要来自发达国家或已完成工业化建设的国家。这实际上是将发展中国家和发达国家的数据进行简单的“拼接”,隐含着所有经济体都是同质的假设,忽略了不同经济体之间资源禀赋、经济结构、发展进程以及政治体制等方面的差异,因此研究方法和研究结论值得怀疑。

大数据技术总体框架如图2所示。

(1)计算机参与自动计算的全过程。计算机参与调度计算,预测车辆到达时间,自动发出出发指令,记录行车情况,并在整个过程中做出相应的调整。

(2)灵活的集中调度。支持各级公交管理部门的统一调度,紧急事故发生时,系统可以直接由政府控制以保证交通的正常运营。

(3)实时监控线路运行状态。对实际换乘人数进行统计,并对车辆运行情况进行监控。

基础数据:POI(Point of Interest)数据(如大众点评上的商家数据)、企业工商管理数据、房屋价格数据等。

3.2 上海公交汽电车实时到站时间预报

(2)多模式到达时间预测服务。在对实时行车数据进行分析后,使用基于DVB-T数字广播技术的公共交通信息服务数据传输技术发布到用户端,提供了多种信息发布方法,如LED显示屏、手机APP、微信公众号等(见图4)。

(1)基于大数据的到达时间预测。该系统融合了交通规划、实时操作数据和历史操作数据用来预测到点的时间。提供了基地之间超载的实时数据,并为预测时间提供了强有力的支持。系统不断积累历史数据,建立和完善历史数据库,形成自校正操作系统。

(3)到达预测的准确性评价。参考公交车组的预测数据、到站数据和列明路线目前的路线图,目前公交车登入的绝对误差为88%,公交车预测的相对准确性为85%。

3.3 公交客流时刻表优化及车辆配置优化

(1)线路发车时刻表(班次)编制。公交车的调度计划从基于历史经验向基于公交大数据分析转变,从而改善公交车的运量,并节省车辆和劳动力费用[4]

图3 智能公交营运管理系统

图4 多模式的到站时间预报服务

(2)车辆配置方案编制。在确定的出发时间的基础上,企业帮助制定行动计划,为车辆提供资源和运输能力,持续改进车辆的利用率和节省业务费用。

拥堵:指数计算(利用出租车GPS数据,或高德等导航服务商的用户GPS数据等,对各微观道路进行拥堵指数计算),以及据此进行的拥堵监测、拥堵规律分析等。

(3)公交线路运营评价。用可视化图表来对公交公司的整体营运情况进行定性、定量分析,同时,可以帮助交通主管行政部门和更高当局评估公共交通公司服务质量和业务效率。

3.4 轨道交通智能化

上海拥有轨道交通网络运营协调与应急指挥室(COCC),以及9个线路级控制中心(OCC),实现了包含车站级、线路级和网络级的三级生产指挥体系。同时,还有站台综合信息发布系统,包含到站时间等服务。

地铁方面,和阿里合作开发“metro大都会app”,支持地铁通行支付。2018年3月,上海首条胶轮路轨全自动无人驾驶APM线——浦江线正式试运营,现在在建的14号线、15号线、18号线也都将实行无人驾驶。人工智能安检系统:上海申通地铁集团正在开发能应对大流量快速安检的人工智能系统,解决大型活动带来大客流的安检难题。

布克申14座,即:伯尔克阿漫(下五旗))、察汗哈达、乌逊胡吉尔、特克斯色沁、巴哈塔木哈、库图尔、齐齐哈那、哈尔噶图、铜厂外(下五旗)、札拉图、雅巴尔布拉克、特穆尔里克渡口、额尔格图、哈布哈克。[注]国家图书馆分馆编《清代边疆史料抄稿本丛编》,北京:线装书局,2003年版,第23册《伊犁文档汇抄》第364~372页。

3.5 智慧停车

上海已将路边和室内停车的动态停车信息联网上报,上海停车APP可提供停车场内外的诱导信息,提供基于车牌识别的停车管理系统和反向寻车系统。在上海商务区和居住区的交叉区域,进行了共享停车的探索,推进资源共享、错时停车、预约停车。另外,将道路停车收费纳入政府非税收入管理系统,打造无人值守停车场,并启动个人信用管理,逃费将被信用系统记录。

4 上海公共交通大数据应用方向

4.1 运营全场景的智慧管理

影响交通状况的因素很多,比如天气状况、车辆数量、交通事故等,但最终都表现在速度上,速度包涵的信息量是足够的(速度预测可以采用非参数回归预测法,简单说就是采用历史数据中最相似的情况来进行预测。这里非参数的思想是,最近邻的车速曲线,未来时刻的变化也可能相似。非参数回归法的特点是精度高和可移植性强,只依靠数据驱动,不对数据进行任何假设,只关注历史数据中输入对输出的影响,从而进行预测)[5]。下阶段应利用实时和历史交通轨迹GPS数据、城市道路交通状况数据、道路网络基线数据和其他操作支持数据,叠加可能对交通造成影响的天气预报(如暴雨、大雾、大雪、冰冻等)以及重大活动、突发事件、自然灾害、战备等历史数据对上海总体交通情况特别是车辆速度进行预评估,有效规划出最便捷最优化的路线来缓解交通拥堵,引导车辆躲避拥堵避免堵上加堵。

4.2 车辆的安全行车监测系统

基于大数据信息(车辆状况、车辆性能和总体配给、驾驶过程中的实时监控视频、引擎数据、温度、电压)来对车辆进行安全评估,使用传统的地理信息和视频数据对汽车驾驶和调度数据进行标准化,分析驾驶路线,并为安全驾驶提供决策工具[6]。我国企业交通数据应用长期定位在娱乐、导航、安防等领域,对汽车自身的安全、节能等传感信息采集及数据应用不足,应引导企业克服服务单一、同质化程度高的局限,提升交通信息采集的密度、频度和广度,聚焦在大交通理念之上的综合交通平台进行研发。

数学的科学性和严密性要求学生学习数学要一丝不苟,在教学训练中应培养学生良好习惯,对于小学生来说,培养良好习惯主要是不间断地反复训练来实现。通过严格训练使学生形成对待任何工作都认真负责的态度,独立思考、勇于克服困难的精神,敢于正视错误、改正错误的优良品德。正确、积极地引导,从一点一滴抓起,既注意循序渐进,又贯穿始终,如在进行计算能力训练时,先要求学生认真审题,在计算时要求学生一一步一-回头,自觉进行检查,做错时及时纠正,自觉分析错误原因,养成认真计算的良好习惯。

5 结 语

随着城市不断发展,以及车流量、人流量的不断增大,上海出现了交通压力日益增大的现象,由此带来了交通拥堵、环境污染、交通违章等问题,这些问题影响着交通体系的正常运转,同时也考验着交通管理部门的应对以及调度能力。从大数据角度来看,要建立智能调度、敏捷响应的智慧交通生态圈,交通部门应整合运政、执法、出租、公交、应急等数据资源,建成交通大数据中心,为交通运输信息化建设的各项应用提供高性能、高扩展性的数据支持[7]。在应用层面,一方面可以从智能数据应用入手,实时监控分析道路车流量,依据动态的交通数据,自动切换和调配交通系统,从而调节交通流量。另一方面,交通部门可以通过实时、全面的数据可视化系统,呈现交通运行关键数据,为关键的决策进行支撑。通过交通多维度指标数据宏观综合监测城市、行政区和重点区域的交通整体运行情况,同时可以分钟级监测突发交通拥堵,帮助城市交通决策者量化掌控城市交通运行情况,提高决策效率与能力,进而实现城市智慧交通管理和运行。

当然也应该认识到大数据的局限性,首先,在交通规划、管理、监督、决策辅助等领域常用到的数据并不是定制化的数据。也就是说,这些数据产生和收集的主要目的并不是专门用于交通规划、管理、监督、决策辅助,而是一些其他生产活动的衍生品。所以,这些数据可能本身存在样本偏差,从严格意义上来讲,单个用户在空间上留下的轨迹并不能直接转换为传统意义上的交通OD。另外,大数据的另一特点就是价值密度低,因而在使用之前往往需要进行数据清洗,去掉无效数据。数据的应用受数据质量的影响很大。所以,需要注意数据只辅助决策,而不产生决策。

综上,可以看到大数据的应用能够将抽象的城市问题具象化,使之前的经验式决策变得更为科学。但数据往往缺乏主观能动性,因而难以取代人的思考及主观判断,目前仍然需要具有相关行业知识的人设计分析方向或对结果进行解读。

参考文献

[1]朱昊,孙亚.一体化大数据云平台构建交通新生态[J].上海信息化,2018(2):71-73.

[2]陈章辉,尤毅,杨静.大数据,应用成就价值[J].金融电子化,2014(7):46-47.

[3]谢然.大数据引领智能交通且行且珍惜[J].互联网周刊,2014(8):22-23.

[4]朱鲤.上海公共交通发展现状及大数据背景下的线网优化思路[J].交通与运输,2017,33(3):10-13.

[5]王桂强,陆朝俊.基于并行技术的大数据量统计分析探讨[J].计算机应用与软件,2011(3):162-165.

[6]熊刚,董西松,朱凤华,等.城市交通大数据技术及智能应用系统[J].大数据,2015(4):81-96.

[7]刘伟杰,保丽霞.交通大数据支撑一流运输体系的构建[J].交通与运输(学术版),2014(2):1-5.

Preliminary Introduction to the Application Architectureand Direction of Transportation Big Data in Shanghai

Abstract: With the development of computer technology and internet,the urban transportation data is expanding with an exponential growth.This article analyses the background and necessity of the development of transportation big data,gives examples to the application of public transport big data in Shanghai on the basis of analyzing big data framework in the transport industry,and establishes overall business and technical framework,and the main application direction in the future.

Keywords: Transportation Big data; Public transportation; Business framework;Technical framework; Application direction

作者简介

刘弘(1973—),男,大学本科,工程师,从事网络安全管理工作。Email: jtj02@shanghai.gov.cn

表5为依据叶绿素 a(Chla)、高锰酸盐指数(CODMn)、透明度(SD)、总磷(TP)、总氮(TN)计算得到的综合营养状态指数。

标签:;  ;  ;  ;  ;  ;  

浅谈上海交通行业大数据应用架构及方向论文
下载Doc文档

猜你喜欢