关于城市交通大数据分析平台建设的两点思考论文

关于城市交通大数据分析平台建设的两点思考

Reflection on the Construction of Urban Traffic Big Data Analysis Platform

杨东援

同济大学 教授

1 城市交通需要构建面向智能治理的大数据分析平台

伴随社会发展,社会主要矛盾已经转化为“人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾”。城市交通领域也是同样,日益多样化的需求,不同群体/利益集团诉求间的冲突,以及城市规划逐步转向存量规划,更加关注生态修复和城市修补等,要求城市交通对策逐步从管理逻辑走向治理逻辑。

在此背景下,各个城市正在积极构建的大数据分析平台,必须考虑适应转型进行必要的功能调整。有必要从信息应用角度提出城市交通智能治理的概念:智能治理意味着在相关各方之间更加积极主动的沟通,交通决策相关信息更加深入地嵌入政策议程,以及在制定对策方案过程中更加广泛和深入的讨论。

城市交通对策涉及复杂利益与关系的问题,我们不仅需要研究如何制定对策方案,而且要探讨如何及时地将重要问题提到议事日程。回顾网约车、共享单车萌芽阶段,尽管少量研究者已经意识到可能产生的巨大影响,但是要说服政府相关部门及时展开前瞻性政策/对策研究却极为困难。同样在小汽车对城市交通产生冲击征兆的早期阶段,很难说服政府认真讨论车辆控制问题。

城市交通对策的制定,是一个“事实”、“政治”、“技术”三种源流相对独立,且又在一定时点上相互交融、相互影响的过程。所谓事实源流,并非简单是客观世界发生的变化,而是能否有效地察觉/观察这种变化过程。这正是交通信息系统的重要价值之一,是交通数据平台需要具备的基本功能。所谓技术源流,是指能否通过技术分析觉察物理/社会空间中的演化趋势、结构性变化(结构变点),正确地评估相关态势,做出合理的预测(尽管是有限预测)和预判,并制定相关的对策方案。而政治源流说明政府的决策议程,以及影响政府决策的各种政治因素。传统城市交通理论很少研究如何引发政府对某种问题的关注,以及推动相关政策议案能够达成共识并付之行动。但是,城市交通本质上是公共政策,技术人员在其中所扮演的不过是参谋角色,如何说服决策者是一个不容回避的重大问题。三种源流具有自身相对独立运行的过程,只有当政策窗口开启,三种源流融汇才能够真正形成决策和行动。

祝国寺建成后,最初10年间,管理不善带来种种问题。首先是内部不团结。“刚建起来,大家都来做事,很团结。”但随后,都觉得自己功劳特别大,于是僧人与僧人之间,居士与居士之间,就产生了矛盾。“造成了一个师父带着一伙居士,与另一伙人互相争斗。”

王敬凯听了张秋的陈述后,立即带着那把钥匙来到张秋家,亲自打开张家的门,认定那把钥匙确实是张家的,亦即张小波身上的那把。

城市交通智能治理是在此背景下提出的技术概念,通过信息使得有关各方在事实、政治和技术源流发展过程中,建立正确的具象价值观(针对具体问题),在沟通和讨论的基础上形成共识,进而取得在行动中进行有效的协同。

为了满足上述要求,城市交通信息平台建设需要引入一系列新技术。

这意味着城市交通大数据分析平台的服务对象,不仅是制定技术方案的有关各方,同时包含需要参政议政的相关各方。也就是说,平台一方面要将提高参政议政能力也视为自身的核心功能,设计不同于技术人员的数据视图,主动进行信息传递,避免参政人员盲人摸象。另一方面需要针对社会公众构建易于理解、全面反映问题的数据视图,实现上行和下行的信息沟通。

传统平台中的数据仓库并不强调主动性,但是支持智能治理的数据仓库则必须是实时主动数据仓库。城市交通进入大数据时代,将带来巨大的信息负荷,需要通过主动“推”的方式,及时地进行信息的传递与沟通。城市交通数据平台有责任根据实时变化的数据,发现诸如“系统演化已经偏离预判的轨迹,需要启动相应的研究以更新对问题的认识”、“系统演化出现了结构性的变化(例如网约车引发的供给侧结构变化),原有对问题的认识可能已经不再适用”、“系统出现值得重视的征兆,必须及时启动相应预案”等情况。大数据时代,数据平台不应仅满足于响应各种信息查询要求,而是主动推送相关信息给使用者,发挥智能化信息服务的作用。这不仅有助于防止懒政,也有助于非交通专业的决策关联者和社会组织等从发展和动态的角度理解城市交通,使得城市交通规划师和工程师摆脱孤军作战的尴尬境地,进而促进“价值-信任-协作”的治理过程。值得注意的是这种实时主动数据仓库与传统上应对被动查询的数据仓库具有很大的技术差异,会产生许多独特的问题需要加以解决。

40 years’ history of China cosmetics advertisement 8 46

政府购买社会服务一方面给社工组织的发展带来了前所未有的机遇,仅从数量上看,广州市近两年来社工组织如雨后春笋般涌现,根据广州市社会工作协会的统计资料,截至2012年底广州市的社工机构达至121家②。但另一方面社工组织的经费、场地等主要资源来自政府的服务购买,服务方案以及具体的服务实施也要与政府的理念与要求契合,社工组织在专业自主性方

智能治理需要广泛的参与面,这就需要一种适应众筹和集成研讨要求的运作模式,对于一个具有不同利益、目的和立场的参与者,对由众多技术单位提供数据资源和智能计算服务的数据平台来说,规则的遵守是极为重要的,失控的运作模式必将导致平台的不可持续。技术保障要求中最为重要的是数据可信和(尊重知识产权基础上的)模型共享。换句话来说,利用数据平台参与治理过程的有关各方需要遵守一些规则,包括对自己发表的数据负责,使用共享模型时需要尊重知识产权,以及遵守数据使用许可等。因此,平台运行需要建立在某种信用机制基础上,灵活融入物联网和区块链(千万不要将区块链局限于比特币,其最大的价值是数据的不可篡改和多方维护特性)技术,将形成一种客观信用体系,从而使得城市交通数据平台能够建立基于智能合约的运作模式。

城市交通是一个不断发展的复杂适应系统,许多问题是在发展的过程中逐步提出的。由于设计阶段完全不可能固化未来的全部决策分析作业需求与流程,因此支持城市交通决策分析的信息系统,不能采用基于固化的工作流来确定功能需求。因此,很多设计者采用了现实主义的技术路线,在构建一个基础性数据系统时,强调先把数据资源汇集起来,并通过主题方式组织相关的数据查询。至于利用这些数据资源来完成决策分析工作,则留待未来逐步完善。这种处理方式对于一般数据仓库系统来说是没有问题的,但是对于城市交通大数据分析平台来说却是存在明显的缺陷。

2 城市交通大数据分析平台建设的技术路线讨论

城市交通大数据分析平台不能采用摸着石头过河的方式进行设计,其主要原因正是在于“大数据”。作为一种大的数据资源来说,其存储容量和管理远远超出了一般人的想象。例如百万路级的视频数据,一个月的数据量就可以达到EP级。但是一个月对于许多交通行为和模式变化规律来说,只是一个很短的观测时间片段,无法满足研究演化规律的需求。显然,我们不可能也不应该将全部的海量数据存储起来等待以后使用,而是需要将海量数据划分为原始数据级、基础数据级、轻度抽象数据级和高度抽象数据级,设计相应的存储和管理方案。既然是抽象就要去粗取精,这就有赖于认识论/方法论的指导,确定各个级别的数据内容与结构。这种涉及数据仓库结构的数据模型,需要在系统设计阶段就加以明确,否则会出现后期使用才发现数据资源细节不够等问题,甚至具有导致系统崩溃的可能性。

为了定量的反应波速大小及波速梯度对冲击危险的影响,我们提出了应力波速异常系数(AC)和波速梯度异常系数(GC)两个概念,即:

当城市交通大数据平台建设成为热点之后,不同技术背景的参与者在平台设计构想中实际上存在显著差异。如果从技术主线来说,可以分为“摸着石头过河”和“认识论/方法论导向”两大类型。当然,现实中许多系统并不能绝对泾渭分明地划分,但是实践中还是处处体现出两条主线的不同程度影响。

大数据分析平台不意味着不加选择地向其中收纳数据,但是同时也需要注意到历史数据的缺失是不可能通过回溯方式加以弥补的。因此在系统设计阶段必须对城市交通大数据分析平台需要收入的数据加以确定,既要避免不加选择的膨胀系统,也要避免有价值数据的缺失。为此要以城市交通的认识论/方法论为基础,确定观察研究对象的方法,以及由此产生的数据观察要求。城市交通大数据绝非简单的量大,而是强调从多角度、多层次、多方式进行连续观测。对于问题认识的不正确,往往会遗漏重要的观察角度。

城市交通发展的复杂性,来源于适应性主体不断根据环境和外部条件的变化调整自己的选择行为,这就要求我们必须关注于具有社会属性的“人”的信息,包括习惯、偏好和态度等。传统的意愿调查可以获得不同类型人群的选择行为信息,但是受到样本数量局限很难把握不同类型人群的空间分布。对于这类不可或缺的信息,需要确定小样本调查数据与大样本观测数据的概率映射关系。也就是说,在数据平台建设的同时,需要制定相应的补充调查机制,以及建立数据间链接的方法,以保障信息的相对完整性。

现实中可以明显地看到城市房价空间分布对于职住关系产生重大的影响,大数据平台如果不能将有关数据纳入其中,将来使用时就难以解释某些职住空间关系的产生原因。房价的空间分布情况受到多种因素的影响,且不断发生变化,相应的数据采集方法和规则,也是城市交通大数据分析平台建设初期必须加以确定的问题。

相关研究表明,人的空间活动行为还需要从时间轴上加以解释。我国尚未建立定期按照一定采样规则进行的居民生活时间分配调查的制度,使得对于城市交通与居民生活质量的关联,以及交通网络与公共服务设施的协同等问题,难以获得有效的数据支撑。必须补充建立调查制度,并建立数据间关联信息的问题。

城市交通的理论和方法不是一片荒芜之地,数十年来大量的研究工作、调查分析和规划设计实践,积累了宝贵的经验和资料,也形成了非常有价值的理论与方法。大数据所带来的变革,需要在尊重已有规律认识,以及建立与历史认知关联的基础上展开,轻易否定已经形成的理论、方法、经验,重打锣鼓另开张地构建毫无相关性和继承性的新体系,这并不是一条正确的技术路线。这就需要基于已有研究成果,对系统运行特征进行分析,判断研究对象的系统属性。例如,对于不确定性的成因,究竟是随机系统属性,还是混沌系统属性,由此导致的分析要求和对策设计方法均有巨大的差异。

简而言之,城市交通大数据分析平台的构建,需要针对一个具有复杂适应系统特征的研究对象,建立一个包含历史变化追溯能力、行为主体社会属性说明能力、空间行为观测能力的多维观测体系,以适应系统控制、需求管理和系统规划等方面多样性的需求。缺少对于观测体系框架科学合理的判断,简单地将已经获得的部分大样本数据塞进数据仓库构建而成的信息系统,很可能犹如跛脚巨人,并不能对城市交通对策体系产生革命性影响。在系统设计过程中,认识论和方法论的作用,是指导我们正确地搭建多维观测体系。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

关于城市交通大数据分析平台建设的两点思考论文
下载Doc文档

猜你喜欢