基于BP神经网络的铁路旅客流量预测分析论文

基于BP神经网络的铁路旅客流量预测分析

李佳承1凌传玉2宋丽娟3

(1.重庆医科大学附属儿童医院 内科教研室,重庆 400014;2.中国人民解放军91033部队,山东 青岛 266000;3.中国人民解放军陆军军医大学 基础医学院数学教研室,重庆 400038)

摘 要: 结合2016年数据挖掘竞赛的铁路旅客流量预测案例,寻找影响铁路旅客流量的重要因素,通过分析其影响规律,采用BP神经网络模型预测未来两周的旅客流量,阐述了数学建模中的BP神经网络在实际问题中的应用过程和模型求解方案,同时借助平均相对误差对模型的预测效果进行评价,为铁路旅客流量变化的预测提供新的策略。

关键词: 数学建模;旅客流量;BP神经网络;预测

一、前言

数据挖掘是当下社会、经济和其他相关领域在大数据时代下提出的重要研究内容。它以处理实际生活中存在的诸多问题为目的,通过对大数据库中海量信息的挖掘,找到具有代表意义的,反应问题实质的数据样本,以数学建模的形式,将问题简化、合理化。数据挖掘的关键在于如何从海量的数据中找到客观存在的规律,灵活地运用数学知识建立相适应的数学模型来进行求解。本文选取了2016年数据挖掘竞赛中的铁路旅客流量预测案例,详细分析影响铁路流量中各因素的影响规律,并给出BP神经网络的预测过程。

二、问题阐述

铁路客运在研究国家旅客运输发展战略中是一个重要的研究方面。而掌握铁路旅客运输需求是研究铁路旅客运输的重要前提。它对于近期的客流计划编制及今后路网建设、运力布局、运输政策制定都有重要的参考价值。根据发改委发布的《关于改革完善高铁动车组旅客票价政策的通知》,将由铁路总公司(简称铁总)根据市场情况自行定价的政策的出台,铁路部门需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路等因素的具体情况,才能更好地实现利润的最大化[1-3]。其中,能够有效地了解和预测客流量是准确把握市场动向的首要条件,因此铁路客运流量的预测是发展的重要研究内容。

体育事业是我国社会事业重要组成部分,按照党和国家政策方向调整体育事业发展基本思路,在我国社会主义事业整体布局中谋划体育事业战略。

三、因素分析

在实际生活中,存在诸多因素会影响铁路客流量。一方面,节假日客流量的冲击。例如“春运”期间铁路客流量骤然增长,导致铁路运营能力无法满足旅客数量的要求。相较而言,非节假日情况下,多数冷门线路的上座率远远不足,造成铁路资源的浪费。另一方面,出行天气也常常影响该天铁路客运流量。例如在大风、阴雨等恶劣气候条件下,更多出行的旅客会选择铁路这一相对安全的出行方式。此外,还有多个因素会影响铁路在实际运营中的客运流量,需进一步思考和挖掘。通过查阅相关文献和2016年数据挖掘竞赛提供的数据,本文拟考虑的影响铁路客流量的因素有:车次类型、车站规模、列车始发时间、周末和节假日、出行天气情况。具体分析如下:

(一)车次类型

分析车次类型对于旅客流量的影响规律,一方面考虑到不同列车的运营速度和车票价格会影响旅客对于车次类型的选择,导致不同类型列车的载客流量存在一定差异,所以选取普快列车(K01)、特快列车(T01)、直达列车(Z02)、动车(D02)、高铁(G01)五种车次类型的旅客流量数据,分析不同车次类型对于旅客流量的影响规律;另一方面考虑到相同车次类型中,也会受到运行时间、距离和旅客意愿等因素的影响,所以选取动车组D02、D05、D08、D13、D16次列车的旅客流量数据,分析同一车次类型对于旅客流量的影响规律。通过单因素方差分析的方法,我们可以得到不同车次旅客流量是否存在显著性差异。

从图1和表1中可以得出车次类型对于旅客流量的影响规律,直达列车(Z)和特快列车(T)的月均旅客流量明显高于普快列车(K)和高铁(G),其差异性检验 p<0.05。动车(D)是所有列车车次中月均旅客流量最低的(p<0.01)。

图1:不同车次类型和同一车次类型在不同月份的旅客流量变化曲线

表1:不同类型车次和同一类型车次旅客流量的均值比较 (*:p<0.05, **: p<0.01)

(二)车站规模

旅客在选择出行时间方面也是有所要求的,相较而言白天出发的列车旅客流量会明显高于夜晚发车的列车,而在白天中,上午以10时为一个高峰,下午以14时-18时为一个高峰。这一结论提示我们:旅客在出行时间的选择上有明显的偏好,因此在旅客高峰的时间段应该通过加大铁路运营能力,以满足旅客对于出行的需求。

图2:不同车站年平均旅客流量条形图

(三)列车始发时间

从实际生活中可以发现,一线城市的年均旅客量明显高于二、三线城市,而同一个城市中规模最大,载客量最大的车站年均旅客流量也明显高于同城市的其他车站,这样的现象在北京、上海、广州这样的中心城市尤为明显。因此为分析ZD111、ZD326、ZD250和ZD190四个地区的旅客流量,得到四个地区中14个车站的旅客流量,并绘制得到年平均旅客流量条形图,同时标注出中位数以及四分位数点以显示其离散成度。

图3:全天24小时内每小时的平均旅客流量

(四)周末和节假日

图4:D02次在2015年1月1日-2016年3月20日旅客流量变化曲线(A)及2015年5月旅客流量变化曲线(B)

(五)出行天气情况

出行时的天气情况会影响旅客选择的交通工具。随着交通技术的发展,越来越多的交通工具供大家选择,铁路已经成为一种相对传统的交通工具。但是在天气情况相对恶劣,如遇到大风、暴雨时,铁路往往成为旅客首选的出行工具。

悦管家从成立之初就带着“‘服务+科技’改造服务行业”的强烈使命感,这与悦管家的高管团队过去曾管理过数万名服务人员有关,CEO刘珺曾在银泰、百盛担任高管多年,其他高管也多来自于零售和电商行业,深刻理解服务结合科技之后产生的叠加效应。如今,用科技为家庭和企业后勤服务赋能的悦管家,经过三年的成长,成为新服务的标杆,并向着更高的服务品质开始升级。

2016年1月14日至5月6日,海南省审计厅分别对程立生、李向国任职期间的经济责任履行情况进行审计发现,程、李二人任职期间,学校违规发放津补贴及奖金412.41万元;学校部分费用支出通过员工个人账户完成最终支付,金额达2299.04万元;以虚假发票报销培训费支出208.36万元等问题存在。

本文以2016年数据挖掘竞赛中铁路旅客流量预测案例为依据,结合案例中提供的重要数据,分析得到影响铁路旅客流量变化的四种因素:车次类型、车站规模、列车始发时间、节假日(周末)以及出行天气情况对旅客流量影响的规律:

图5:四个地区旅客流量与天气情况的关系

四、BP神经网络预测

那么以2015年1月1日-2016年3月20日间每一天14个车站的旅客总人流量梯形图为矩阵以及每天的天气情况和当天是否为节假日(“平时”=0,“周末”=1,“节假日”=2)训练得到BP神经网络。为了模型在训练时有更快的收敛速度,我们将数据按照公式3进行归一化处理:其中,ymax=1,ymin=-1,x为需要归一化的数据。

BPNN的中心算法——BP算法是利用输出后的误差来估计输出层的直接前导层的误差,再利用这个误差估计更新前一层的误差,如此一层一层地反向传播下去,就获得所有其它层的误差估计。进而形成了将输出层表现出的误差沿着与输入传送方向相反的,逐级向网络输入层传递的过程[5,6]。如图6给出了旅客流量预测的三层BPNN的结构,其中输入层为天气情况(包括天气x1、温度x2和风力x3)以及周末、节假日x4(4个输入节点)、隐含层(9个隐含节点)、输出层为旅客流量(1个输出节点),其中隐含层神经元数量的确定根据公式2[7]

图6:旅客流量预测的三层BPNN的结构示意图

BP神经网络(Back Propagation Neural Network,BPNN)的学习算法是δ学习规则[4],其目标函数为

为了更好的检测BPNN的预测结果,因此训练得到的BP神经网络模型基础上,预测2016年3月1日-2016年4月3日(共34天)的旅客流量变化,其中3月1日-3月20日作为检验样本,将预测的旅客流量与实际数据进行对比,通过公式4就可以得到预测模型的平均相对误差E。而3月21日-4月3日的预测结果就是本次数据挖掘的预测目标。

图7:单个车站预测及检验旅客流量曲线图

如图7所示,根据4个指标因素预测得到的未来2周内的旅客流量变化与之前分析各因素得到的规律相吻合,说明预测结果有效。此外2016年3月1日-20日的预测和实际值比较发现:平均相对误差为E=6.893%,说明本文所选用的模型预测有效。

关于天气、温度以及风力风向在2015年1月1日-2016年4月28日(共计477天)的所有数据,我们首先将3个指标中的文字进行量化:天气情况中,“晴”和“多云”定义为1,“降雨”或者“降雪”定义为0,所以天气这一指标中只存在0或者1(0代表天气情况差,1代表天气情况好);温度和风力都取该天温度范围和风力范围最大值的均值。图5分别给出了四个地区的旅客流量随天气情况、风力的变化结果。

表2中给出的数据分别给出从车站i上车,到车站j下车的旅客人数,如第三行第二列“432”表示在ZD111-01站上 车到ZD311站下车的旅客共432人。

同时,应用BP神经网络模型对2016年3月21日-4月3日的旅客流量进行为期2周(14天)的预测,并给出部分预测结果(2016年3月21日)如表2所示。

表2:BP神经网络模型预测结果(仅显示2016年3月21日)

五、结果分析与讨论

(1)测区内地层含黄铁矿化及岩浆活动影响,个别岩矿石物性特征趋近,地球物理异常特征相近。在物探工作开展前,测量测区岩石标本物性参数,了解标本物性参数情况,是做好物探工作的前提。

(1)直达列车(Z)和特快列车(T)的月均旅客流量明显高于普快列车(K)和高铁(G),其差异性检验 p<0.05。并且动车(D)是所有列车车次中月均旅客流量最低的(p<0.01)。

呈味氨基酸包括呈鲜味、甜味和苦味。呈鲜味的氨基酸有天门冬氨酸和谷氨酸。测定结果表明,A1组呈鲜味氨基酸在鸡胸肉、腿肉和肝脏中分别为0.077%、0.073%和1.030%,B1组鸡胸肉、腿肉和肝脏中分别为0.031%、0.084%和1.630%。表明在舍养条件下,无抗养殖鸡肉中呈鲜味的氨基酸明显高于有抗养殖,而鸡肝则有抗养殖的呈鲜味氨基酸含量更高。

(2)同一地区中心车站的旅客流量会显著高于其他普通车站。由于数据限制,未能比较出不同地区的中心车站旅客流量存在差异的客观原因。

(3)白天出发的列车旅客流量会明显高于夜晚发车的列车,而上午以10时和下午以14时-18时为全天旅客流量变化的两个高峰。

(4)周末以及节假日的旅客流量会在平均旅客流量水平有很明显的增加,特别是周五、周日以及节假日第一天和最后一天的旅客流量会出现高峰。

(5)天气情况较良好的情况下,铁路旅客流量会有一定程度的降低,而恶劣的天气情况下,旅客流量会相对增加。

综合上述规律,我们以包括天气、温度和风力以及周末、节假日作为因素指标,旅客流量作为输出变量,输入2015年1月1日-2016年3月20日全程数据,建立并训练BP神经网络,最终预测得到2016年3月1日-2016年4月3日的旅客流量梯形图。预测结果的平均相对误差E =6.893%,证明BP神经网络预测结果有效。

知识服务源于20世纪90年代,是在知识经济浪潮和信息技术发展推动下,适应社会对知识共享与创新的需求而产生的。通过归纳总结,发现各学者对知识服务的研究主要集中在“定义、特征、流程、系统”等方面。而专门针对知识服务的经济后果的研究,各学者尚未进行专题研究。

参考文献:

[1]李建斌. 武广高速铁路旅客出行特征和集散特性调查与分析[J]. 铁路标准设计, 2011(11):1-4,10.

[2]晏平. 大连站旅客流量及其特征分析[J]. 大连铁道学院学报, 1996, 17(1):65-69,74.

[3]赵宇刚,戴新鎏. 我国铁路客运市场发展趋势研究[J]. 铁道经济研究, 2015(1):24-27.

[4]张良均,杨坦,肖刚,等. MATLAB数据分析与挖掘实战[M]. 北京:机械工业出版社,2015.

[5]陈明,等. MATLAB神经网络原理与实例精解[M]. 北京:清华大学出版社,2013.

[6]郭文,乔谊正.基于遗传优化神经网络的铁路客运量预测研究[J]. 山东理工大学学报(自然科学版),2008,22(3):25-28.

[7]王卓,王艳辉,贾利民,等.改进的BP神经网络在铁路客运量时间序列预测中的应用[J]. 中国铁道科学,2005,26(2):127-131.

基金项目: 陆军军医大学基础医学院青年教师支持计划

中图分类号: F530.32;O29

文献标志码: A

文章编号: 1674-537X(2019)04.0053-04

标签:;  ;  ;  ;  ;  ;  ;  

基于BP神经网络的铁路旅客流量预测分析论文
下载Doc文档

猜你喜欢