基于改进线性回归模型的民航货物周转量预测
王 琪1李继唐2
(1.东北林业大学交通学院,黑龙江 哈尔滨 150040; 2.东北林业大学林学院,黑龙江 哈尔滨 150040)
摘 要: 采用遗传算法对线性回归模型中的求参过程进行优化,以期提高民航货物周转量预测模型精度。首先运用线性回归模型对民航货物周转量进行预测,结果预测准确率为0.83;之后采用遗传算法进行优化,且当交叉默认概率P c =0.85,变异概率为P m =0.01,所得预测结果最优,准确率为0.94。结果表明:利用遗传算法对线性回归模型进行优化能够提高民航货物周转量预测精度。
关键词: 线性回归模型,遗传算法,民航货物周转量
1 概述
伴随着我国社会主义市场经济的快速发展,作为生产和消费中间环节的交通运输业在发展中的重要作用日益突出。为保证市场的长久向上向好发展,加强交通运输业的管理运行水平势在必行。民用航空运输作为现代化快速运输方式,是其重要组成部分。随着消费水平、生活水平的提高,民航货运需求大幅度上升。中国的航空运输系统在改革开放后得到了快速发展,但总体上仍处于规模小、发展不平衡的成长期。通过合理的预测民航货物周转量,将有利于制定合理的基础设施建设规划,完善其管理运行方法,使其良好适应增长的航空货运需求,有效促进民航货运的快速发展。同时,这将促进交通运输业的多元化系统建设,满足未来货运发展需要[1-3]。
为了保证预测的准确性,选择合适的模型尤为重要。曾广东等人在GM(1,1)对数据进行预测的基础上,采用一种信度马尔科夫链对结果进行修正,新方法引入了Dempster-Shafer(DS)证据理论来描述相对误差所处状态分类的不确定性,建立基本概率指派函数,然后对灰色马氏链的转移概率矩阵进行重新构造,最后根据近期相对误差所处的状态得到将来的状态,进而修正预测结果提高了对货物周转量预测的精确度[4]。李之红等人采用数理统计的方法,得出了三大产业生产总值和5种运输方式所承担货物周转量的相关关系函数,并以此确定了综合货运网络各种运输方式的里程规模。结合当前常规数据结构,建立不同运输方式所承担货物周转量合理比例的多目标货物周转量比例计算模型(CCTV Model),并基于运输效率、运输效益、对经济增长的贡献分别确定了合理货物周转量构成比例[5]。
但是,线性回归模型在某些情况下预测的准确率难以保证。李祚泳等人针对高维、非线性环境系统的传统预测模型存在结构复杂、收敛速度慢、求解精度低的局限,提出对环境系统预测量及其影响因子进行幂函数与对数函数相结合的规范变换,规范变换与误差修正的一元线性回归预测模型简单、预测精度高、稳定性好,不存在“维数灾难”,因而可广泛用于任意系统的预测建模[6]。本文将采用遗传算法对线性回归模型进行优化,以提高线性规划模型在铁路客运量预测中的准确率。
在弹体打击岩石条件下,弹靶间形成应力波并向地下传播,在冲击波或接近于冲击波的短应力波中,岩石介质压缩行为是在受限条件下发生的[7],从物理力学本质上讲,岩石介质的变形状态可以用刚性壁圆筒中的单轴压缩描述。设沿圆筒的轴向应力σr为垂直于弹靶接触面的法向应力;沿圆筒的径向应力σθ为平行于弹靶接触面的切向应力。由于应变仅发生在轴向,因此,这时,体积应变ε约等于轴向应变εr,径向应变εθ约为0。
2 预测模型
2.1 研究数据
本文研究数据为1990年—2017年全国民航货物周转量(数据源于《中国统计年鉴2018》),数据集如表1所示(货物周转量单位:亿吨公里)。
表1 1990年—2017年民航货物周转量
其中,f 为预测模型;p n 为多项式f 的各项系数;n 为多项式的次数;L 为向量的二范数,即该模型的损失函数[9]。为了确定多项式的次数,本文在python3.6环境下编程(下同),训练后输出函数图像如图2所示(为了使函数更加直观,输出函数的多项式次数取1,3,5)。
1.5.2 单因素分析 将确诊CRPC年龄、血尿、血尿持续时间、骨痛、骨痛持续时间、骨转移、骨转移数、抗骨转移治疗次数、淋巴结转移、淋巴结转移数目、其他脏器转移、Gleason评分、CHO、HGB、TPSA、f/t PSA、中医证型、中药联合治疗18项可能的预后影响因素纳入SPSS 19.0进行统计分析。用Kaplan-Meier法对可能的预后因素进行单因素分析,筛选出CRPC预后危险因素,绘制生存曲线,生存率的比较用log-rank检验。
(1)
本研究利用快速窖泥质量评价方法快速对四川某酒厂不同年份的窖泥进行了评分,结果基本与该厂的实际生产状况一致。未来工作将进一步对窖泥质量相关指标进行筛选,探究与窖泥感官指标相关的实验参数,完善评分体系,使其更加客观、准确。
家长协助填写学生阅读书目及字数,老师从学生的阅读手册得知各小组的阅读量。《语文课程标准(2011年版)》要求的“低年级段课外阅读总量不少于5万字”,有的小组不到一学期就完成了。
输出各预测模型多项式系数p n 和损失值如表2所示。
其中,为X (年份)的均值;std(X )为X 的标准差。标准化后的数据分布如图1所示。
2.2 线性回归模型
一元线性回归模型根据输入量和输出量的定量关系得出近似直线的函数,民航货物周转量数据在散点图上表现为曲线式增长,因此本文采用多项式拟合来构建预测模型。建模过程如下:
f =p 0x n +p 1x n-1 +…+p n-1 x +p n
(2)
(3)
民航货物周转量数据是随年份变化的时间序列,因此年份序列为输入量x ,周转量为输出量y 。为了使数据分析简单化,需要对输入量进行标准化[8],标准化过程如下:
预处理后的数据呈比较明显线性递增趋势,因此本文采用一元线性回归模型对民航货物周转量数据进行预测。取1990年—2014年的数据为训练集,2015年—2017年的数据为测试集。
表2 输出值
所得函数损失值随次数增加而减少,损失值越小说明拟合效果越好,但根据输出函数图像,在多项式次数大于5以后呈现出明显的过拟合现象[10],因此本文不考虑多项式次数大于5的情况。
经过对比发现,当多项式次数为2时,预测准确率为0.83,平均误差为37.81,预测效果最好,因此选取最佳预测模型为:
为了选出最佳预测模型,本文应用所得5个预测模型对民航货物周转量数据进行预测,所得结果如表3,图3所示。
表3 预测结果
在高中习题变式过程中,教师所选择的原题都首先应以课本中的习题为主.因为这些习题是通过专家学者们在多次的研究以及测试之后所设计的.所以在教学过程中,教师可以直接以课本中的习题为载体,采用一题多变,多题一解的方式来让学生充分地理解基础知识,同时扩展学生的思维.
f =16.09x 2+56.92x +60.08
(4)
2.3 遗传算法优化模型
本文采用遗传算法优化选取模型的多项式系数求解过程,整体优化过程如图4所示。
遗传算法执行时,应用程序随机生成50个个体,为使运算提高效率和精确度,种群范围设置为:
(5)
其中,为优化后的多项式系数。
向量的二范数越小则适应度越高。因此,式(3)为适应度的目标函数。整体进行交叉操作的概率p m =0.85,每个位进行交换的概率p e =0.5,即个位交叉随机。变异概率p m =0.1,最大迭代次数为100,步长设置为0.6。运行后得到优化模型为:
f =19.97x 2+67.84x +60.08
(6)
将其应用到民航货物周转量预测,得到的结果如表4所示。
表4 优化模型预测结果
3 结语
本文采用线性回归模型对民航货物周转量进行预测,然后利用遗传算法优化该模型参数计算过程,并将优化后的模型应用进行测试,得到结论如下:利用遗传算法改进线性回归模型可以提高民航货物周转量的精度。优化后的模型,准确率相对提高了0.11,平均误差减少了26.23,预测结果较为准确。
参考文献:
[1] Rodrigo A.Garrido,Hani S.Mahmassani.Forecasting freight transportation demand with the space-time multinomial probit model[J].Transportation Research Part B,2000,34(5):56-57.
[2] 杨丽蓉,吕红霞.基于粗糙集与熵的铁路货物周转量预测[J].铁道科学与工程学报,2018,15(3):778-784.
[3] 朱大鹏,李严锋,曹 杰,等.基于改进的灰色模型对货物周转量的预测——以云南省货物周转量为例[J].物流科技,2012,35(1):1-5.
[4] 曾广东,赵春翔,许涛涛,等.基于信度灰色马尔科夫模型的广东省货物周转量预测[J].物流技术,2015,34(24):98-102,114.
[5] 李之红,袁振洲,许旺土.综合货运网络规模及货物周转量算法研究[J].北京交通大学学报,2014,38(3):32-37,43.
[6] 李祚泳,魏小梅,汪嘉杨.规范变换降维与误差修正结合的环境系统的一元线性回归预测[J/OL].环境科学学报,2019(1):28.
[7] 胡 洋,马钦海,王鹤棋.物流企业员工服务导向影响因素多层线性回归检验[J].统计与决策,2019(1):182-185.
[8] Li Li,Xin Li,Yuan Yang,et al.Indoor tracking trajectory data similarity analysis with a deep convolutional autoencoder[J].Sustainable Cities and Society,2019,45(6):71-72.
[9] Arsad,P.M.,Buniyamin,N.,Ab Manan,J.-L..Neural Network and Linear Regression methods for prediction of students’ academic achievement[P].Global Engineering Education Conference(EDUCON),2014 IEEE,2014.
[10] Penghua Li,Fangchao Hu,Yinguo Li,et al.Speaker identification using linear predictive cepstral coefficients and general regression neural network[P].Control Conference(CCC),2014 33rd Chinese,2014.
Prediction of civil aviation cargo turnover based on improved linear regression model
Wang Qi1 Li Jitang2
(1.School of Transportation ,Northeast Forestry University ,Harbin 150040,China ; 2.College of Forestry ,Northeast Forestry University ,Harbin 150040,China )
Abstract: In this paper, genetic algorithm was used to optimize the parameter extraction process in the linear regression model in order to improve the accuracy of the prediction model of civil aviation cargo turnover. Firstly, the linear regression model was used to predict the cargo turnover of civil aviation, and the prediction accuracy was 0.83. After that, genetic algorithm was adopted for optimization, and when the default crossover probability P c =0.85 and the mutation probability P m =0.01, the predicted result was optimal with accuracy of 0.94. The results show that the optimization of linear regression model by genetic algorithm can improve the prediction accuracy of civil aviation cargo turnover.
Key words: linear regression model, genetic algorithm, civil aviation cargo turnover
文章编号: 1009-6825(2019)15-0177-03
收稿日期: 2019-03-07
作者简介: 王 琪(1997- ),女,在读本科生; 李继唐(1998- ),男,在读本科生
中图分类号: F251
文献标识码: A
标签:线性回归模型论文; 遗传算法论文; 民航货物周转量论文; 东北林业大学交通学院论文; 东北林业大学林学院论文;