指数平滑结合条件Markov预测模型研究
——基于新疆货运量预测
(新疆财经大学,乌鲁木齐市,830012) 吕冬梅
摘要 建立了一个时间序列预测模型。以三次指数平滑模型为基本预测模型,并基于马尔科夫链定义了误差修正模型--条件马尔科夫链。条件马尔科夫链的特点在于将传统马尔科夫链中的一步状态转移概率矩阵变成条件一步状态转移概率矩阵,即在条件马尔科夫链的状态转移概率矩阵中,每个元素的意义为:在已知t-1时刻的状态下,t时刻的状态转向t+1时刻状态的概率:即P{(Et→Et+1)/Et-1}。在文章中以新疆货运量为实验对象,通过对新疆货运量这一指标用三次指数平滑模型,用三次指数平滑模型结合马尔科夫链和三次指数平滑模型结合条件马尔科夫链三个模型进行预测,结果显示,经过条件马尔科夫链修正后的预测结果误差最小,证明文中模型可以有效提高预测精度。
关键词 时间序列;三次指数平滑;条件马尔科夫链;误差修正
1 前言
目前马尔科夫模型主要运用在语音识别、股票预测、环境质量、文字信息、信息安全等方面[1-3],这些具体实例应用的方法主要是利用马尔科夫理论具有平稳性的特性,并利用经验概率来创建初始概率分布和状态转移矩阵,从而构造马尔科夫模型,进而进行具体问题的预测研究。陈嘉晋[4]等利用马尔科夫链模型来预测股票价格未来短期变动趋势,得出马尔科夫链模型在短期股价预测方面总体令人满意。何众颖等[5]建立三次指数平滑与灰色马尔科夫链预测模型相结合,建立船舶到港量的灰色马尔科夫链优化预测模型。刘历波[6]等提出一种灰色-马尔科夫预测模型,并结合河北省某地区的159 座桥梁数据进行预测,得出该方法具有更高的精度和稳定性。本文提出一种条件马尔科夫模型与三次指数平滑相结合的预测方法,通过三次指数平滑的预测结果来确定条件马尔科夫模型中的条件一步状态转移矩阵,最后结合新疆货运量数据进行应用检测。
新世纪以来,中国政府在扶贫领域进一步加强了与全球减贫的“互动”交流。2004年5月,首次“全球扶贫大会”在我国上海召开,来自120余个国家和地区的代表在此次大会上交流扶贫经验,并共同签署了《上海减贫议程》,这进一步增强了国际社会的减贫共识。2005年5月,中国国际扶贫中心成立,这一机构架起了我国与国际组织扶贫合作与交流的重要平台。2015年9月,在联合国发展峰会上通过了一份关于全球减贫的新计划——《2015年后发展议程》。
2 理论介绍
指数平滑法(Exponential Smoothing,ES)是布朗(Robert G..Brown)所提出,布朗认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;他认为最近的过去态势,在某种程度上会持续到未来,所以将较大的权数与近期数据做匹配。指数平滑法是生产预测中常用的一种方法,也用于中短期经济发展趋势预测,在许多经济预测方法中,指数平滑是用得较多的一种。简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。一般常用到的指数平滑法为一次指数平滑、二次指数平滑和三次指数平滑。
2.1 确定初值
不管什么指数平滑都会有个初值,假如数据大于20 项,那么初值就可以认定为第一个数据,或者利用下列公式计算也行;假如数据小于20 项,则初始值为:
2.2 确定指数平滑系数α
指数平滑系数的确定一般依赖于四条规则:
将二次指数平滑模型、三次指数平滑模型用于新疆货运量数据的预测,预测结果见表1。
2.3 预测模型
(2)条件状态转移概率修正误差过程
给定平滑系数,二次指数平滑的计算公式为:
采用一步预测,只需求得误差率的状态一步转移概率矩阵,将其作为权重用于修正指数平滑法预测结果的误差,会使得误差减小,预测结果更加精确。
其中:
(2)三次指数平滑:
给定平滑系数,三次指数平滑的计算公式为:
4、条件马尔科夫修正误差率原理
主桁采用不带竖杆的华伦式三角形腹杆体系,节间长度10.5m,主桁上弦采用折线形,主桁高度10.5~17m;两片主桁中心距为27.5m,桥面宽26m;主桁上、下弦杆及端斜杆采用箱形截面,截面内宽为800mm,内高为1400mm,采用焊接整体节点。其余斜腹杆采用箱形截面及H型截面。箱形腹杆采用对拼连接方式,H形腹板均采用插入连接连接方式。
开阔自己的视野,丰富自己的阅历,除了如上介绍的亲身实践之外,另一个角度就是读书,作为一名初中青年数学教师,可以先从下列几本书开始自己走上工作岗位后的阅读史:《在书房与教室间穿行的教研人生(裴光亚著)》、《感悟初中数学之道(苑建广著)》、《生长数学:卜以楼初中数学教学主张(卜以楼著)》,通过阅读以上三本著作可以感受“大家”的成长之路,甚至可以“穿越”回他们当年的“青椒岁月”,对自己的专业成长之路具有很好的指引作用;除此之外还可以阅读一些专业性更强的经典书籍,比如《古今数学思想》、《怎样解题》等,正所谓当你读完一本经典著作的时候,不仅仅是走进了数学的殿堂,而是将你指引向了更高的知识的山峰.
其中:
预测未来期的值的计算公式为:
预测未来期的值的计算公式为:
(1)一般状态转移概率修正误差过程
鄂麦398是根据主攻高产,优化品质,兼顾抗病(逆)的育种目标,采用安徽省、湖北省、江苏省综合性状优良的品种作为遗传供体,配制杂交组合皖1216/25871//扬麦13,后代采用改良系谱法辅之以品质测试、多点异地鉴定选育而成[1,2]。
预测第t期,首先算出t期以前的一步状态转移次数矩阵
其中,Pij:状态i(Ei)转移到状态j(Ej)的次数。由该矩阵得到一步状态转移概率矩阵:
其中,
若t-1时刻状态为Ek,并且状态区间值对应值为Yk,则t时刻
(1)二次指数平滑:
以新疆1995 年~2015 年的货运量这一指标数据为基础,用三次指数平滑结合条件马尔科夫链模型进行数值验证。
3 新疆货运量预测应用
第t-2 时刻状态为Ea,t-1 时刻状态为Eb,根据t时刻以前数据得到在t-2 时刻状态为Ea 的条件下,t - 1 时 刻 状 态 为Eb ,t 时 刻 由Eb 转 移 到E1、E2、……En的状态转移概率矩阵Ebn,该矩阵为1*n的矩阵,矩阵内元素和为1,若矩阵和为0,则默认t 时刻状态仍为Eb,其中a,b=1、2、……、n。最终t时刻
3.1 基础模型(指数平滑模型)的确定
数据容量小于20,则令初始数据为:
绍兴三十一年(公元1161年),南宋史学家郑樵,撰写完成综合纪传体通史《通志》。全书共200卷。郑樵在《通志》的《艺文略》与《校雠略》等部分中,自创了图书分类十二分法与系统提出了以藏书整理为核心、以流通利用为目的图书管理思想。
确定三次指数平滑模型的平滑系数。首先做趋势图,如图1所示:
图1 时序图
从图1可以看出,该时间序列有较小波动,但长期具有较稳定的上升趋势,平滑系数应采用0.1 到0.4之间。为保证严谨性,本文在计算时,将平滑系数分别取0.1、0.2、0.3、0.4、0.5五个值代入三次指数平滑这一基本预测模型中,求得预测误差,结果如图2 所示。从图2 可以看出,当平滑系数取0.1 时,预测结误差是最小的,即效果最好。最终确定平滑系数为0.1。
作为公共必修课,高校思想政治理论课往往采取大班上课的形式,每个教学班有一百人左右。开展活动时,需要将班级学生划分成小组,每组三到五人,并排好先后顺序。如果一个班是由几个小班或不同专业的人组合而成,可以由各班级轮流展开,具体小组的人员组合由学生自己确定,最大可能地发挥学生的自主性。时事新闻评论可以每周进行一次。每组学生课下进行充分准备,上台展示前要将展示的内容向教师报告,教师给予具体的指导和修改意见,由小组成员共同修改完善。每组展示的时间最长不超过15分钟,展示时教师要提醒学生注意时间限制,内容要简练,新闻要素要有条理,语言不能过于偏激。
图2 不同指数平滑系数预测误差对比图
(1)当时间序列呈现较稳定的水平趋势时,应选较小的α,一般可在0.05~0.20之间取值;(2)当时间序列有波动,但长期趋势变化不大时,可选稍大的α值,常在0.1~0.4之间取值;(3)当时间序列波动很大,长期趋势变化幅度较大,呈现明显且迅速的上升或下降趋势时,宜选择较大的α值,如可在0.6~0.8 间选值。以使预测模型灵敏度高些,能迅速跟上数据的变化;(4)当时间序列数据是上升(或下降)的发展趋势类型,α 应取较大的值,在0.6~1 之间。
由此可看出,小学生口算广度大致上是随着年级的增加而增加.以加法口算广度为因变量,以年级和性别为自变量,进行多元方差分析.结果表明,小学生加法口算年级差异显著,但没有显著的性别差异.具体为:不进位加法口算广度的年级差异显著(F=52.77,P<0.001),性别差异不显著(F=6.16,P=0.05);进位加法广度的年级差异显著(F=40.18,P<0.001),性别差异不显著(F=1.28,P=0.26).与文[2]的研究结果相比,除了在进位加法中6年级的口算广度较高,其它的广度都较低.这说明了,这十多年来学生的工作记忆能力有所降低,这或许与目前的课程标准中对识记性的要求有所降低有关.
从表1 中可以看出,三次指数平滑模型的总体预测效果优于二次指数平滑模型。三次指数平滑模型的预测结果显示,最大预测误差为26.91%,最小预测误差为-3.35%。二次指数平滑模型的最大预测误差为30.16%,最小预测误差为-3.40%。
二次指数平滑模型和三次指数平滑模型预测的误差结果如图3所示:
图3 二次三次误差对比图
表1 二次、三次指数平滑结果(一步预测)
表2 预测结果及误差表
如图3 所示,三次指数平滑模型的误差曲线波动更小,最终选择三次指数平滑模型为一步预测基础模型。
3.2 马尔科夫修正误差过程
由三次指数平滑模型(平滑系数为0.1)对1995年-2015年的货运量总量的一步预测误差区间为(-27%,20%),马尔科夫链模型最常设的状态个数为三到四个,鉴于误差区间较大,文中设置为四个状态。所以状态区间划分为:E1(-27%,-15.25%);E2(-15.25%,-3.5%);E3(-3.5%,8.25%);E4(8.25%,20%)。
我国大部分乡村既没有政府的扶持,也无外来团体的介入,村民成为建设的主力军。住宅、房前屋后的绿化、农田是建设的主要部分。村民自行实施的乡建是最能直接反映他们的实际需求的,但往往也是“个人化”的决策,需要通过思想动员和技能培训,引导村民更多从集体利益、长远效益出发进行建设,并且增强对乡土文化的自信等。
根据状态区间建立一步条件状态转移概率矩阵。
3.3 预测结果对比
基于2005~2015 年的数据,对条件马尔科夫——三次指数平滑预测模型、马尔科夫——三次指数平滑预测模型以及三次指数平滑模型三个模型的预测效果的检验。预测结果及预测误差见表2。
总之,“风俗”这一中国古代概念从其时空、人、地物的整体性出发,理解特定环境内群体的身体性、共享性与物质性,它与实践理论的取向相近似。但“风俗”不是“惯习”,它既是正式制度与日常生活的结合,也强调主体反思、社会规则与情感欲望,可以有力地推动和挑战实践理论的现有框架,这正是本文在最后一部分提出从“民俗研究”转入“风俗研究”的根本原因。
由表2 可以看出,三次指数平滑模型的预测结果的误差最大值为-21.61%,最小值为3.35%,平均误差率为10.04%,误差率在10%以上的比例为72%,一般马尔科夫修正误差后的预测结果的误差最大值为32.64%,最小值为-1.83%,平均误差率为0.45%,误差率在10%以上的比例为40%,条件马尔科夫修正后的预测结果的误差最大值为35.70%,最小值为-0.46%,平均误差率为0.39%,误差率在10%以上的概率为9%。综上可得,条件马尔科夫——三次指数平滑预测模型预测效果最好。
舒曼是学面案的。他认为这种专业可以一辈子饿不着。舒曼和那个一蹶不振的艺术家在一起生活的时候就经常挨饿。于是,舒曼毫不犹豫地选择了“吃”这个专业。就舒曼的艺术才能而言,他完全可以报考一家艺术院校,他的小提琴拉得也不错。但他没那么做。
误差对比图如下所示:
图4 预测结果误差对比图
从图4 中可以看出,条件马尔科夫——三次指数平滑预测模型在2005 年~2012 年的预测结果效果优于其他两种模型,2013~2015 年三次指数平滑结果优于其他两种,总体来说,条件一步状态转移概率修正过的三次指数平滑效果更优。
4 结论
运用马尔科夫链与BP神经网络、指数平滑、灰色模型等预测方法结合,采用的状态转移矩阵通常采用传统的状态转移矩阵,本文首先使用传统状态转移矩阵来修正三次指数平滑方法的误差,最终发现某些样本下,修正后结果差于修正前,随后采用本文新提出的条件状态转移概率矩阵来修正误差,最终比较三次指数平滑方法,传统状态转移概率矩阵修正三次指数平滑方法和条件状态转移概率矩阵修正三次指数平滑方法三者的预测结果,最终发现本文提出的新方法效果最好。并且如果样本容量更多,条件状态转移概率会更好的展现出它的优势。
参考文献
[1]贾哲,郭庆军,郝倩雯.基于El man-马尔科夫模型的深基坑变形预测[J].人民长江,2019,50(01):202-206+219.
[2]冯言志.基于组合熵值马尔科夫模型的住宅用地价格预测研究[J].上海国土资源,2019,40(01):59-63.
[3]潘丽,李林.基于灰色马尔科夫模型的上海铁路客运量预测[J].物流科技,2019,42(03):99-102.
[4]陈嘉晋,李登明.马尔科夫链模型对股价短期变动趋势的研究——以伊利集团为例[J].经济研究导刊,2019(10):104-106+120.
[5]何众颖,刘虎.基于灰色马尔科夫链优化模型的船舶到港量预测[J].中国航海,2019,42(01):119-124+134.
[6]刘历波,裴彧,裴同松.灰色-马尔科夫模型在桥梁运营状况预测中的应用[J].河北大学学报(自然科学版),2019,39(01):11-17.
[7]刘江义,王春平,王暐.基于双马尔科夫链的SMC-CBMe MBer滤波[J/OL].系统工程与电子技术:1-9[2019-05-22].ht t p://kns.cnki.net / kc ms / det ai l / 11.2422.TN.20190307.1046.004.ht ml.
[8]宋志兰,孔民警,黄益,周文婧,项祎麒.基于灰色-马尔科夫链的冷链物流需求量预测——以昆明市鲜切花为例[J].物流工程与管理,2019,41(02):17-21.
[9]王继拓,王万成,陈宏伟.基于回归——马尔科夫链的光伏发电功率预测[J].电测与仪表,2019,56(01):76-81.
[10]朱驰,赵皇伟,赵晓明,杨冀.一种基于指数平滑模型的血液管理方法[J].国际检验医学杂志,2019(09):1143-1146.
[11]张贝贝,李静文,杨亚楠.基于IOWA 算子的多参数指数平滑模型组合预测[J].统计与决策,2019,35(06):30-35.
[12]方圆,于峰,项国圣,王学庆.基于灰色理论的三次指数平滑模型预测自然陈化中热闷钢渣f-CaO 含量[J].硅酸盐通报,2019,38(03):634-639+648.
[13]杨玮,张堃,赵晶,罗洋洋. 基于Mont e Car l o 指数平滑订单预测与决策分析[J].包装工程,2019,40(05):155-161.
[14]宋志兰,孔民警,黄益,周文婧,项祎麒.基于灰色-马尔科夫链的冷链物流需求量预测——以昆明市鲜切花为例[J].物流工程与管理,2019,41(02):17-21.
中图分类号: O242.2
文献标识码 :B
文章编号 :1008-0899(2019)06-0031-05