基于小波变换的GM(1,1)-ARIMA组合模型对粮食产量的预测
樊 超, 郭亚菲, 曹培格
(河南工业大学信息科学与工程学院,河南郑州 450001)
摘要 :为提高粮食产量的预测精度,针对粮食产量的数据特点,提出了在小波变换的基础上,结合GM(1,1)模型与ARIMA模型的优点,建立GM(1,1)-ARIMA组合预测模型。首先,通过小波变换对非平稳序列进行分解,得到近似分量和细节分量;针对各分量序列的不同特征,采用灰色GM(1,1)模型对近似分量进行趋势预测,为进一步提高趋势信号的预测精度,使用灰色GM(1,1)模型对预测序列进行残差修正;然后,采用ARIMA预测模型对分离出的细节分量进行预测;最后,通过小波重构得到粮食产量的预测值。预测结果表明,基于小波变换的GM(1,1)-ARIMA模型的拟合平均误差为0.69%,通过对2011—2014年粮食产量的预测,其预测平均误差低于1%,为粮食产量预测提供了一种新的技术途径。
关键词 :粮食产量;预测;小波分析;GM(1,1)模型;ARIMA模型
粮食作为一种特殊的商品备受人们关注,它的产量始终是一个国家经济发展的大问题,粮食丰收为经济平稳发展和社会的和谐与稳定提供了有力支撑。预测粮食产量的变化趋势对国家粮食安全、政策宏观调控有着重要意义,因此粮食产量的预测显得尤为重要。
粮食产量预测历来受到各国政府和学者的普遍关注,目前主要采用遥感技术预测法、气象产量预测法[1]、动力学生长模拟法、元回归分析法和神经网络预测法等预测模型[2-3]。然而大量研究表明,粮食产量是一个动态、非线性复杂系统,具有随机性和突变性的特点,因此难以建立准确的数学模型。采用这些传统预测方法均存在一些不足,如所需数据量大、预测周期短等,并且传统的单一模型只能描述粮食产量的片段信息,不能较详细地描述其变化规律,导致粮食产量预测与实际值之间差距较大。传统GM(1,1)模型能较准确地反映序列的增长趋势,但在处理变化跳跃性较大的非平稳数据时,易产生较大误差;而传统ARIMA模型虽然能够较好地反映序列的随机波动因素,但会出现数据丢失和精度降低的问题。针对以上情况,本研究将小波变换应用到时间序列分析之前,提出了基于小波变换的GM(1,1)-ARIMA的组合预测模型,采用小波分解将原始数据分解为低频近似信号和高频细节信号;采用GM(1,1)处理低频平稳信号,采用ARIMA模型处理高频细节信号。最后将各级预测值进行叠加,从而得到最终的产量预测值。预测结果表明,该模型能够较好地反映粮食产量的变化特征,预测精度高于单一传统预测模型,使得粮食产量预测结果更加准确。
1 原理及方法
1.1 GM(1,1)模型简介
GM(1,1)模型是对原始序列进行一次累加生成,使生成的数据序列呈现一定规律,然后通过建立一阶微分方程模型,求得拟合曲线[4]。其建模如下:
(1)设时间序列模型有n 个观测值:
X (0)=[X (0)(1),X (0)(2),…,X (0)(n )]。
(1)
(2)通过累加生成新序列:
X (1)=[X (1),X (1)(2),…,X (1)(n )]。
(2)
(3)对序列X (1)进行微分运算得:
+aX (1)=b 。
(3)
式中:a 为发展灰度,b 为内生控制系数。令为待估参数向量,用最小二乘法对其求解,得预测模型:
现在随处都有许多资讯,所以清楚了解问题,有助于决定哪些是相关的资料。如果正在试着选择一种改善你应该的食谱,可以请教专家的建议,或者其他有经验的人的帮助,收集资料可以帮助衡量不同的选择,更贴近符合目标的决定。
(4)
1.2 ARIMA模型简介
将AR和MA模型进行组合,便构成了用于描述平稳随机过程的自回归滑动平均(ARMA)模型,ARIMA(p ,d ,q )模型是指时间序列d 阶差分后自相关系数最高阶为p ,移动平滑系数最高阶为q ,其实质就是ARMA模型与差分运算的组合[5-6],其数学表达式为:
y t =φ 1y t-1 +φ 2y t-2 +…+φ p y t-p +φ t -θ 1φ t-1 -θ 2φ t-2 -…-θ q φ t-q 。
(5)
其中,A 是原始序列的近似序列,反映了数据的大趋势;c 1、c 2和c 3是原始序列的细节序列,反映了序列的细小波动。分解后的各序列波形如图4和图5所示。由此可见,趋势信号变化较为平稳,反映了原始序列的总体变化趋势,因此采用灰色GM(1,1)模型进行预测,而细节序列的随机性较强,不具有规律性,因此采用ARIMA模型对其进行预测。
Φ(B )y t =Θ(B )φ t 。
(6)
斑试器,北京百亿怡达科技开发有限公司;孵化箱(Grumbach BSS420),上海柏乾生物科技有限公司。
福建竹编的主要技法是“雀目法”,“雀目法”的“雀目”是指六角形透空雀目格,这是由4条篾连贯且交叉地编织而成的。因此,编织而成的竹编工艺品具有透空疏朗的效果。竹编可以通过漂白、染色、上漆获得不同的颜色。漂白后的竹编颜色比较自然朴素,很好地保持了竹子本来的颜色。而染色竹编的颜色主要以老棕色为主,色调比较沉重,工序却并不简单,要经过多次的染色后再进行磨光才能完成。此外,还有一种上漆竹编,是在竹编表面上漆,使竹编工艺品不仅具有竹编的外形,还具有漆器的质感,因此显得非常别致。上漆竹编的品种主要有瓶、盘、罐、篮、盒、灯罩、屏风、挂帘、枕席等[11]。
(7)
1.3 小波变换
小波变换是对傅里叶变换的一种延伸与补充,它采用正交基对信号进行分解[7-10],离散小波变换由一系列参数组成。
c j (k )=<X ,φ jt (t )>;
d j (k )=<X ,ψ jk (t )>。
(8)
GM(1,1)模型预测的实质是以指数型曲线去拟合原始数据,由图4可知,经过小波分解后得到的低频近似序列表现为一条较平滑的曲线,可更好地发挥GM(1,1)模型的优势。对低频近似序列建立灰色GM(1,1)预测模型,此时得到预测曲线和原始曲线的拟合结果如图6所示。
φ jk =2-j/k φ (2-j t -k )。
(9)
φ jk (t )是一个低通滤波器,可分离出信号中的低频成分。本研究使用Mallat算法进行小波多尺度分解,将a j 看作待分解的序列,根据分解算法有:
“何大爷”是公司同事们给何正伟的昵称,从业务员做到公司总经理,他的踏实谦逊、平易近人,得到了从客户到同事们的一致认可,同时,他对客户和同事,以及农户们的关心与帮助也是有目共睹。在四川蒲江,他们与当地政府合作,开展产业扶贫,将撒可富肥料免费送到精准扶贫户手中,同时还对扶贫户开展施肥技术指导,为他们带来丰收的同时也帮助他们尽快脱贫致富。他时常会提醒新入行的年轻人,做农资事业,要善于总结,要把农户的利益放在首位。也正是这样的态度与行动,让梓桐公司在撒可富的销量上一直保持着每年20%的增速,这不仅体现了他们在撒可富销售推广工作中的努力,也体现出广大四川农户对撒可富品牌的信任。
(10)
式中:H 和G 分别为低通滤波器和高通滤波器,N 为自然数。Mallat算法可以将信号逐层分解,每一层分解的结果是将上层分解得到的低频信号再分解成低频和高频两部分。最终分解为一个低频的近似分量和若干高频细节分量。近似分量反映了原始序列的变化趋势,细节分量反映了原序列发生扰动的动态因素。分解后的序列重构算法为:
利用趋势序列的原始数据A (0)与其经过GM(1,1)建模所得的预测序列之差作为残差序列,即:
a j-1 =a j H *+d j G *,j =0,1,2,…,n 。
(11)
式中:H *和G *分别为H 和G 的对偶算子。小波变换在处理非平稳序列时,不同的基函数和阶数得到的处理效果不同,根据粮食产量数据序列的特点,本研究采用db 5小波对原始产量序列进行3层分解。
2 基于小波变换的GM(1,1)-ARIMA预测模型的建立
由于粮食产量序列具有复杂性、随机性和非平稳性等特点,导致使用传统的预测方法对其进行预测时会受到很大的影响和制约。本研究提出了基于小波变换的GM(1,1)-ARIMA组合预测方法,模型原理如图1所示。
晚上去应酬。请客的是个老板。有一个奢华的别墅小区项目需得处里帮助。办手续盖章子批条子,这些事情,都得处长处理。处长便让阿东给他打下手,到关键部门跑跑腿。
课外科技活动的实施离不开校内外平台的建设。校内平台的建设,实验室开放是首要的。为了培养学生的科研兴趣,对于强调实践动手能力的医药专业来说,最好能建立模拟工作实际的实验室,还原工作实际,在校内给学生提供一个理论知识运用的平台[9]。如药学院校的GMP模拟车间、模拟社会药房、制药设备维修实验室等。此外,学校还可以通过与行业企业合作的方式,建立校外实践平台,为学生提供更多的实践场所。
2.1 小波分解
若直接对原始序列进行预测,则不能有效提取序列中的确定性信息,因此对原始数据进行小波多尺度分解,如图3所示。
式中:p 为自回归模型阶数;q 为滑动平均模型的阶数;φ i (i =1,2,…,p )、θ j (j =1,2,…,q )为模型的待定系数;φ i 为残差;y t 为观测值。引入向后时移算子B ,定义B i y t =y t-1 ,上式可以简写为:
本研究选取1977—2010年的中国粮食产量数据为拟合数据,选取2011—2014年的数据用于预测。图2是1977—2010年的粮食产量数据,可以看出中国粮食总产量为非平稳序列,波动较大。
2.2 基于GM(1,1)模型的趋势序列预测模型的建立
式中:c j (k )为近似分量;d j (k )为细节分量;j ,k ∈Z ;尺度函数φ jt (t )由母小波φ t 通过平移与伸缩后得到。
从图6可以看出,灰色GM(1,1)预测模型能够较为准确地反映序列的递增趋势。进一步对所构建的模型进行检验,相对误差的计算公式为:
(12)
式中:A (0)(k )表示经小波分解出的趋势序列在k 时刻的实际值;表示在k 时刻经GM(1,1)模型预测的预测值。经测算发现,对低频近似序列建立灰色GM(1,1)模型,所得的模型拟合值与实际值相对误差平均值为1.75%。为了进一步提高预测精度,本研究在此基础上对近似序列的预测值进行残差修正。为了进一步提高预测精度,本研究在此基础上对近似序列的预测值进行残差修正。获取趋势序列的残差值,对残差序列重新建立GM(1,1)模型并得到残差预测值。具体方法如下:
式中:Φ(B )和Θ(B )分别为m 和n 阶多项式:
依据混凝土材料制品样式的摆放形式,可堆砌成包括:平铺式、阶梯式、箱式、仿石式、鱼巢式、卵石式和植草式七种护坡形式。现对这七种新型混凝土护坡形式和施工技术要求作详细介绍(文中各护坡样式图均参考大连东马混凝土构件有限公司材料厂家资料)。
(13)
利用灰色模型建模方法,得到残差序列E (0)的GM(1,1)预测模型
(14)
式中:a ε 为发展灰度,b ε 为内生控制系数。最后将残差修正模型与趋势预测模型相加,得到修正后的预测模型即:
(15)
经残差修正后的模型,其拟合值和原始值的相对误差平均值降为1.02%,预测精度得到了较好的改善。
2.3 基于ARIMA模型的细节序列预测模型的建立
ARIMA模型可以描绘一个随机变化的动态系统,根据状态之间的连续性确定系统的未来发展趋势,经小波分解后的高频细节信号具有随机性(图5),因此适用于ARIMA模型描述。对细节序列C 1、C 2和C 3选用一阶差分,分别进行ARIMA(p ,1,q )预测。以细节序列C 1为例,建立它的ARIMA预测模型,步骤如下:
7.廉洁自律,把好廉洁从审关。“打铁还需自身硬”,审计组长对审计组的廉政建设负有直接责任,廉洁自律不仅关系到审计工作的质量,而且事关审计队伍的职业形象,所以审计组长在这个问题上,一定要强化“红线”意识,加强对审计组的廉洁教育,绝不能有丝毫的含糊和松懈,要带头廉洁自律,提高警惕,自觉防腐拒变;要管好审计组成员,避免审计过程中不廉洁行为,促进审计组廉洁从审。
对细节序列C 1进行一阶差分后,首先利用Box-Jenkins模型法进行初步识别,该方法是根据样本的自相关函数、偏相关函数统计特性初步判断序列所适应的模型类型。图7为细节序列C 1的自相关函数和偏相关函数,从图中可以看出自相关函数和偏相关函数均具有拖尾性,符合ARIMA模型。然后采用赤池信息(AIC)来确定模型的阶数,该准则运用式(16)的统计量来评价模型的好坏:
AIC =-2L /n +2K /n 。
(16)
式中:L 是对数似然值,n 是观测值数目,K 是被估计的参数个数。K 越小意味模型越简洁,L 越大意味着模型越精确。因此,AIC 准则要求其越小越好,取其最小统计量所对应的阶数建立模型。经测算当p =2,q =3时的AIC 值最小,从而确定模型形式为ARIMA(2,1,3)。利用模型对数据进行拟合得到图8,可知ARIMA(2,1,3)模型能较好地描述原序列的波动趋势,可用于对细节序列C 1的趋势预测。细节序列C 2、C 3的ARIMA模型的建立方法与C 1类似,在此不再赘述。
用大量优惠的政策来引导和鼓励全社会的力量来参与校园足球已经成为目前发展的需要和趋势,公民及其他社会组织参与校园足球建设的兴趣明显提高[9]。
3 试验及分析
基于1977—2010年粮食产量数据,分别使用GM(1,1)预测模型和本研究提出的基于小波变换的GM(1,1)-ARIMA预测模型对我国粮食产量建立预测模型,所得模型的拟合误差如图9所示。
由图9可以得到以下2点结论:(1)相对于单一的 GM(1,1) 模型,本研究所提出的模型具有更小的预测误差。通过计算,本研究算法的平均拟合误差为0.69%,而GM(1,1)模型的平均拟合误差为1.72%,相比而言,由于ARIMA模型更注重于描述随机细节的变化,而粮食产量虽然受到很多因素的随机干扰,但其总体变化具有很强的趋势性,故此,使用单一的ARIMA模型的预测误差最大。由此可见,本研究算法在反映粮食产量趋势变化的同时充分考虑随机因素的影响,因此算法的拟合误差明显减小,拟合精度较高;(2)相比于单一GM(1,1)模型,本研究所提算法的拟合误差变化范围较小。例如,本研究算法的拟合误差变化范围为0.12%~1.2%,而GM(1,1)模型的拟合误差范围为0.1%~2.6%,ARIMA模型的拟合误差范围为3.73%~8.9%。因此,本研究所用方法的预测误差变化幅度更小,算法具有更高的预测稳定性。在此基础上,利用上述2个模型对我国2011—2014年的粮食产量进行预测,预测结果如表1所示。从表1的预测指标可以看出,基于小波变换的GM(1,1)-ARIMA预测模型4年平均预测误差低于1%,预测精度明显优于灰色GM(1,1)预测模型,其预测精准度的提高在于粮食产量受到各种因素影响而呈现随机性、复杂性和非平稳性,通过小波分解重构可得到近似分量和细节分量,针对近似分量和细节分量的不同特性采取合适的预测模型进行预测,这样既能够更好地凸显灰色GM(1,1)模型处理平稳序列的能力,又能够发挥ARIMA模型对细节信息描述的优点。本研究所提方法能够更好地适应粮食产量序列,预测结果更加可靠、准确。
表1 2011 —2014年粮食产量预测
4 结论
粮食安全事关国家的经济实力和社会保障能力,粮食产量的准确预测对于经济社会的全面健康发展和社会稳定具有重要意义。考虑到粮食产量受多种因素影响,波动大,呈高度非线性的特点,本研究利用小波分解对原始粮食产量序列进行分解重构,有效地将那些突变分解出来,提高了数据稳定性;分离出的低频近似信号能较准确地反映粮食产量的趋势,表现为一条较平滑的曲线,采用灰色GM(1,1)模型进行建模,可以更好地发挥GM(1,1)预测模型的优势;细节信号随机性波动较大,具有短相关非平稳的特征,因此利用ARIMA模型进行预测。近似分量与细节分量的预测值经过组合叠加得到最终的粮食产量预测值。本研究提出的基于小波变换的GM(1,1)-ARIMA模型的组合预测模型,能够充分利用历史数据赋予的信息,不仅能反映出粮食产量的发展趋势,而且可以较好地反映出粮食产量的变化特征,有效提高了粮食产量的预测精度,为粮食产量的短期预测提供了有益的技术参考。
参考文献 :
[1]王建林,王宪彬,太华杰. 中国粮食总产量预测方法研究[J]. 气象学报,2000,58(6):738-744.
[2]丁晨芳. 组合模型分析方法在我国粮食产量预测中的应用[J]. 农业现代化研究,2007,28(1):101-103.
[3]何延治. 基于时间序列分析的吉林省粮食产量预测模型[J]. 江苏农业科学,2014,42(10):478-479.
[4]候彦林,郑宏艳,刘书田,等. 粮食产量预测理论、方法及应用[J]. 农业资源与环境学报,2014,31(3):205-211.
[5]樊 超,杨 静,杨铁军,等. 基于小波变换的灰度模型-人工神经网络(GM-ANN)组合的粮食产量预测模型[J]. 江苏农业科学,2016,44(12):390-393.
[6]樊 超,郭亚菲,曹培格,等. 基于主成分分析的粮食产量极限学习机预测模型研究[J]. 粮食加工,2017,42(2):1-5.
[7]田中大,李树江,王艳红,等. 基于小波变换的风电场短期风速组合预测[J]. 电工技术学报,2015,30(9):112-120.
[8]何一韬,朱永忠. 改进小波-ARMA分频模型在径流预测中的应用[J]. 云南民族大学学报(自然科学版),2016,25(2):145-151.
[9]赵建忠,徐廷学,李海军,等. 基于小波分析的导弹装备备件需求组合预测[J]. 电子学报,2014,42(3):417-423.
[10]李 祥,彭 玲,邵 静,等. 基于小波分解和ARMA模型的空气污染预报研究[J]. 环境工程,2016,34(8):110-114.
樊 超,郭亚菲,曹培格. 基于小波变换的GM(1,1)-ARIMA组合模型对粮食产量的预测[J]. 江苏农业科学,2019,47(1):221-224.
doi: 10.15889/j.issn.1002-1302.2019.01.053
中图分类号 :S126
文献标志码: A
文章编号: 1002-1302(2019)01-0221-04
收稿日期: 2017-09-06
基金项目: 河南省科技攻关项目(编号:162102210198);国家粮食公益项目(编号:201413001);河南省自然科学基金(编号:162300410062)。
作者简介: 樊 超(1976—),男,河南郑州人,博士,副教授,研究方向为粮食信息处理。E-mail:anfan2003@163.com。
标签:粮食产量论文; 预测论文; 小波分析论文; GM(1论文; 1)模型论文; ARIMA模型论文; 河南工业大学信息科学与工程学院论文;