基于SARIMA 组合模型的农产品生产价格指数的短期预测
● 陈佳珊 张 丹
摘要: 为提高农产品市场价格的可预见性,本文以农产品生产价格指数为研究对象,首先运用SARIMA 拟合序列的线性部分,然后分别采用BP 网络、LSSVM 提取非线性信息,从而构造组合模型SARIMA-BP 与SARIMA-LSSVM。通过评价指标RMSE 和MAPE 的对比发现组合模型较单项模型具有更强的稳健性和更高的预测精度,其中SARIMA-LSSVM 的预测效果最理想,故基于该模型预测未来5 个季度的指数,并得出结论:该指数的波动范围有减小的微弱趋势,但总体波动较大,未来较短一段时间内该市场可能存在较大风险,国家应采取相应的应对举措。
关键词: 农产品生产价格指数 组合模型 SARIMA BP 网络 LSSVM 短期预测
一、引言
农产品生产价格指数既能及时反映全国农产品生产价格水平和结构变动情况,以引导农村调整产业结构,也能帮助“国家测算农业支持水平”[1],从而“确定相关补贴政策或为补贴标准提供依据”[2]。近年来农产品价格波动幅度大,使得该市场存在不稳定因素,不利于经济社会的正常运行。因此预测其价格指数不仅有利于生产者和销售者对市场存在的风险及时作出反应,且有助于政府采取相关措施对市场进行宏观调控,具有双重重要意义。
实证分析中,本文根据季节性特征选取季节性差分自回归滑动平均模型(SARIMA)。但时序法本质上只能捕捉线性关系,其非线性关系的捕获能力很差,且该序列易受多种外界因素影响,故其中也包含非线性变化规律。本文针对不足之处提出基于SARIMA 的组合模型:先用SARIMA提取线性信息,再通过非线性手段提取残差中的波动信息,即实现线性与非线性的结合。最后通过评价指标选择理想的组合模型进行预测。对于SARIMA 的改进是本文的亮点之处。
二、理论基础
(一)SARIMA 模型
SARIMA 是基于ARIMA 的改进得到的,主要思想是“从时序的平稳性检验出发,运用差分方法对同时具备趋势性与季节性的非平稳序列进行处理,以消除序列规律性”[3]。SARIMA 的具体形式为
(二)“线性+非线性”组合预测模型
在实际中许多时序数据往往受到多因素的综合影响,其蕴含的变化规律无法简单地通过单一模型来全面描述。
J.M.Bates 和C.WJ.Granger 提出的组合预测方法突破了单项模型在预测方面的局限性。对于单一预测模型,杨黄梅认为“只能预测线性变化规律的模型往往伴随着低预测精度;而基于经验风险最小化原则构建的模型虽具备很强的非线性预测能力,但泛化能力差”[4]。SARIMA 则属于前者,具有优良的线性信息提取能力却忽视数据中的波动信息。倘若只考虑BP 网络或LSSVM 这些泛化能力强的非线性模型,则易出现过拟合现象。
显然单一模型难以对数据作出合理有效的解释。同时注意到SARIMA 的“取线性,舍非线性”特征与非线性模型的“取非线性,舍线性”特征是一种互补关系,故本文基于这一关系提出“线性+非线性”组合模型:SARIMA-BP和SARIMA-LSSVM。
为了在训练过程中对模型的准确性进行检验,本文取后10 个数据作为测试集,其余则为训练集。
不同地区有着自己国家不同的文化、生活习惯、语言、工作方式及宗教信仰,我国企业在管理本土化劳务的过程中,一定要对当地人民的生活习惯、文化风俗及宗教信仰等方面的内容进行充分的了解,避免在管理过程中出现纠纷的情况,使事情变得更加复杂[5]。因此,企业劳务管理人员应及时与当地的人民进行沟通,并制定相应的管理办法,提高管理水平。为此,企业应定期加强管理人员及相关工作人员的培训学习,将“以人为本”的管理理念充分融入管理过程中,使我国的管理人员与当地的劳务人员相处的更加融洽。
Lt 为由SARIMA 描述的线性成分;Nt 为由BP 网络或LSSVM 拟合的非线性成分。
本文引用的是农产品生产价格指数的季度数据:2003年第一季度至2018 年第三季度,来源于国家统计局。
组合模型中的线性与非线性模型各有一个,可表示为
在BP模型构建过程中,设置4个输入节点n,2个隐层节点m,1 个输出节点。在确定隐层节点数量时本文参照经验公式
三、实证研究
(一)数据选取
如果用典者要表达不同的典义,又要符合不同的诗文创作的需要便很容易从一个典故中创造出具有异义关系的多个典面。例如:
然而没有撑下来的并非楚墨,而是静秋。也许没有那个意外的话,莫高、阿芳、静秋和楚墨真的可以完成旅程,但是因了意外,他们的旅程,至市郊结束。
(二)模型构建与评估
在LSSVM 构建过程中,首先设置优化程序为网格搜索,然后选择成本函数“交叉验证”并初始化参数内核函数选RBF_内核。接着基于训练数据在交叉验证中优化初始化参数,然后训练模型。
为非线性函数,稳性与白噪声检验、模式识别、参数估计及检验等操作后,根据AIC 最小值准则选出最优SARIMA:
2.构建“线性+非线性”组合模型。线性模型即为SARIMA,针对非线性数据的提取,本文选取BP 网络和LSSVM模型。以SARIMA的残差为输入数据,分别构建BP与LSSVM模型。
在楼下的咖啡厅里,经理微笑着说:“林蓝,你很聪明,但是有些事情却做得并不如沙莉。你们的矛盾完全是你自己的嫉妒心作怪,今天我来告诉你,你败在哪里。”他拿起咖啡杯的搅拌棒,在桌子上写下两个“人”字,一个字形潇洒却潦草,一个貌不出奇却工整隽秀。“你看,这两个字形就是你和沙莉的工作写照。你不顾一切直往前冲,可惜连最基本的职场法则都忘记了,有时候像猛兽似的太咄咄逼人,这样锋芒毕露未必能成功,相反沙莉静默勤勉平易近人,她实际就是一株能屈能伸的植物,有着风雨不避的坚韧,有汲取阳光的力量,有一岁一枯荣的从容本质……”
首先由线性模型得出预测值与原序列值相减得到残差再用非线性模型对残差序列建模:为t-n 时刻残差,为随机误差。
湿地生态旅游开发很重要的工作就是湿地生态恢复,这需要充足的资金保证。资金的来源要多元化,政府、企业、社区、个人都可以成为投资者,都应当为湿地生态旅游开发贡献力量。旅游部门要接受政府部门的监管,遵守旅游市场规则,不断提高自身的经营管理水平,正确处理湿地生态与企业、社区的利益,体现人与湿地和谐的思想。
为1-10 之间的常数,经多次试验发现a=10 时的效果最好。接着,以S 型正切函数tansig 作为隐层神经元的激励函数,且“由于网络的输出归一到[-1,1]范围内,故选S 型对数函数tansig 作为输出层神经元的激励函数”[5]。
1.构建SARIMA 模型。经季节性判定、差分处理、平
学校思政课教师客观实际。这个“实际”就是教学任务重、空闲时间少、队伍老化、动力不足、之前没有此类任务要求、积习难改等。这就决定了我们必须坚持实事求是,职责不能过多,任务不能过重。
最后分别将构建的BP 模型和LSSVM 与SARIMA 结合,即得到SARIMA-BP 与SARIMA-LSSVM。
3.模型评估与选择。本文以均方根误差RMSE 和平均绝对误差百分率MAPE 作为评价拟合预测效果的标准。RMSE侧重衡量偏差,MAPE 侧重衡量模型稳健性。
为样本数,为真实值,为预测值。
分别用构建的三个模型预测后10 个数据,对比原数据与预测数据并计算相应RMSE 与MAPE,评结果如下:
我国汽车保有量逐年增加,2017年达到2.17亿辆,增长率基本维持在12%-13%之间。新修订的《报废汽车回收管理办法》允许拆解回用件进入市场流通,鼓励“五大总成”交给有资质的再制造企业进行再制造。这有助于通过再制造循环使用,提升行业毛利率水平,进而促进废汽车回收率的良性改善。未来,随着政策的逐步完善以及行业模式的不断创新,废汽车行业有望迎来机遇期。
表1 模型评估结果
对比单项模型,组合模型的预测精度明显提高,说明本文对SARIMA 的改进有明显效果。且无论是在RMSE 还是MAPE 上的评比,SARIMA-LSSVM 的效果均是最好的。
(三)农产品价格指数的预测
据模型评估结果可知SARIMA-LSSVM 的预测效果是最理想的,因此本章使用该模型预测未来五个季度的指数,结果如下:
图2 实际值与预测值
四、分析与结论
(一)关于模型对比
在评估对比中可发现SARIMA 在两种评价标准之下的效果都最不理想,这是因为受多种外界因素影响的农产品生产价格指数具有较复杂的变化特点,无法充分捕捉非线性信息的SARIMA 难以对其全面描述,因而导致其效果并不理想。
相较之下,基于SARIMA 提出的“线性+非线性”组合模型在注重线性信息的同时也充分考虑了波动信息,故其拟合预测精度显著提升,效果理想。且在这两种组合模型的比较中,SARIMA-LSSVM 的预测效果更胜一筹。本文初步认为,BP 具有高度非线性泛化能力,LSSVM 则“同时兼备逼近精度和泛化能力这两个方面的优良性能”[6],故LSSVM 在非线性回归估计方面的综合性能比BP 要更好,因而SARIMA-LSSVM 组合模型所呈现出来的效果相较之下更为贴和实际发生数据。总体而言,这两种非线性模型都是拟合非线性回归函数的推荐选择。
(二)针对预测结果
根据预测结果,全国农产品生产价格指数仍延续以往的发展规律。该指数在2018年第四季度跌至谷底后又开始上升,变化规律与往年类似。纵观总体的波动情况,前期的指数波动较小,但中后期的波动猛然增大,即生产价格变动较大,彼时该市场存在较大风险,对生产者的经济收入有所影响,其价格指数也处于一个不稳定状态。后面可看到指数的波动范围有减小的微弱趋势,但总体来看其波动还是较大。
农产品生产价格指数是反映农产品“出厂价格”的一个环比数,过低则消费者物价指数CPI 随之降低,造成通货紧缩,过高CPI 也随之上升,可能发生严重的通货膨胀。由于CPI 最好保持在3%以内且适当的通货膨胀有利于经济增长,因此,本文认为农产品生产价格指数的最好状态是稳定且稍微偏高。根据预测结果知该指数继续上升的可能性大,未来一段较短时间内农产品市场可能存在较大的风险,国家需据此采取应对举措,以最大限度防止国民经济的失衡。
参考文献:
[1]百度百科:https://baike.baidu.com/item/农产品生产价格指数/6003948?fr=aladdin.
[2]郝安民.国家统计局首次发布全国农产品生产价格指数——访国家统计局农村社会经济调查总队长鲜祖德[J].调研世界,2003(08):3-4.
[3]徐达宁.云计算环境下资源需求预测与优化配置方法研究[D].安徽省:合肥工业大学,2014.6.
[4]杨黄梅. 人才需求组合预测的建模与仿真分析[J]. 计算机仿真,2013,30(10):253-254.
[5]朱梅.基于BP 神经网络的等高线生成方法[J].电子元器件与信息技术,2018(06):51-56.
[6]王伟,王田苗,魏洪兴.LS-SVM 与多层向前网络的非线性回归性能比较[J].系统仿真学报;2008,20(1):258-259.
(作者单位:华南师范大学)
标签:农产品生产价格指数论文; 组合模型论文; SARIMA论文; BP网络论文; LSSVM论文; 短期预测论文; 华南师范大学论文;