基于ARMA模型的柴油出厂数据量差预测分析论文

基于ARMA模型的柴油出厂数据量差预测分析

张医铭

(中国石化上海石油化工股份有限公司统计中心,上海 200540)

摘 要: 针对柴油海运出厂数据计量误差问题,将时间序列分析方法应用于数据量差的预测分析,使用基于最小信息值定阶准则的移动平均自回归模型(ARMA),将其应用于误差预测。对2015—2017年柴油误差数据进行时序分析,发现其为非平稳序列,可以使用ARMA模型进行预测。根据模型预测的结果可对柴油计量误差进行预先范围监测,为计量数据管理提供一种新的思路。

关键词: ARMA模型 预测分析 定阶准则

时间序列是以时间为顺序排列并随时间而变化,同时又具有一定关联关系的数据序列。时间序列分析是根据相邻数据点之间具有相关性的特点,建立相应的数学模型来对观测数据进行拟合,并实现相关信息的有效预测[1]。时间序列分析通常在经济领域应用较为广泛。文章试图采用这一方法对中国石化上海石油化工股份有限公司(以下简称上海石化)海运码头出厂数据的计量误差进行预测,为计量数据管理提供决策依据。上海石化的柴油海运出厂通过计量流量计进行结算,但是计量数据和商检量之间存在着随机误差,并且随着季节变化存在周期性特点。为方便管理,需要知道该误差的趋势范围,以便能够及时发现异常情况,因此拟采用时间序列分析方法来进行分析建模,这里将采用移动平均自回归模型(ARMA)对误差数据进行预测分析。ARMA模型是一种专门处理一维时间序列数据的模型,可为柴油出厂计量误差规律性分析提供一种新思路。

遥感卫星结合GIS技术进行地质灾害监测,已经受到人们的重视。遥感技术探测范围广,受约束条件小,技术手段先进,获取有效信息量大[6],可在室内轻松开展监测工作。

精神疾病通常会有影响突触中蛋白的遗传因素。使用表现出类似精神分裂症或自闭症症状的小鼠,研究小组绘制出了它们的突触体图,并且发现了大脑中各种突触亚型结构和连接方式的巨大变化。

1 基本原理与方法

时间序列分析方法最初只有自回归模型(AR)用于市场变化规律的预测,在此基础上数学家瓦格儿又提出了滑动平均模型(MA)和移动平均自回归模型(ARMA),这3个模型奠定了时间序列分析理论的基础。ARMA模型主要应用于对一维、方差稳定的平稳时间序列分析,认为时间序列当前观测项的值可以表示为其之前的p 项观测值及q 项随机误差的线性组合,即满足式(1),为移动平均自回归模型,并记作ARMA(p ,q )模型[2]

移动平均自回归模型的数学表达形式为:

一阶差分后的序列时序(y)、一阶差分序列自相关(ACF)和一阶段差分序列偏自相关(PACF)情况见图3~5。

(1)

式中:φ 1为自回归因子,θ 1为滑动平均因子,{ε 1}为白噪声序列。

根据偏自相关图的1阶截尾性,可以尝试使用AR(1)模型进行拟合,使用极大似然估计方法确定模型口径为:

φ (B )=1-φ 1B -φ 2B 2-...-φ p B p

(2)

根据自相关图显示的自相关因子的3阶截尾的性质,尝试拟合MA(3)模型,使用极大似然估计方法,确定MA(3)模型的口径为:

10月初,吉兹博士表示,她的团队不久后也将发表成果。他们此前一直在等待S2进入下一个轨道运行阶段,然后再观测一次。

(3)

长江流域片贯彻实施水工程建设规划同意书制度的实践与思考…………………………………………… 刘联兵,沈燕舟(19.40)

φ (B )X t =θ (B )ε t

(4)

这就是p 阶自回归q 阶移动平均模型,记为ARMA(p ,q )。当p =0时为纯滑动平均模型,记为MA(q );当q =0时为纯自回归模型,记为AR(p );当p =q =0时,则模型表示为X tt ,此时,该序列为白噪声序列[3]

在转驱时机优化中,主要考虑转驱时的油藏压力和井间的热连通性。在蒸汽吞吐中,第2周期到第4周期加热半径和加热区域不断扩大,到第4周期,井间已经建立起热连通。第5周期,其加热区域扩大较为缓慢,主要起到重复加热地层的作用。综合考虑蒸汽驱阶段油汽比、采收率和净采油量等因素,推荐在蒸汽吞吐4周期以后转驱,采收率可达27.1%。

2 模型应用

ARMA模型建模过程主要包括数据预处理、阶数选取、参数估计和模型检验4个步骤。

(1)数据预处理:使用ARMA模型需要对数据进行预处理,主要包括异常数据剔除和序列平稳性检验。序列平稳性可以通过时序图初步判断,然后通过计算样本数据的自相关函数与偏相关函数等判断。如果自相关图是截尾或者拖尾,则可以判断数据适用ARMA模型。如果样本数据非平稳,则可通过差分法处理进行非平稳序列建模。

则(1)式简写为:

(2)阶数选取:确定模型的阶数,即p 和q 值。可以通过自相关图选择相应的阶数进行拟合,也可以采用AIC准则进行判断。

综合分析序列时序图、自相关图,判定该序列为非平稳序列,可以考虑使用差分法对序列进行处理。

“蜘蛛精”从悬崖下爬上来,张望一番,目光最终定格在了前方的天葬院。它发出一声低沉的嘶吼,迈开节足,朝着天葬院爬去。

(4)模型检验:模型检验的方法主要包括卡方检验和实测检验法。卡方检验的基本思路是,在相应的显著性水平下检验模型的残差序列是否为白噪声序列;实测检验法是将模型预测值与实测数据进行比对,计算相应的误差,从而进一步修改完善模型[4]

3 实例分析

由于柴油海运出厂并非每天都有,因此数据不可能严格连续,为了更好地分析时间序列方法在误差数据中的预测[5],选取2015—2017年误差实测月平均数据作为样本数据,根据直观法剔除明显的异常数据后得到误差数据时间序列{X t },剔除异常值后的柴油计量数据误差值时序图见图1。序列自相关和偏自相关情况见图2。

图1 序列时序

图2 序列自相关情况

(3)参数估计:确定自回归因子和移动平均因子的值。参数估计主要包括最小二乘法和极大似然估计等,文章拟采用极大似然估计,使用Eviews软件进行数据计算。

X y1X t-1 -...φ p X t-p tt-1 -θ q ε t-q

图3 一阶差分后的序列时序

图4 一阶差分序列自相关

图5 一阶差分序列偏自相关情况

由图4~5可知:该序列围绕0点上下波动,且样本自相关和偏自相关因子很快落入随机区间,说明一阶差分后的序列呈现平稳性,可以对其建立ARMA模型。由图5可见,序列的样本自相关因子在k =3处显著不为0,表现为拖尾性,因此可以考虑q =3;偏自相关因子表现为一阶截尾性,因此可以考虑取p =1。由于对原数列进行了一阶差分,因此最终可以建立ARIMA(1,1,3)模型。模型参数估计结果见表1。

表1 模型参数估计结果

θ (B )=1-θ 1B -θ 2B 2-...-θ p B p

x t =(1-0.6 046B +0.0 583B 2-0.4 535B 3t

(5)

引入后移算子B ,用B k 表示k 步线性推移算子,即B k X 1=X t-k ,B k ε 1t-k ,令

(6)

参数估计完成后,为了验证ARIMA(1,1,3)模型是否符合意义,运用白噪声检验法对残差序列进行检验。通过对残差序列的检验后,发现该模型是合适的,因此可以对此进行短期预测。预测结果见表2,拟合预测见图6。

表2 5期预测结果

图6 拟合预测情况

4 结论

(1)根据误差数据的时序图分析,发现该序列为非白噪声、非平稳序列,在对其数列进行差分后满足ARMA模型的建模要求。

(2)通过AIC定阶准则选取了ARMA(1,3)模型作为最终的拟合模型对数据进行分析,最终使用极大似然估计的方法确定了模型的拟合方程。

(3)通过小样本时间序列的预测分析,运用ARMA模型对误差数据进行建模,得到具体的分析方程,可以预测短期的误差值,在实际的计量数据管理中,可以提供甄别异常值的理论依据,具有较高的实用价值。

其中:σ为纵波引起的正应力;ρ为介质密度;VP,vP分别为纵波波速和纵波引起的质点震动速度;τ为横波引起的剪应力;VS,vS分别为横波波速和横波引起的质点震动速度。可见,远场动应力和震波波速成正相关关系。

(4)模型优点:通过对油品出厂计量数据误差进行分析,建立了相应的ARMA(p ,q )模型,从预测的静态图上看,此种方法可以模拟数据的走势,具有一定的参考意义,可以对异常数据进行准确的判断。

(5)模型缺点:在数据处理上,由于这些数据本身具有一定的随机性,规律性较弱,采用单一的模型处理时会存在较大的误差,所以对于预测的具体数值精度较低,只能提供大概率的置信区间供参考。

参考文献

[1] 陈佳袁,闫杰.基于ARMA模型的水文数据预测[J].浙江水利科技,2017(6):27-28.

[2] 杨其,陈水忠,沈淑梅,等.LSTM网络和ARMA模型对惯性器件随机误差预测适应性分析[J].电光与控制,2018,25(3):68-72.

[3] 李嘉松.基于ARIMA模型的沪深300指数预测及误差因素分析[J].赤峰学院学报(自然科学版),2017,33(1):73-75.

[4] 尹温硕,陶顺,赵蕾.基于ARMA模型的电压RMS值预测[J].电力工程技术,2018,37(5):20-25.

[5] 王燕.应用时间序列分析[M].3版.北京:中国人民大学出版社,2012.

Prediction and Analysis of Diesel Engine Data Quantity Difference Based on ARMA Model

Zhang Yiming

(Statistics Center ,SINOPEC Shanghai Petrochemical Co .,Ltd .,Shanghai 200540)

ABSTRACT

For the problem of measurement error of diesel shipping data,the time series analysis method is applied to the prediction analysis of data difference,and the moving average autoregressive model (ARMA) based on the

总而言之,体育教师必须正确认知中长跑活动对学生的培养积极作用,正视学生对中长跑体育活动产生抵触情绪的原因,以在创新、突破、探究、实践四合一下寻找到有效中长跑教学的新对策,帮助学生克服抵触情绪,爱上中长跑运动。

minimum information value fixed-order criterion is applied to error prediction.The time series analysis of the diesel error data from 2015 to 2017 is found to be a non-stationary sequence,which can be predicted using the ARMA model.According to the results predicted by the model,the diesel metering error can be monitored in advance,which provides a new idea for metering data management.

Key words :ARMA model,predictive analysis,ordering criteria

文章编号: 1674-1099 (2019)04-0016-03

中图分类号 :TE626

文献标志码: A

收稿日期: 2019-05-30。

作者简介: 张医铭,男,1992年出生,2015年毕业于长春工业大学统计学专业,理学学士,长期从事统计工作。

标签:;  ;  ;  ;  

基于ARMA模型的柴油出厂数据量差预测分析论文
下载Doc文档

猜你喜欢