(上海对外经贸大学统计与信息学院应用统计学)
基金项目:本项目成果受“2018年度上海大学生创新创业训练计划示范校”建设经费资助。项目名称:南北半球气温异常值的预测与比较研究,项目编号:201810273094
关键词:ARIMA;季节模型;气温异常值;时间序列;GARCH
1引言
气温作为一个重要的气象指标不但影响着工农业生产,也影响着人们的生活生存环境。现今,天气预报已经深入人们的生活,天气预报的技术也得到了快速发展,特别是气象统计预报,在不断走向成熟的过程中也涌现出了很多新的方法。
2北半球气温的统计分析
2.1数据来源与平稳化处理
本文利用戈达德空间科学研究所(GISS)和美国国家航空航天(NASA)的北半球地面空气温度异常值的月均值作为本案例的时间序列数据。时间是从1880年1月到2017年12月,跨度超过138年,共1656个观测值。GISS数据以0.01℃为单位。
图1北半球温度异常值月度数据时序图和样本自相关图
图1中北半球温度异常值的时序图,可见序列具有向上的趋势。尤其是在20世纪80年代早期,趋势的斜率看起来是增加的。同时,温度的波动性在138年中保持相对平稳。
用Nt表示北半球温度异常值的月数据。图1 中给出了序列Nt的样本自相关函数(ACF),可见具有很大的系列相关性,且衰减缓慢,峰值在滞后12期、24期和36期时具有循环模式。因为气温经常存在着季节特征。
图 2北半球温度异常值月数据差分序列的样本自相关函数和偏自相关函数
2.2 ARIMA模型
2.2.1模型识别
从图2 可以看出:自相关函数在滞后阶数为1、2、6和12时,或者数值显著较大,或者略微显著;自相关函数在滞后阶数为24时也是显著地。另一方面,样本偏自相关函数在存在几个显著的数值。尤其是,1阶滞后偏自相关函数远远大于其他阶的偏自相关函数,并且偏自相关函数并不以指数衰减。
图4对北半球温度异常值拟合的ARIMA(1,1,2)模型的残差的样本自相关函数
2.2.3模型优化
图5式(4)对北半球温度异常值所建模型的检验图
进一步分析气温数据,一阶差分后的气温数据,季节差分后的数据,以及一阶差分和季节差分后的数据的样本自相关函数:
图6样本自相关函数图
图7式(4)对北半球温度异常值所建模型的检验图
图8给出了模型预测表现,其预测的RMSE值=0.244。其中实线表示原始时间序列数据,预测期的真实观测值用“o”标识,点预测值用“*”标识。虚线表示95%的区间预测。从图中可以看出,除了2016年5个月份的真实数据不在预测区间内,其余预测值与实际观测值相似。真实的气温异常值都在区间预测内。
图8北半球样本外点预测和区间预测
检验的p值为0.21,所以我们推断在滞后1-36阶中没明显证据说明预测误差是非零自相关的。为了检验预测误差是否服从零均值、方差不变的正态分布,做预测误差的时间曲线图和直方图:
图9预测误差的时间曲线图和直方图
图9中的时间曲线图显示出随着时间增加,方差大致为常数(大致不变)
所有系数的参数估计在10%水平上都是统计显著的。图12给出了带有估计波动率序列的时序图和标准化残差的QQ图。
图10带有估计波动率序列的时序图和标准化残差的QQ图
QQ图中的点偏离直线较多,显然标准化残差不具有正态性。为了处理非正态性,我们采用学生t的分布信息建模。
得到模型如下:
所有的参数估计,除了波动率方程中的常数以外,都是高度显著的。图11给出了式中的模型标准化残差的QQ图。除了有几个残差偏离外。该图表现为一条直线。因此t分布看上去是合理的。
图11标准化残差的QQ图
但是在模型检验中标准化残差的 统计量在滞后二阶之后拒绝模型,其平方序列也拒绝了此模型。且模型在滞后3阶开始仍然存在ARCH效应。
这是由于差分之后的气温异常值数据存在多重季节效应,但是 模型没能消除这种季节效应。由此可见在分析气温数据时,季节效应的影响很大。
2.4 模型比较
3南半球气温的统计分析
图15给出了模型预测表现,其中实线表示原始时间序列数据,预测期的真实观测值用“o”标识,点预测值用“*”标识。虚线表示95%的区间预测。从图中可以看出,除了5个月份的真实数据不在预测区间内,真实的气温异常值都在区间预测内。
图13南半球气温异常值样本外点预测和区间预测
综合比较,发现时间序列多重季节模型 能更好的拟合并预测南半球气温异常值。
4 结语
用 构建南北半球气温异常值的模型,能更好的预测未来的气温异常值。虽然气温异常值存在明显的ARCH效应,但 模型不管是拟合程度和预测精确度上都不太理想。北半球气温异常值较大的季节效应,而南半球气温异常值的季节效应不明显。
参考文献
[1]曹鸿兴.“时间序列分析及其气象应用”讨论班[J].气象,1982,8(1):33.
[2]黄文杰,曹鸿兴, 顾岚,等. 时间序列的ARIMA季节模型在长期预报中的应用[J]. 科学通报, 1980, 25(22):1030-1032.
[3]程炳岩, 丁裕国, 汪方. 非正态分布的天气气候序列极值特征诊断方法研究[J]. 大气科学, 2003, 27(5):920-928.
[4]呼日乐,石昱馨,吴公华.海拉尔地区降水量的ARIMA乘积季节模型研究[J].内蒙古农业大学学报(自然科学版),2008,29(04):221-226.
[5]成城. 基于GARCH模型的上证指数波动率特征分析[D]. 山东大学, 2014.
[6]曾大才. 时间序列的客观分析方法在天气分析中的应用[J]. 广西气象, 1990(3):14-17.
[7]朱正心. 时间序列在单站天气预报中的应用举例[J]. 数学的实践与认识, 1976(3):22-25.
[8]张艳君, 梁运香, 唐磊. 天气和气候的时间序列特征分析[J]. 农业与技术, 2012, 32(6):124-124.
[9]陈瑶, 程毛林. ARIMA模型在居民消费价格指数预测中的应用[J].苏州科技学院学报(自然科学版), 2014(4):26-30.
论文作者:符乃丹 郭卿
论文发表刊物:《知识-力量》2019年4月上
论文发表时间:2019/2/11
标签:模型论文; 气温论文; 序列论文; 异常论文; 北半球论文; 时间论文; 函数论文; 《知识-力量》2019年4月上论文;