我国保费收入的ARIMA模型与预测,本文主要内容关键词为:模型论文,保费收入论文,我国论文,ARIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一个国家或地区的保费收入是衡量该国家或地区保险业发展的重要指标之一。为了编制保险计划,制定保险业的短、中、长期发展规划,建立保费收入的ARIMA模型并据此进行预测是十分必要的。本文试图根据我国已有的保费收入资料,建立保费收入的ARIMA模型并进行预测。
一、数据搜集与整理
(一)数据的搜集
本文数据来自中国保险监督管理委员会网站,时间区段为我国1999年1月~2005年7月全国的保费收入的分月度资料。以横轴表示时间(月份),纵轴表示各月份的保费收入x(万元),如图1所示 (图略,见原文,下同)。
由图1可知,各月全国保费收入x序列的均值显然不为零,且呈明显的上升趋势,是非平稳的时间序列,不符合建模的要求——数据零均值化、平稳化,故有待整理。
(二)数据零均值化 平稳化
首先对数据x序列取自然对数,令y=lnx,得数据y序列。再对y序列进行二次差分,得到z序列,即:,z关于时间的线形图,如图2(图略,见原文)。
图2表明,搜集的数据经上述处理后,基本符合零均值化、平稳化的要求。
(三)z序列零均值化、平稳化的检验
计算z序列的平均值,z=-0.002633≈0,序列已基本零均值化。
平稳性的检验,这里采用参数检验法,是指从序列的宽平稳性出发,通过检验序列的均值、方差等数字特征是否随时间的推移而变化。如果这些指标随时间的推移没有明显变化,则可认为序列是平稳序列。
现将z序列分列7个子序列,每一序列是1999~2005年各年的z指标值,分别计算7个子序列的均值、方差,如表1所示。
表1 各子序列的均值、方差表
根据平稳性的要求,均值在不同的子序列之间不应有显著差异。当显著性水平α为005时,子序列均值之差的检验分别为:
二、识别模型
根据上述已经准备的基本符合要求的数据,即1999.1~2005.7各月的全国保费收入零均值化、平稳化后的数据z系列,利用SPSS12.0,计算出该系列的自相关函数ACF和偏自相关函数PACF列于表2。
表2 z系列自相关函数与偏自相关函数表
带后期kACFPACF
滞后期kACFPACF
1 -0.611 -0.61117 -0.089 0.093
2 -0.018 -0.62318
0.207 -0.035
3 0.338 -0.15619 -0.021 -0.071
4 -0.284 -0.06620 -0.258 -0.087
5 -0.052 -0.34521
0.347 -0.041
6 0.253 -0.0331
22 -0.124 0.034
7 -0.040
0.20723 -0.261 -0.076
8 -0.294 -0.05924
0.451 -0.002
9 0.384 -0.08825 -0.255 0.068
10-0.134
0.14526 -0.097 -0.019
11-0.336 -0.32527
0.283 0.035
12 0.601
0.01328 -0.174 0.024
13-0.358
0.14329 -0.083 0.045
14-0.608
0.09830
0.164 -0.078
15 0.284
0.01731 -0.002 -0.075
16-0.191
0.03832 -0.225 -0.032
从表2自相关函数ACF和偏自相关函数PACF的值可以看出,二者都具有十分明显的拖尾性质,所以认为z系列适合ARMA模型,也就是说,1999.1~2005.7各月的全国保费收入x适宜拟合ARIMA(n,2,m)模型,拟合的模型形式为;
三、建立模型
建立模型的方法有BOX-JENKINS和PANDIT-WU等等,本文采用PANDIT-WU方法建模。其建模思想为:将非平稳时间序列转化为零均值、平稳化的时间序列,逐渐增加模型的阶数,拟合较高阶ARMA(2,2n-1),n从1开始,直到再增加模型的阶数而剩余平方和不显著减少为止。
根据已经零均值化、平稳化的时间序列z,采用SPSS12.0,对z拟合ARMA(2,1)、ARMA(4,3)及ARMA(6,5),结果如表3所示。
四、模型的检验
对于上述已经建立的模型,下面进行拟合优度检验、方程显著性检验、变量显著性检验和残差序列的白噪声检验。