随机系数离散时间序列模型_mape论文

随机系数离散值时间序列模型,本文主要内容关键词为:系数论文,序列论文,模型论文,时间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

离散值时间序列数据在现实生活中相当普遍,比如股票的大宗交易、失业数据和不规则金融事件等。但是关于这类数据建模与分析方法最近才发展起来,主要原因是利用传统连续时间序列的相依结构来度量离散值时间序列基本上不可行。关于离散值时间序列数据的建模,众多学者做了有益尝试。比如,Mardia[1](1973)研究了具有Markovian输入的大坝流量问题;Harvey和Fernandes[2](1989)利用状态空间模型建立了计数数据运动模型;Hujer[3]等人(2002)提出了Markov Switching ACD模型来预测金融交易量过程;Ferland,Latour和Oraichi[4](2006)研究了整数值GARCH过程的构建与估计;Andersson和Karlis(2010)[5]研究了整数值自回归过程中缺失数据的填补问题。类似的文献还很多,综合起来大致可以归为三类:①利用转移概率建立相依结构的Markov链模型;②利用潜在过程建立相依结构的状态空间模型;③利用打薄算子建立相依结构的thinning模型。整值滑动平均模型(INMA)属于经典的thinning模型。

第一个提出INMA模型的是Al-Osh M.and Alzaid A[6](1988),在用ARMA模型来描述相依泊松计数过程中用到了INMA模型,Brnns和Quoreshi[7](2010)给出了INMA(q)模型参数的条件最小二乘估计、可行最小二乘估计和CMM估计。在这些模型中,变量的系数是常数。受到Zheng,Basawa,Datta[8](2006)关于整值随机系数自回归模型研究的启发,本文提出了一类特殊的整值随机系数滑动平均模型。由于模型的建立需要用到Steutal和Harn[9](1979)定义的“thinning”算子,现在来回顾一下它的定义。

定理5的证明方法比较容易,这里从略。

四、模拟研究

为了比较定理5中估计量的小样本性质与大样本性质,本文利用Monte Carlo模拟试验估计了样本均值、样本偏差Bias、均方根误差RMSE与相对误差MAPE等四个统计指标来衡量估计效果。在定理5中有四个估计量,由于讨论方法相同且结果类似,限于篇幅本文只讨论估计量的估计效果。下面考虑哪些因素可能对模拟估计结果产生影响。显然,Beta分布的参数α与β的取值大小会对估计结果有重要影响。这是因为随着Beta分布的参数α与β的不同,它有五种典型的密度函数曲线。而且随机过程服从参数为的泊松分布,所以λ的取值大小对过程有重要影响。此外,很容易看出滞后阶数q的长度、样本容量N的取值大小下也对估计量的好坏产生影响。考虑到影响因素较多,所以本文分情况讨论。

针对以上各种影响因素,本文主要分三种情形讨论,每一种情况都考虑样本容量大小对估计量的影响,在本文的模拟研究中样本容量N的取值分为小、中、大三类:N=50、N=100、N=300。这三种主要情形分别是:①Beta分布的参数α与β的不同取值大小;②q的不同滞后阶数;③λ的取值大小。衡量估计结果好坏的四个统计指标样本均值、样本偏差Bias、均方根误差RMSE与相对误差MAPE的计算方法,我们也分三种情形讨论。

情形1:Beta分布的参数α与β的不同取值对估计量的影响。

由于Beta(α,β)分布的密度函数曲线主要分为五种类型(α<1,β<1)、(α>1,β>1)、(α=1,β=1)、(α>1,β>1)、(α<1,β>1),所以本文模拟了这五种情况,(α,β)对应的参数取值分别是(0.1,0.3)、(1.1,1.3)、(1,1)、(1.3,0.1)、(0.1,1.3)。根据后文(情形2、情形3)的模拟结果可以知道:滞后长度q与λ的取值大小对估计量的影响不大,所以对于情形1本文选择了滞后长度q与λ大小均适中的情况来模拟,即模拟了q=3、λ=3时估计量的四个统计指标。下面以参数(α,β)取值(0.1,0.3)时为例,给出它们的计算方法:①首先生成容量为50、100、300的三个不同的样本;②其次分别在样本容量50、100、300下,计算三个的估计值;③对于前面2个步骤重复计算200次。对每一种样本容量,可以计算200个的估计值,例如样本容量为50时,这四个衡量估计效果的统计指标计算公式为:

样本均值 、均方根误差

其中λ表示真实值,具体模拟结果见表1。

表1 λ=3、q=3时,统计量、Bias、MAPE、RMSE的估计值

情形2:q的不同滞后阶数对估计量的影响。

在情形1中可以看出Beta分布的参数α与β的大小对估计量的影响不大,且根据后文(情形3)λ的取值大小也对的估计值影响较小,所以对于情形2,本文只模拟(α<1,β>1)、λ=3时估计量的四个统计指标的取值情况。这四个统计指标的计算方法和情形1相同,模拟时参数(α,β)取值为(0.1,1.3);考虑到通常应用的时间序列的滞后阶数较短,所以q的取值大小为1-5,其中q=3时参见情形1,详细结果见表2。

表2 λ=3、(α<1,β>1)时,统计量、Bias、MAPE、RMSE的估计值

情形3:λ的取值大小对估计量的影响。

根据情形1与情形2可知Beta分布的参数α与β的取值大小与滞后阶数q的取值大小均对的估计值影响较小,所以在情形3中仅模拟(α<1,β>1)、q=3时估计量的四个统计指标的取值情况。这些统计指标的计算方法和情形1相同,模拟时参数(α,β)取值为(0.1,1.3);结合通常应用的泊松分布的参数λ取值大小,且前面已经模拟过λ=3的情况,本文的λ取三个值1、5、10,详细结果见表3。

表3 q=3、(α<1,β>1)时,统计量、Bias、MAPE、RMSE的估计值

从表1的模拟结果可以看出,对于五种密度函数的每一种类型样本均值与真实值都相差不大,同时相对误差MAPE与均方根误差RMSE也比较小。下面以(α<1,β<1)这种情况为例,进行详细阐述。它的最高绝对偏差是0.0200、最低绝对偏差是0.0040,无论哪一个值都与真值3差别不大;同时相对误差MAPE最高为0.1109、均方根误差RMSE最高为0.4068,说明这些估计值的波动范围不大,大都落在真值3附近。从样本容量来看,随着样本容量的增大越来越接近于真实值,因为Bias一直在减少。同时随着样本容量变大,波动范围也在迅速变小,因为MAPE与RMSE的减少幅度较大。例如RMSE,当样本容量从50变到100时,RMSE的取值减少了27.21%;当样本容量从100变到300时,RMSE的取值减少了49.67%。对于同一样本容量,例如N=100时,随着Beta参数(α,β)的变化,这四个统计指标、Bias、MAPE、RMSE都无明显规律性。关于对于(α,β)取值的其他情况,都和(α<1,β<1)情况差不多,不再赘述。根据表1的结果可推知:无论哪一种密度函数,Bias、MAPE、RMSE都较小,说明从偏差与波动程度来看,受(α,β)取值的影响程度较小。

从表2可以看出,对于同一样本容量,随着滞后阶数q的增大,Bias的取值比较小,但它的变化无明显规律性;而MAPE与RMSE的取值均较小,不过它们一直在增加,但增加的幅度不大。例如样本容量N=100时,Bias的绝对值最大的是0.0324,说明估计结果离真值相当近;样本容量N=100时Bias取值正负都有,其绝对值的大小随着q的增加既有变大又有变小,无明显趋势。样本容量N=100时,MAPE的取值为0.0671、0.0760、0.0843、0.0963、0.1055,说明估计量的波动程度相当小;随着滞后阶数的增加,它的增加幅度依次为13.26%、10.92%、14.23%、9.55%,以上数字说明MAPE的增加幅度不大。由于RMSE的增加情况与MAPE类似,不再赘述。根据表2的结果可知:对于不大的滞后阶数,Bias都相当小,体现波动程度的MAPE与RMSE从绝对量来看也较小,所以滞后阶数的不同对估计结果影响也较小。

从表3可以看出随着λ变大,对于相同样本容量的估计量:Bias的变化并无规律;MPAE在一直减小;RMSE在一直增大。Bias有时增大、有时减小,例如对于样本容量N=50时,Bias的绝对量先从0.0092增加到0.0833,再减小到0.01;而N=100时,Bias的绝对量一直在增加,先从0.005增加到0.0341,再增加到0.0502。而MAPE减少的幅度先大后小,例如N=300时MAPE减少的幅度为47.74%、17.60%,N=50时MAPE减少的幅度为40.76%、17.66%。RMSE的增加幅度均较大,例如N=100时RMSE增加的幅度为177.15%、63.91%,N=50时RMSE增加的幅度为188.21%、69.83%。此外对于相同的λ,随着样本容量的增加,Bias、MPAE、RMSE均一直减小。根据表3的结果可知:对于常用的不大的λ值,偏差Bias都比较小,波动程度MAPE与RMSE从绝对量来看也较小,所以λ的不同对估计结果影响也较小。

综合表1、表2和表3的结果可知,本文得到的一致估计量的小样本性质、大样本性质均较好;无论从随机系数密度函数的变化、滑动平均滞后阶数的变化、样本容量大小的变化与参数λ取值的变化来看,估计量的误差均较小,说明估计结果比较稳健。在定理5中的其余三个估计量也有类似结果,限于篇幅,不再赘述。

五、结论

最近30年来,关于离散值时间序列的国外文献资料汗牛充栋。国外学者大多从事理论研究,具有一定深度;而国内大多集中在实证研究上,理论研究的深度和广度都很欠缺。国内外的研究热点主要集中在参数估计、平稳性与模型定阶上。

本文的主要工作在于推广了q阶固定系数整值滑动平均模型,允许系数是随时间(或者指标t)变化而变化的Beta分布的随机变量。得到该随机过程的一维分布与一、二阶矩,证明了该随机过程是宽平稳过程,均值与协方差具有遍历性,求得了系数的矩法估计,并证明了矩法估计具有遍历性。模拟结果显示估计量的统计性质较好。

连续时间序列模型的定阶处理比较完善,但离散值时间序列的模型定阶是一个公开的问题,具有一定难度。而随机系数的模型定阶则更复杂,故这个问题是以后研究方向之一。现在大多数国外文献热衷于理论研究,实际应用的案例较少,特别是证券与金融的相关案例更少。如何结合实际数据改造现有模型是一个值得注意的研究方向。统计模型还有一个大的内容是参数的检验,在离散值时间序列中这类文献很少,应该是理论界关注的重点。

标签:;  ;  ;  ;  ;  

随机系数离散时间序列模型_mape论文
下载Doc文档

猜你喜欢