小样本DF统计量的分布特征,本文主要内容关键词为:样本论文,特征论文,DF论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 概述
70年代以来,人们对经济时间序列的单位根检验问题作了大量研究,Dickey-Fuller(1979)推导出当一阶自回归时间序列模型自回归系数为1且误差项为独立的正态分布的随机变量时, 一系列参数估计量及相应统计量的极限分布。在此基础上Philips(1987 )又推导出上述模型当自回归系数为1, 模型误差项呈弱稳定状态时回归系数估计量及相应统计量的极限分布。与此同时多种关于单位根检验的方法也被提出,如Sargan-Bhargva(1983)的CRDW检验,Dicdey-Fuller的DF检验和ADF检验,Phillips-Perron(1988)的Z检验。Fuller(1976)用蒙特卡罗方法给出DF和ADF检验的临界值表(但对小样本只给出25和50两个)。 研究DF和ADF统计量在有限样本条件下的分布时, 人们多着眼于大样本的研究(样本容量在100以上),如Engle-Granger(1987),Engle- Yoo(1987)和Evans-Savin(1981,1984)等,而对于小样本条件下DF 和ADF统计量分布特征以及检验功效却研究甚少。
Blangiewicz-Charenmza(1990)是一篇研究小样本ADF协整检验的文章,但并末对检验的功效作出分析。因为在有些国家以年为单位的经济时间序列的最大可供观测个数并不很大,所以研究单位根检验统计量的小样本分布特性有着非常重要的实际意义。
本文第二部分介绍DF统计量的极限分布表达式。第三部分给出小样本(10-55)DF分析的蒙特卡罗模拟结果及样本容量等于30 条件下的三个自回归模型的DF检验功效。在此基础上作出分析并给出小样本DF检验的临界值表,第四部分以中国出口贸易额为例介绍小样本DF检验,最后部分给出结论。
2 DF统计量的极限分析
本文考虑以下三种模型
x[,t]=βx[,t-1]+u[,t] (1)
x[,t]=c+βx[,t-1]+u[,t]
(2)
x[,t]=c+αt+βx[,t-1]+u[,t] (3)
条件下的小样本DF统计量的分布特征,在模型(1),(2)和(3)中假定u[,t]服从独立的同一的正态分布即u[,t]~IID(0,σ[2] ),x[,0]=0和β=1。对于模型(1)当样本容量T→∞时,相应于β的DF 统计服从如下Wiener过程函数的分布:
其中W(i)是标准的Wiener过程,见Phillips(1987),对于模型(2)和(3),当T→∞时,DF统计量也服从Wiener 过程函数的分布,见Phillips-Perron(1988)
3蒙特卡罗模拟及结果分析
以模型(1)其中β=1为数据生成系统,设定u[,t] 为相互独立的标准正态分布的随机变量,即u[,t]~IID(0,1)以及x[,0]=0.则x[,t] 必是一个单整阶数为一的随机过程, 即x[ , t] ~I (1 )用Mathematica所生成均值为0,标准差为1的伪随机正态变量模拟u[,t],作一阶累加之后从而按给定的样本容量生成一个关于x[,t] 的时间序列。显然x[,t]序列的单整阶数为一,以这个生成的x[,t]序列为样本如果按模型(1),(2)和(3)中的任何一个用OLS法去估计β,就会计算出一个与
相应的DF统计量的值,如反复模拟多次就会得到一个DF统计量的估计分布。本文将样本容量分为10,15,20,25,30,35,40,45,50和55十种,以(1),(2)和(3 )每一个模型及每一个样本容量相配合均模拟4000次,用这4000个DF值画直方图,估计小样本DF分布的均值,标准差,偏度,最大值,最小值,第1,5,10百分位数以及计算用以检验正态分布性的JB(Jarque-bera)统计量的值,模拟结果见表1。依据这些计算结果对DF分布作出分析,此外还对DF检验在上述三种模型中的检验功效作出模拟(设T=30)见表2。每种情形(取β=0.9,0.8和0.7)各模拟2000次。
为便于分析,对表1中每一个模型用分布的第1,5,10百分位数,均值,标准差,偏度分别与样本容量的倒数(1/T )求相关系数得表3。依据表1和表3,DF统计量的小样本分布特征分析如下。
表1蒙特卡罗模拟结果
百分数
模型T
最小值
最大值均值
1% 5% 10%
10
-2.872
-1.990
-1.667
-4.396
4.973
-0.358
15-2.63
-1.986
-1.604
-4.242
4.067
-0.375
20
-2.644
-1.931
-1.626
-4.172
5.182
-0.403
25
-2.710
-1.964
-1.606
-3.881
4.546
-0.393
30
-2.616
-1.964
-1.586
-4.985
4.687
-0.409
(1) 35
-2.684
-1.946
-1.6223.756 -4.194
-0.403
40
-2.603
-1.949
-1.638
-3.594
4.038
-0.418
45
-2.579
-1.869
-1.574
-3.461
4.320
-0.413
50
-2.573
-1.954
-1.603
-3.757
4.800
-0.407
55
-2.543
-1.973
-1.590
-4.719
4.197
-0.413
10
-4.552
-3.273
-2.824
-9.454
2.369
-1.525
15
-3.902
-3.049
-2.662
-7.039
1.974
-1.506
20
-3.754
-3.003
-2.635
-5.719
2.312
-1.536
25
-3.684
-2.998
-2.608
-5.149
1.815
-1.519
30
-3.617
-2.902
-2.599
-4.730
1.788
-1.496
(2) 35
-3.645
-2.951
-2.580
-6.195
2.120
-1.513
40
-3.593
-2.914
-2.607
-5.687
2.058
-1.545
45
-3.619
-2.893
-2.595
-4.097
2.500
-1.535
50
-3.558
-2.903
-2.605
-5.119
2.434
-1.547
55
-3.525
-2.913
-2.604
-4.542
2.901
-1.529
10
-5.325
-4.089
-3.472
-8.359
1.264
-2.174
15
-4.652
-3.806
-3.355
-6.193
1.301
-2.174
20
-4.537
-3.655
-3.288
-9.670
1.453
-2.165
25
-4.409
-3.625
-3.236
-6.858
1.311
-2.196
30
-4.346
-3.553
-3.201
-5.307
1.343
-2.180
(3) 35
-4.287
-3.530
-3.204
-6.132
1.633
-2.188
40
-4.212
-3.512
-3.187
-5.380
0.902
-2.168
45
-4.037
-3.490
-3.155
-5.247
1.360
-2.174
50
-4.088
-3.479
-3.173
-5.328
1.014
-2.168
55
-4.223
-3.565
-3.225
-5.738
0.695
-2.210
模型T 标准差 偏度 Jarque—Bera
10 1.036
0.216
102.55
15 1.039
0.248
108.70
20 1.013
0.387
179.41
25 1.008
0.316
136.01
30 1.012
0.397
224.90
(1) 35 1.006
0.32198.80
40 1.000
0.368
124.13
45 0.987
0.416
152.65
50 1.003
0.394
126.61
55 0.990
0.388
187.06
10 1.050 -0.392
624.56
15 0.944 -0.102
161.36
20 0.907 -0.023 53.87.36
25 0.899
0.02034.49
30 0.889
0.10623.10
(2) 35 0.884
0.07380.93
40 0.872
0.171
102.99
45 0.868
0.222
152.28
50 0.859
0.15268.33
55 0.864
0.21282.84
10 1.062 -0.752 1172.70
15 0.926 -0.331
139.30
20 0.898 -0.373
754.85
25 0.852 -0.088
159.24
30 0.815 -0.14964.17
(3) 35 0.825 -0.076
122.65
40 0.802 -0.10956.20
45 0.789 -0.01777.71
50 0.795 -0.02328.08
55 0.804 -0.09732.08
注:对每一种模型和每一T值,均模拟4000次。
表2DF统计量的检验功率(T=30)
模型β=0.9β=0.8β=0.7
1% 5%10% 1% 5%10% 1%5% 10%
(1) 0.03 0.17 0.34 0.13
0.45 0.69 0.32 0.75 0.91
(2) 0.01 0.09 0.16 0.03
0.16 0.29 0.08 0.31 0.48
(3) 0.01 0.06 0.12 0.02
0.11 0.19 0.03 0.16 0.29
每一种模型和每一β值,均模拟2000次
通过JB统计量的值可以看出小样本DF统计量的分布是偏倚的,不服从正态分布。
对于模型(3)而言,小样本DF统计量的分布呈左偏态, 但左偏的程度却随样本容量的增大而减小,对于模型(2)而言,小样本DF 统计量的分布随着样本容量的增大从左偏态变为右偏态,样本容量为10和55的两个分布见图1。样本容量为10时,分布为左偏态,样本容量为55 时,分布为右偏态,对模型(1)而言,小样本DF 统计量的分布呈右偏态。右偏的程度随着样本容量的增大而增大。所以从总体上说小样本DF统计量的分布随着样本容量的增加有从左偏变为右偏的趋势,从表3 中偏度一列的三个相关系数可以看出这种变化很有规律。
表3表1中百分位数、均数、标准差、偏度与1/T间的相关系数
模型 百分位数 均值标准差
偏度
1% 5%10%
(1) -0.88
-0.58 -0.780.95
0.89
-0.82
(2) -0.96
-0.96 -0.930.28
0.98
-0.98
(3) -0.98
-0.98 -0.970.27
0.99
-0.95
图1关于模型(2)的DF小样本分布
依据三个模型的模拟结果均显示:小样本DF统计量分布的标准差随样本容量的增大而减小。这种变化可以从表1 中最大值和最小值的变化看出。表3中标准差一列的三个相关系数很高, 说明这种变化亦很有规律。
小样本DF分布的第1,5和10百分位数都随着样本容量的增大而增大,通过表3中百分位数的三列相关系数可以看出, 随着模型中加入漂移项(常数c)和趋势项(时间t),样本容量的变化与临界值的变化呈高度线性关系。
从表3中均值一列的三个相关系数分析,一个高度相关, 两个不相关,为此我们又以样本容量为100,用上述三个模型估计DF分布, 对模型(1),(2)和(3),均值依次是-0.407,-1.546和-2.199,可见不能认为样本容量的变化与DF分布均值的变化有关系。表3 中相对于模型(1)的高相关系数0.95只不过是一种巧合,相对于模型(2)和(3)的0.28和0.27才是正常的。
对模型(1),(2)和(3)分别用第1,5,10 百分位数与样本容量的倒数进行回归,得九个回归函数(亦称作响应面),见表4。表5给出用表4中回归函数计算的小样本DF检验的临界值表,表5中只列出十个样本值。而10至55 间任何一个样本容量值所对应的临界值都可以用表4中的九个回归函数算出。
表4 临界值(CV)和I/T的回归函数
模型百分数
回归函数
R[2]
1 CV=-2.5145-3.1628(1/T) 0.77
(-86.20) (-5.12)
(1) 5 CV=-1.9182-0.7158(1/T) 0.33
(-112.41) (-1.99)
10 CV=-1.5803-0.8629(1/T) 0.60
(-135.38) (-3.49)
1 CV=-3.2889-11.2891(1/T)0.92
(-60.50) (-9.81)
(2) 5 CV=-2.8110-4.2471(1/T) 0.92
(-137.59) (-9.82)
10 CV=-2.5286-2.5574(1/T) 0.86
(-146.62) (-7.01)
1 CV=-3.8449-14.0541(1/T)0.95
(-73.43) (-12.68)
(3) 5 CV=-3.3421-7.1372(1/T) 0.96
(-135.62) (-13.68)
10
CV=-3.0092-3.7010(1/T) 0.94
(-203.13) (-11.46)
模型百分数s.e. F DW
1 0.048 26.24
2.19
(1) 5 0.028 3.95
2.61
10 0.019 12.19
2.45
1 0.089 96.27
1.42
(2) 5 0.034 96.46
2.34
10 0.028 49.08
1.23
1 0.086160.79
1.90
(3) 5 0.040187.23
1.18
10 0.025131.35
1.06
注:1.括号内的值为t检验值 2.T是样本容量 3.s.e.是回归函数的标准差。
表5 小样本DF统计量的临界值
模型
T 检验水平
0.01 0.050.01
10 -2.83-1.99-1.67
15 -2.73-1.97-1.64
20 -2.67-1.95-1.62
25 -2.64-1.95-1.61
(1)和(4)
30 -2.62-1.94-1.61
35 -2.60-1.94-1.60
40 -2.59-1.94-1.60
45 -2.58-1.93-1.60
50 -2.58-1.93-1.60
55 -2.57-1.93-1.60
10 -4.42-3.42-2.78
15 -4.40-3.09-2.70
20 -3.85-3.02-2.66
25 -3.74-2.98-2.63
(2)和(5)
30 -3.67-2.95-2.61
35 -3.61-2.93-2.60
40 -3.57-2.92-2.59
45 -3.54-2.91-2.59
50 -3.51-2.90-2.58
55 -3.49-2.89-2.58
10 -5.25-4.06-3.47
15 -4.78-3.82-3.35
20 -4.55-3.70-3.28
25 -4.41-3.63-3.25
(3)和(6)
30 -4.31-3.58-3.22
35 -4.25-3.55-3.20
40 -4.20-3.52-3.19
45 -4.16-3.50-3.18
50 -4.13-3.48-3.17
55 -4.10-3.47-3.17
图2 中国年出口贸易额(以1990年为不变价格)
表2显示模型(1)的DF检验功效最高,模型(2)的次之, 模型(3)的再次之,由此而论, 在实际单位根检验中以尽量不用漂移项和趋势项为宜(即尽量不使用模型(2)和(3))。
4举例
分别从模型(1),(2)和(3)的两边减去x[,t-1] 得如下三个模型:
△x[,t]=ρx[,t-1]+u[,t] (4)
△x[,t]=c+ρx[,t-1]+u[,t]
(5)
△x[,t]=c+α+ρ△x[,t-1]+u[,t] (6)
其中△x[,t]=x[,t]-x[,t-1],ρ=β-1,上述模型(4),(5)和(6)是检验单位根的常用形式。零假设(H[,0])是ρ=0,相当于β=1。
现以我国年出口贸易时间序列(1961~1991,单位:人民币亿元)为例作单位根检验,见图2(数据引自《中国统计年鉴,1992》, 以1990年价格为不变价格)。中国的年出口贸易额增长很快,以不变价格计算,1961~1991的年增长率为13.15%。 自中国施行改革开放政策以来,1980~1991的年增长率为18.94%。从总体上看,除了在1989 年出现实质性回落外,出口贸易一直呈增长势头。为消除异方差,先对数据作对数变换,然后作DF检验,检验结果见表6。表中回归函数值1和2 是分别采用模型(4)和(5)作单位根检验。由于DF值分别等于5.63和1.79,远远大于临界值1.54和-2.95(检验水平为0.05), 所以接受零假设ρ,即认为该时间序列中含有一个单位根,是不平稳的。表6 中回归函数3和4分别是差分后的出口贸易序列,再次用模型(4)和(5)进行检验。因DF值分别是-2.26和-3.84,若取检验水平为0.05,可以认为一阶差分后的出口贸易额序列不含有单位根,即认为差分后的序列是平稳的,即I(0);据此中国的年出口贸易额序列应是具有一阶单整性的非平稳序列,即I(1)。
表6出口贸易额和差分后的出口贸易额时间序列的单位根经验
i 回归函数s.e.
DW
1△expers[,t]=0.0216expers[,t-1]0.13 1.45
(5.63)[*]
2△expers[,t]=-0.0994+0.0379expers[,t-1]0.13 1.50
(-0.78) (1.79)[*]
3△△expers[,t]=-0.3322△expers[,t-1] 0.14
1.92
(-2.26)[*]
4△△expers[,t]=-0.0916-0.6846△expers[,t-1]
0.12
1.81
(2.91) (-3.84)[*]
注: 1.带*括号内的值是DF值,不带*是t检验值.
2.△表示一阶差分,△△表示二阶差分.
3.s.e.表示回归函数的标准差.
5结论
尽管DF统计量的极限分布服从Wiener过程的函数,但小样本DF分布却因样本容量和估计模型的不同而差异很大(大样本时差异较小)。我们亦曾以样本容量为100用模型(1),(2)和(3)模拟DF的分布,则分布都呈右偏态。
Blangiewicz-Charemza(1990)指出,由于不知道小样本协整检验的功效,他们的结果不能够说明小样本的协整检验是否有效。 本文中DF的小样本分布可以看作是该论文中协整检验的一个特例。 我们作了检验功效分析(见表2),发现小样本DF检验的功效普遍偏低, 相比较模型(1)条件下的小样本DF检验的功效最高,但仍低于 Engle-Granger(1978)在他们论文的表2中所报的DF统计量在样本容量为100时的检验功效,我们的结论是表5可以作小样本DF检验用,但在实际DF 检验中应尽量采用大样本,尽量用模型(1)或(4)为好。
另外,我们认为Blangiewicz-Charemza(1990)断定,“随着样本容量趋于无穷大,分布均值从1.023向-1.394移动”,是不恰当的,因为1)据我们模拟的结果,样本容量的倒数与DF 分布的均值间不存在线性关系,分布的均值不存在规律性漂移。2)据Fuller(1976)第373页上的DF检验临界值表,当样本容量从25至无穷大时,第10百分位数的最大变动差是-3.12-(-3.24)=0.12。由本文第三部分对模拟结果的分析知,随着样本容量的增大DF分布呈右偏态且分布的标准差逐渐减小,所以可以推定,DF分布均值的变动差不会超出0.12。
标签:样本容量论文; 回归模型论文; 总体标准差论文; 检验统计量论文; 样本均值论文; jb统计量论文; 特征函数论文; 数据分析论文;