基于蒙特卡罗模拟的误差序列自相关检验研究论文

基于蒙特卡罗模拟的误差序列自相关检验研究

叶宗裕a,王卫杰b

(浙江师范大学 a.经济与管理学院;b.数学与计算机科学学院,浙江 金华 321001)

摘要: 进行计量经济分析时一般都要检验模型是否存在自相关性,但目前常用的几种自相关检验方法都不同程度地存在一些问题,对此进行进一步的研究有重要意义。对于一阶自相关性检验,DW检验是最常用的方法,但其存在两个不确定区域。针对给定的解释变量,运用模拟方法,可以得到DW检验的临界值,从而克服了其存在不确定区域的缺陷。回归检验法则无可用的临界值,也可以用模拟方法计算其临界值,而且除检验功效很接近1的情形外,回归检验法的功效显著大于DW检验,可以替代DW检验。当样本量不是很大时,LM检验统计量的临界值与卡方分布的临界值差距较大,不能使用标准卡方临界值。在LM检验中,通常通过对最高阶滞后项系数进行t 检验以确定自相关的阶数,但LM检验中最高阶滞后项系数的t 统计量与标准t 分布有较大差距,也不能用t 分布临界值。

关键词: DW检验;LM检验;回归检验法;检验功效;临界值;蒙特卡罗模拟

一、引言及文献综述

由于经济发展的连续性所形成的“惯性”,使得许多经济变量的前后期值之间是相互关联的。经济发展的这种惯性作用,使得利用时序数据建立计量经济模型时经常会遇到“自相关性”的问题,即模型中随机误差项μ t 的各期值之间存在着较强的相关关系。自相关性的存在将会增大模型系数的估计误差,降低统计检验的可靠性和预测的精度。因此,进行计量经济分析时一般都要检验模型是否存在自相关性,并根据自相关性的类型采取相应的解决方法。

自相关性的检验方法有多种,如回归检验法、DW检验法、LM检验等。回归检验法是以残差e t 为被解释变量,以残差滞后项e t-1 、e t-2 等为解释变量建立辅助回归方程,如果方程显著成立,则模型存在自相关性。回归检验法的优点是一旦确定了模型存在自相关性,也就同时知道了自相关的形式,而且它适用于任何类型的自相关性的检验[1]。但是回归检验法由于没有明确的临界值,在实际中几乎没有得到应用。在实际应用中,一阶自相关性是人们最常考虑的形式, DW检验是检验一阶自相关性的一种经典方法,在一般的计量经济学教科书中,DW检验是重点介绍的自相关检验方法,许多统计分析软件在建立模型时也将DW统计量值作为基本统计量直接输出。由于DW统计量的分布及其临界值,不仅与样本容量n 和解释变量数目k 有关,还与解释变量序列的具体取值有关。Durbin和Watson考虑了不依赖于解释变量取值的两个极限分布,DW统计量位于这两个极限分布之间[2]。所以,Durbin和Watson根据样本容量n 和解释变量数目k ,在给定置信度α 下,建立了DW检验统计量的下临界值d L 和上临界值d U [3]。若DW≤d L ,则有正自相关;若d U <DW<4-d U ,则无自相关;若DW≥4-d L ,则有负自相关;若d L <DW<d U 或4-d U <DW<4-d L ,则不确定。即DW检验存在两个不能确定的区域。虽然对于这两个区域内的自相关的判定问题,Durbin和Watson引入统计量d *,通过比较d *与d 值的大小关系进行判定[4]。但因d *的计算公式复杂,在实际中几乎没有被应用。大多数计量经济学文献都把存在不确定区域看作是DW检验的一个重大缺陷。

此外,DW检验的使用需要满足一些先设条件,如:待检验的回归模型包含截距项,解释变量X 是非随机的,解释变量中不包含滞后的被解释变量等。刘明和王永瑜对这些先设条件存在的原因逐一进行了分析讨论,并由此引出另一些不被注意的先设条件[5]。当模型中含有被解释变量的滞后项时,DW统计量的取值有经常偏向于2的缺陷,Durbin提出使用h 统计量,对含有被解释变量滞后项模型的自相关性进行检验[6]。为了克服DW检验的缺陷,统计学家Breusch和Godfrey(1978)提出了一种新的检验方法,即拉格朗日乘数检验法(LM检验)。这种方法允许被解释变量的滞后项存在,同时还可以检验高阶自相关[1]158。若无自相关的原假设为真,在大样本情况下,LM统计量渐近服从2分布。

但在大多数应用中,样本往往都不是很大。在样本不大的情况下,LM统计量的分布与2分布会有较大差距,用2分布的临界值进行检验,可能会给出错误的结果。Mei-Yu Lee指出,由于受样本量和自变量个数的影响, LM统计量在小样本情况下并不趋向于卡方分布,只有当样本量大于1 000时, LM统计量才接近卡方分布[7]。另一方面,由于LM检验不能直接确定自相关的阶数。针对这一问题,刘汉中提出对残差最高阶滞后项的回归系数进行常规的t 检验,以此来确定自相关的阶数[8]。但由于辅助回归中的残差滞后项具有随机性及相关性,残差最高阶滞后项回归系数的t 统计量并不服从标准t 分布,用常规的t 检验可能会给出错误的检验结果。

本文主要做了以下几项工作:第一,针对不同的解释变量,运用蒙特卡罗模拟方法,通过EViews软件编程,得到DW检验、回归检验、LM检验的临界值和LM检验中最高阶滞后项回归系数t 统计量的临界值,并分析临界值的一些特点。根据DW检验和LM检验的模拟临界值进行序列自相关检验,可以避免DW检验存在不确定区域和LM检验的临界值不准确的缺陷。第二,当用模拟方法确定临界值时,可采用回归检验法进行自相关性检验,即用残差e t 对e t-1 回归系数的估计量ρ 和其t 统计量作为检验统计量,分别称为ρ 检验和t 检验。通过蒙特卡罗模拟方法,计算了DW检验和回归检验法的检验功效,结果表明,回归检验法的检验功效优于DW检验,可以作为DW检验的替代方法。第三,在LM检验中,通常通过对最高阶滞后项系数进行t 检验以确定自相关的阶数,但模拟计算表明,LM检验中最高阶滞后项系数的t 统计量不服从标准t 分布,且小样本情况下差距较大,不能用标准t 分布临界值进行检验,在实际检验时,可以用模拟方法计算临界值。最后举了两个应用案例。

第三步,谋划路径,形成共生性。采用情感分析技术,以市场偏好为导向,明确每个古村古镇的发展优势和差异化方向,完成共生发展路径谋划。

二、蒙特卡罗模拟的具体方法及EViews程序

为节省篇幅,本文仅就DW检验时,蒙特卡罗模拟的具体方法及EViews程序进行说明,其他检验时的方法类似(1) 读者若需要,可向作者索要EViews 软件的程序,读者在对实际模型进行DW 检验时,只要参照说明进行操作,就可以计算出相关检验的临界值。。假设在实际应用中,一个被解释变量y 与k 个解释变量x 1,x 2,…,x k 之间有线性模型关系,当给定解释变量的样本序列时,由于DW检验的原假设与随机误差项之间相互独立,因此可取:

y =b 0+b 1x 1+b 2x 2+…+b k x k +μ ,

y t =b 0+b 1x tt

为研究DW检验临界值的特点,本文选取了约20个实际的时间序列数据和几组标准正态分布、均匀分布的随机数序列,针对不同的样本量,进行了模拟计算。从这些模拟结果可以得出一些普遍性的结论。因篇幅所限,本文仅给出样本量n 为30的一元线性回归模型时,解释变量分别取有代表性的四种变量时的模拟结果,见表1所示。表1中的变量x 1、x 2、x 3是威廉·H.格林提供的数据文件TableF5-1中的变量M1、TBILRATE、INFL从1976年起的100个数据(2) 数据文件可从参考文献[9]中附录F所示网址中下载。 [9],NDR是一个固定的标准正态分布随机数序列(3) 根据作者的理解,随机数序列具有更广泛的代表性。 。这里取各变量的前30样本值。查DW检验临界值表可得,一个解释变量,样本量为30时,显著水平分别为0.01和0.05时临界值的上界和下界,也在表1中列出。表1中的最后三列分别给出各变量对应的50万个DW统计量的均值、标准差,以及对于检验H0:μ =2,H1:μ 2的检验统计量Z值,Z值服从标准正态分布。Durbin和Watson在其经典论文中没有给出显著水平为0.1的临界值,作者所见的文献中也没有显著水平为0.1的临界值。为论述方便,下文将DW检验临界值表中的临界值称为经典临界值。

(1)

以K t 、L t 、Y t 分别表示1978—2000年陕西省资本存量、就业人数和地区生产总值[10],建立C-D生产函数模型,得回归结果如下:

三、DW检验的模拟临界值及其特点

μ ~i.i.dN (0,σ 2)

表 1样本数为 30不同解释变量时 DW检验的模拟临界值

根据表1及其他许多次随机模拟实验的结果可得如下结论:首先,DW统计量的分布不是关于2对称的分布,但都在经典临界值的上、下界区间内。从Z 值可以看出,全部都非常显著地拒绝原假设。由此可知,对于变量x 1、x 2、x 3,其DW统计量的均值大于2;而对于变量NDR,其DW统计量的均值小于2。其次,不论是正、负序列相关检验,对于实际的时间序列,各个模拟临界值都与经典临界值中较大的一个比较接近,而且在很多情况下,在保留两位小数时,模拟临界值与经典临界值中较大的一个完全相等;只有解释变量是随机数序列时,模拟临界值位于两个经典临界值的中点附近。也即当解释变量波动频数与波动幅度较小时,模拟临界值与经典临界值中大的一个相差较小,而当解释变量波动频数与波动幅度较大时,模拟临界值与经典临界值的上界相差较大。由于大多经济序列都存在趋势性,波动不大,所以在实际应用中,如果不通过模拟方法计算临界值,也可以直接采用经典临界值的上界进行检验。

四、回归检验法的临界值及其特点

稀土元素(RE)在元素周期表中处于第IIIB族,其大多数元素离子形式的特征价态为正三价态(RE3+)。一般来说,镧系元素(RE)在4f、5d和6s轨道都有电子分布,因而能出现大量的能级结构[1]。由于大部分稀土元素的4f能级组态基本类似,同时它们又都具有相同的原子结构。含有稀土离子的化合物具有独特的化学性质和物理特性,在各个领域都有着广泛的应用,其中在光电传感元件等领域的应用尤为广泛[2]。

实际上,DW检验除了存在不确定区域外,还有一个问题是DW统计量比较复杂,不易为初学者所理解。在许多相关的文献中,在介绍DW检验时,都将DW统计量转化为残差e t 与e t-1 的相关系数ρ 的表达式,再通过ρ 分析DW统计量的取值范围及具体意义。根据作者的理解,Durbin和Watson提出DW检验,主要是为了能够在理论上研究DW统计量的分布特性,确定其临界值。但当我们用模拟方法确定临界值时,则用回归检验法更加直接。而且后文的模拟结果表明,回归检验法的检验功效高于DW检验。

由于ρ 及其t 统计量的取值可正可负,所以当进行负的自相关检验时,是左侧检验,对应于显著性水平为0.01、0.05、0.1的临界值分别是相应50万个模拟统计量值的0.01、0.05、0.1分位数;当进行正的自相关检验时,是右侧检验,对应于显著性水平为0.01、0.05、0.1的临界值分别是相应50万个模拟统计量值的0.99、0.95、0.9分位数。

当然,山水画家在选择自己的艺术表现对象及表现手法时,无疑也是在寻找自己灵魂的图腾。我虽自幼生长于江南,也曾一度以表现江南水乡灵秀之美为主,但当我踏上西域,就深深迷恋上了这片美丽的土地,彻底激发了我生命当中最为原始、最为狂野的关于艺术表现的冲动。可以说,这是一声来自旷野的呼唤,让我如梦惊醒,大有“觉今是而昨非”的心灵悔悟。

与前文相同,这里仅给出样本量n 为30的一元线性回归模型时,解释变量分别取表1中的四种变量时的模拟结果,见表2所示。表2中的最后三列分别给出各变量对应的50万个ρ 值及其t 统计量的均值、标准差,以及检验“H0:总体均值=0”的Z 统计量值。Z 统计量服从标准正态分布。另外需要说明的是,本文在模拟实验中,针对每一组解释变量和被解释变量的回归方程,同时计算DW统计量、ρ 及其t 统计量和它们的临界值,这样三种临界值之间的相对误差更小,后文根据此临界值所得的三种检验功效也更具可比性,结论更为可靠。

“老贾啊,这堆钱又怎么样?看上面的铭文应该不是清朝的东西了吧。清朝离得近,所以钱币流传下来的多,进而不值钱。”孟导大致总结老贾之前的意思,“那么前朝古币呢,那总该稀少得多吧。这么一来,我这堆钱不就是挺值钱的吗?”

表 2样本数为 30不同解释变量时回归检验法的模拟临界值

从Z 值可以看出,全部均非常显著地拒绝原假设。由此可知,在各种情形下,ρ 值及其t 统计量的均值都小于0,它们的分布不是关于0对称的分布。从各临界值也可以看出其具有不对称性。在表2中也给出了相应样本量时的标准t 分布临界值,由于回归检验法中的回归没有常数项,样本量为30时对应自由度为29的t 分布。可以看出,回归检验法中的t 统计量的临界值与标准t 分布的临界值有较大差距,所以当用回归的t 统计量进行检验时也不能使用标准t 分布临界值,需要用模拟方法计算临界值。

五、DW检验与ρ 检验、t 检验的检验功效比较

评价检验方法好坏的主要依据是检验水平与检验功效。检验水平是犯弃真错误的概率,即误差序列不存在自相关,被判断为存在一阶自相关,检验水平越小越好。检验功效是原假设为假而被拒绝的概率,即存在一阶自相关时被判断为存在一阶自相关的概率,检验功效越大越好。当两种检验方法用各自的检验临界值进行检验时,检验水平即为显著性水平。所以,当取相同的显著性水平进行检验时,各种方法的检验水平没有区别,检验方法的好坏在于它们的检验功效。首先对满足DW检验条件的自相关模型,运用模拟方法计算DW检验、ρ 检验和t 检验的检验功效。本文以误差项存在自相关的一元线性回归模型为例。针对给定解释变量的样本序列,构造自相关模型:

式(6)和式(7)中:ai为导航器进行2次定位的平均距离;d为导航路线中从障碍物到航线转弯的距离,随着船舶的横向位置s而变化;i为船舶种类,按船舶类型和自重或长度分类;fi(z)为船舶交通的概率密度函数;NI为预计每年I类搁浅事件的数量;NII为每年预计第II类基准事件的数量;Pc,i为因果概率,即在搁浅过程中船舶搁浅和船舶之间的比率;Qi为第i级船舶每年通过路线横断面的数量;Z为垂直于航道方向的坐标;Zmin,Zmax分别为障碍物的横向坐标。[6]

(1)在员工的“企业社会责任效果”评价中,本文依据文献,设计出如下二级评价指标:企业的社会责任政策非常符合员工的预期(V111)、员工与组织之间的关系很融洽(V112)、企业社会责任提高了企业的运营成本(V113)。

表3及其他的模拟结果均显示,只在样本量为50、ρ值为0.8时,由于检验功效很接近1,三种检验方法的功效,在保留4位小数时,几乎完全相等,其他情况下,DW检验的检验功效均小于ρ 检验和t 检验。由于检验功效是被检验为自相关的次数与总次数的比率,根据两个总体比率之差的检验原理,检验H0:π 21≤0,H1:π 21>0的统计量:

(2)

在实际模拟实验时,系数b 0、b 1、ρ 和标准差σ 要取具体值,但除ρ 以外,其他参数的值不影响检验功效,而不同的ρ 值有不同的检验功效。ε t 为独立同分布的正态序列,这时只要每随机产生一个序列ε t ,就可以计算序列y t ;将y t 关于解释变量x t 回归,提取DW统计量和残差序列e t ;再将e t 关于e t-1 作辅助回归,得到ρ 的估计值及其t 统计量值。重复上述步骤,本文重复50万次,得到50万个DW统计量值、ρ 的估计值及其t 统计量值。再将各统计量值与各自的临界值比较。当ρ 取正值时,即假设误差项存在正的自相关,对于DW检验,如果计算的统计量值小于临界值,则检验结果为存在正自相关;对于ρ 检验和t 检验,如果计算的统计量值大于临界值,则检验结果为存在正自相关。再计算出50万次实验中存在自相关的频率,即为相应的检验功效。作者对各种不同的情形进行了大量的模拟计算。限于篇幅,本文给出以表1中的4个解释变量,样本数n 分别为30和50,ρ 值分别为0.2、0.4、0.6、0.8的情形,以显著水平α =0.05的模拟临界值模拟计算的检验功效,结果见表3所示。

μ t =ρμ t-1 +ε t ,ε t ~i.i.dN (0,σ 2)

其中

(3)

服从标准正态分布。π 1和π 2分别是两种检验方法的真实检验功效,p 1和p 2分别是两种检验方法的模拟功效,N 是模拟的总次数,本文中N =50万。根据表3可以分别计算得到三种原假设H0:π ρDW≤0、H0:π tDW≤0 、H0:π ρt ≤0下的检验统计量Z 值,见表4所示。

表 3 DW检验与 ρ 检验、 t 检验的检验功效比较(

表 4三种原假设下的检验统计量 Z 值

表4中原假设H0:π ρDW≤0、H0:π tDW≤0时,*号表示显著水平0.05下不拒绝H0。从表4可见,只在n =50且ρ =0.8时,全部不拒绝原假设;另外在n =50且ρ =0.6时,有三个Z 值不拒绝原假设,在n =30且ρ =0.8时,有一个Z 值不拒绝原假设。其余情况均拒绝原假设。这表明,除检验功效很接近1时,差别不显著外,ρ 检验和t 检验的功效显著大于DW检验。表4中原假设H0:π ρt ≤0时,Z 值大部分为正,表明大多数情况下,ρ 检验的功效大于t 检验,但几乎全部不显著,只有一个(含*号的)在显著水平0.05下拒绝H0,可以认为t 检验和ρ 检验的功效没有显著差别。因此,应该用ρ 检验和t 检验作为DW检验的替代方法。

六、LM检验的模拟临界值及其特点

为研究LM检验临界值的特点,作者选取了多个实际的时间序列数据,针对不同的样本量进行了模拟实验。大量的模拟计算表明,LM检验的实际临界值除了与序列相关的阶数p 有关外,在样本量不很大时,还与样本量n 、解释变量取值、解释变量的个数k 有关。但LM检验的实际临界值与系数b 0,b 1,…,b k 和标准差σ 的具体取值无关。表5中给出序列相关阶数p =2和4,样本量为20、100、1 000,解释变量取1个、2个及3个时较有代表性的部分模拟结果。表5中同时给出相对应的50万个LM统计量的均值、标准差,及二阶对应的检验H0:μ =2,H1:μ >2和四阶对应的检验H0:μ =4,H1:μ >4(2(2)的均值为2,2(4)的均值为4)的检验统计量Z 的值。

“假作为”并非新鲜事物,其本质上还是典型的形式主义,对这类问题我们其实并不陌生。比如,一些领导干部在推进工作时,喜欢简单地以会议贯彻会议、以文件落实文件,“认认真真”走过场;但是,对具体落实情况却不闻不问。换句话说,这类干部不过是用开会发文来应付检查,撸起了袖子却不加油干,只是做做样子,给人留下一个认真做事的好印象,实际上却没有做任何实事,只是摆姿态作秀而已。

该种箱在设计时应考虑其要满足绕中心轴能调节,为了满足其目的,在种箱的箱体两侧加两块侧板,种箱左侧有步进电机带动滚筒转动的链条,因此侧板设计成跨越式,从链条上面跨越过去。侧板的一头设计成与中心轴同心的圆形,这样可以满足侧板绕中心轴转动。侧板的外侧再加上两个滑槽,滑槽的弧度应满足与滚筒同心,其底端的两块底板用螺栓与机架固定住。箱体通过螺栓与侧板、滑槽连接,这样箱体就可以通过滑槽绕中心轴转动,满足设计要求。

从表5可以得出如下结论:第一,样本量较小时,LM统计量的分布与相应的2分布有很大差异,因而LM检验的临界值与相应的2临界值有很大差距,当解释变量个数增加时,多数情况下差距会更大,当序列相关的阶数p 增加时,差距也可能会更大,而且差距没有固定的方向性。由均值和方差可见,例如,当样本量n =20,p =4,解释变量为x 3时,LM统计量的均值比2(4)的均值大0.328,LM统计量的方差比2(4)的方差小1.703;而当解释变量为x 3、x 6时,LM统计量的均值比2(4)的均值大1.027,LM统计量的方差比2(4)的方差小0.455。从临界值看,例如当样本量n =20,解释变量为x 3,p =4时,显著水平为0.01的LM检验临界值比卡方临界值小1.94;显著水平为0.05的LM检验临界值比卡方临界值小0.431。第二,即使当样本量达到很大的1 000时,LM统计量的分布也很可能与相应的2分布有显著差异,两种临界值也可能有比较大的差距。由表5中Z 值可知,当n =1 000时,在所模拟的各种情况下,都在显著水平0.01下拒绝原假设,即LM统计量的均值与相应的2分布的均值有显著差异,因而LM统计量的分布也很可能与相应的2分布有显著差异。从临界值看,例如当n =1 000时,在解释变量为x 4,x 5,x 7,p =2时,显著水平为0.01的LM检验临界值比卡方临界值大0.135;显著水平为0.05的 LM检验临界值比卡方临界值大0.102,也可以认为是比较大的差距。

表 5各种情况下 LM检验模拟临界值与

注:x 4是从1993年1月8日起的上证综合指数的周收盘价,x 5是1999年11月18日起的上证综合指数的日收盘价;x 6是参考文献[10]提供的数据文件TableF5-1中的变量REALDPI,1976年第1季度至2000年第4季度的100个数据;x 7是2011年7月6日至2017年9月5日上证指数日收盘价,共1 500个数据。其他变量同前。

七、LM检验中最高阶滞后回归系数t 检验临界值及其特点

由于LM检验不能直接确定自相关的阶数。在实际运用中,通常是从一阶开始逐次向更高阶检验,并对最高阶滞后系数进行t 检验以确定自相关的阶数。但最高阶滞后系数的t 统计量并不服从标准t 分布,用常规的t 检验可能会给出错误的检验结果。为研究LM检验中最高阶滞后回归系数t 统计量的分布及其临界值的特点,作者选取了与前面相同的多个实际的时间序列数据,针对不同的样本量,当随机干扰项存在一阶、二阶自相关时分别按二阶、三阶序列相关进行LM检验时,最高阶滞后回归系数t 统计量的分布及其临界值。大量的模拟结果表明,最高阶滞后回归系数t 统计量的实际临界值在样本量不很大时,与样本量n 、解释变量取值、解释变量的个数k 有关,但与系数b 0,b 1,…,b k 和标准差σ 的具体取值无关。本文仅给出较有代表性的部分结果,见表6所示。表6中最后一列的Z 值是检验“H0:总体均值=0”的统计量值。表6中也给出了相应自由度的标准t 分布临界值。

表 6实际一阶自相关按二阶 LM检验时滞后二阶回归系数 t 检验模拟临界值(单侧)

从表6及其他许多次随机模拟实验结果可以得出如下结论:第一,从Z 值可以看出,全部均非常显著地拒绝原假设,说明在各种情形下,其t 统计量的均值都显著小于0,它的分布不是关于0对称的分布。所以当用t 统计量进行检验时,应该用单侧检验。第二,模拟标准差均小于t 分布的标准差,所以导致左边的临界值与标准t 分布临界值差距较小,右边的临界值差距较大。第三,随着样本量增大,模拟临界值与标准t 分布临界值差距越来越小,解释变量个数越多,临界值的差距普遍越大。所以,当对LM检验中最高阶滞后回归系数进行t 检验时不能使用标准t 分布临界值,需要用模拟方法计算临界值。

八、实证案例

为了更好地说明以上检验方法的应用,本文以两个案例分别说明一阶序列相关检验和高阶序列相关的LM检验的具体过程。

(一)一阶序列相关检验的实证案例

由于DW检验的临界值,与样本容量n 、解释变量数目k 和解释变量序列的具体取值有关,而与模型的系数及标准差σ 无关。因此在实际应用中计算模拟临界值时,解释变量x 1,x 2,…,x k 必需取实际的样本数据,系数b 0,b 1,…,b k 和标准差σ 可任意取值。但为了提高模拟结果的精度,可分别根据实际样本数据中的被解释变量y 关于解释变量x 1,x 2,…,x k 回归所得的系数估计值和误差项标准差估计值进行轻微调整得到。蒙特卡罗模拟方法的具体步骤如下:第一步,对系数b 0,b 1,…,b k 和标准差σ赋值,输入x 1,x 2,…,x k 的样本数据;第二步,产生随机序列μ ;第三步,根据公式(1)计算序列y ;第四步,将y 关于解释变量x 1,x 2,…,x k 回归,并计算DW统计量值;重复第二至第五步,本文重复50万次,得到50万个DW统计量值,再计算50万个DW统计量值的0.01、0.05、0.1、0.99、0.95、0.9分位数。其中0.01、0.05、0.1的分位数分别为正序列相关检验时,显著性水平为0.01、0.05、0.1的DW检验临界值;0.99、0.95、0.9分位数分别为负序列相关检验时,显著性水平为0.01、0.05、0.1的DW检验临界值。由于重复次数越多,模拟临界值与真实临界值越接近,本文进行了高达50万次的重复实验,所得模拟临界值将很接近真实的临界值。

lnY t =-2.805+0.862lnK t +0.429lnL t +e t

本文仅就一阶自相关检验时,回归检验法的临界值及其特点进行研究。此时回归检验法就是将残差e t 关于其一阶滞后e t-1 作辅助回归,可以用回归系数的估计量ρ 进行检验,也可以用其t 统计量进行检验,为方便起见,以下分别称为ρ 检验和t 检验。通过蒙特卡罗模拟方法,可以得到ρ 检验和t 检验的临界值。由于将残差e t 对e t-1 回归时样本数少一个(对更高阶滞后项回归时以此类推),本文参照EViews软件中序列相关LM检验时将缺失的残差滞后值设为零的做法(下文在涉及此类的回归时都采用此做法),使辅助回归方程的样本量与原方程相同,以减小估计误差,增加模拟临界值的准确性,提高检验功效。

R 2=0.998,DW=1.244 3

(4)

查DW临界值表,可得显著水平为0.05时,d L =1.17,d U =1.54;显著水平为0.01时,d L =0.94,d U =1.29。两种显著性水平下均有d L <DW<d U ,即DW落在不确定区域内,用常规的DW检验无法确定模型是否存在自相关性。以下用本文的模拟方法进行一阶自相关性检验。

1.计算三种方法的模拟临界值。先建立样本量为23的工作文件,将lnK t 、lnL t 分别录入至以x 1和x 2命名的序列中,因为DW检验和回归检验法的模拟临界值与系数b 0,b 1,…,b k 和标准差σ的具体取值无关,所以本文本着简洁的原则,对式(4)中的系数估计值稍作调整,取b 0=-3,b 1=0.86,b 2=0.43,σ=0.3,运行模拟程序,可得DW检验、ρ 检验和t 检验的模拟临界值如表7所示,本例为正相关检验,所以只给出正相关检验的临界值。

表 7一阶序列相关性检验三种方法的正自相关模拟临界值

2.三种模拟方法的检验结果。由DW=1.244 3<1.279,可知在0.01的显著水平下,DW检验结果为模型存在正的一阶自相关。将式(4)中的e t 关于e t-1 回归,可得ρ 和t 统计量的值分别为0.372 8和1.841 9,分别大于ρ 检验和t 检验在0.01的显著水平下的临界值,即ρ 检验和t 检验结果为模型存在正的一阶自相关。也即三种检验的结果相同。

实际上,当检验结果为存在一阶自相关时,一般来说三种方法都会得出相同的结论。但本文的研究表明,ρ 检验和t 检验的检验功效大于DW检验的检验功效,这意味着当用ρ 检验和t 检验得出模型不存在一阶自相关时,检验正确的可能性较大。

影响一国国债规模的因素是多方面的,其中最重要的是国家的经济发展水平,更高水平的经济总量意味着需要更多的资金进行基础设施项目建设及其他财政支出,同时也就对应着更大规模的国债发行量。此外,一国采取的财政政策也在一定程度上影响着国债的发行量,在紧缩货币政策时期,国家的财政赤字随着缩减,从而也就导致了国债规模的缩减;在宽松财政政策时期,国家拉动内需必然需要增加财政支出,因此财政赤字缺口的增大会扩大该时期国债发行的规模。

(二)高阶序列相关检验的实证案例

以x t 、y t 分别表示我国1978—2004年国内生产总值和进口总额[11],建立一元线性回归模型,得回归结果如下:

y t =0.234x t -1966+e t ,R 2=0.92,

结果表明,在不同分类与分度的肺气虚寒型AR患者外周血中,中-重度持续性AR组ROR-γt mRNA、ROR-γt/Foxp3 mRNA表达显著高于对照组(**P<0.01),而Foxp3 mRNA表达明显低于对照组(*P<0.05)。中-重度持续性AR组ROR-γt mRNA表达显著高于轻度间歇性、中-重度间歇性及轻度持续性(**P<0.01)。中-重度持续性 AR组 Foxp3 mRNA表达显著低于轻度间歇性(**P<0.01)。中-重度持续性AR组ROR-γt/Foxp3 mRNA表达显著高于轻度间歇性、中-重度间歇性及轻度持续性(**P<0.01),见表 2、图 4。

DW=0.389

(5)

由DW的值可知,该模型存在一阶自相关。再对该模型进行二阶的LM检验,结果显示,LM统计量的值为22.26,远远大于2(2)的临界值,也必然大于LM检验的模拟临界值。残差二阶滞后项的t 统计量值为-1.872,查表可知,显著水平为0.05时,标准t 检验的临界值t 0.05(23)=-1.714,因-1.872<-1.714,所以在0.05的显著水平下,认为模型存在二阶序列相关性。

若用本文的方法计算t 统计量的模拟临界值进行检验,则得出不同的结论。先建立样本量为27的工作文件,将x t 录入以x 命名的序列中,取b 0=-2 000,b 1=0.25,s =500,ρ 1=0.9,p =1,运行EViews程序,可得残差二阶滞后项的t 统计量,显著水平为0.01、0.05、0.1的左侧模拟临界值分别为-2.886、-2.151、-1.781。因为-1.872>-2.151,所以在5%的显著水平下,不拒绝原假设,即模型不存在二阶自相关。

(五)自我测评。每位组员根据自己对学习任务的所承担的内容、完成情况进行自评,然后写上书面总结上传到网络平台中。

九、研究结论

进行计量经济分析时一般都要检验模型是否存在自相关性,对于一阶自相关性的检验,DW检验是一种经典方法。由于DW检验有上、下两个临界值,使检验存在两个不确定区域。在实际应用中,可以通过运行EViews程序得到模拟临界值。根据该模拟临界值进行检验,可以避免DW检验存在不确定区域的缺陷。而且,当用模拟方法确定临界值时,可用回归检验法,即将回归残差e t 对e t-1 作辅助回归的系数估计量ρ 及其t 统计量作为检验统计量,分别称为ρ 检验和t 检验。根据模拟所得的临界值,对DW检验、ρ 检验和t 检验的检验功效进行模拟计算,结果表明,在本文所进行的各种情况的模拟实验中,除检验功效很接近1的情形外,ρ 检验和t 检验的功效均显著大于DW检验。因此,ρ 检验和t 检验都可以作为DW检验的替代方法。对于高阶序列相关性的检验,LM检验是一种常用方法。在大样本情况下,LM统计量近似服从卡方分布,但在大多数应用中,样本往往都不是很大。大量的模拟结果表明,当样本量不是很大时,LM统计量的分布与卡方分布差距较大,其临界值与卡方分布的临界值差距较大,且解释变量的取值对临界值的影响较大,因此,在对高阶序列相关进行LM检验时,不能使用标准卡方临界值,需要用模拟临界值。而且LM检验不能直接确定自相关的阶数,在实际运用中,通常是从一阶开始逐次向更高阶检验,并对最高阶滞后系数进行t 检验以确定自相关的阶数。大量的模拟计算结果表明,LM检验中最高阶滞后项回归系数t 统计量并不服从标准t 分布,所以与标准t 分布临界值不同,且小样本情况下差距更大,所以对最高阶滞后系数进行t 检验时也不能使用标准t 分布临界值,需要用模拟方法计算临界值,以提高检验的精确性。

参考文献:

[1] 李子奈,潘文卿.计量经济学[M].4版.北京:高等教育出版社,2015.

[2] Durbin J,Watson G S.Testing for Serial Correlation in Least Squares Regression I[J].Biometrika,1950(3).

[3] Durbin J,Watson G S.Testing for Serial Correlation in Least Squares Regression II[J].Biometrika,1951(1).

[4] Durbin J,Watson G S.Testing for Serial Correlation in Least Squares Regression III[J].Biometrika,1971(1).

[5] 刘明,王永瑜.Durbin-Watson自相关检验应用问题[J].数量经济技术经济研究,2014(6).

[6] Durbin J.Testing for Serial Correlation in Least-Squares Regression When Some of the Regressors Are Lagged Dependent Variables[J].Econometrica,1970(3).

[7] Lee Mei-Yu .Adequacy of Lagrange Multiplier Test[J].European Economics Letters,2014(2).

[8] 刘汉中.基于自相关视角的弱平稳过程之间的伪回归分析[J].统计与信息论坛,2012(4).

[9] 威廉·H.格林.计量经济分析[M].6版.张成思,译.北京:中国人民大学出版社,2011.

[10] 叶宗裕.全国及区域全要素生产率变动分析——兼对C-D生产函数模型的探讨[J].经济经纬,2014(1).

[11] 杜江,李恒,贾文.计量经济学及其应用[M].北京:机械工业出版社,2010.

Research on Autocorrelation Test of Error Sequence Based on Monte Carlo Simulation

YE Zong-yua,WANG Wei-jieb

(a.School of Economics and Management;b.School of Mathematics and Computer Science,Zhejiang Normal University,Jinhua 321001,China)

Abstract :When performing econometric analysis,it is necessary to test whether there is autocorrelation in the model.However,several commonly used autocorrelation test methods have some problems in different degrees,and further research is of great significance.For the first-order autocorrelation test,the DW test is the most common method,but it has two uncertain regions.For a given explanatory variable,using the simulation method,the critical value of the DW test can be obtained,thereby overcoming the defect of the existence of the uncertain region.There is no threshold available for the regression test,and the critical value can also be calculated using the simulation method.Moreover,except for the case where the test power is very close to 1,the efficiency of the regression test is significantly greater than the DW test,which can replace the DW test.When the sample size is not very large,the critical value of the LM test statistic is far from the critical value of the chi-square distribution,and the standard chi-square threshold cannot be used.In the LM test,the t-test of the highest order lag term coefficient is usually used to determine the order of autocorrelation,but the t statistic of the highest order lag term coefficient in the LM test is far from the standard t distribution,and its threshold of t-distribution can't be used.

Key words :DW test; LM test; regression test; test power; critical values; Monte Carlo simulation

中图分类号: O212

文献标志码: A

文章编号: 1007-3116( 2019) 09-0010-08

收稿日期 :2018-12-06;修复日期: 2019-05-07

作者简介 :叶宗裕,男,浙江衢州人,教授,研究方向:计量经济学理论与应用。

(责任编辑:张治国)

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于蒙特卡罗模拟的误差序列自相关检验研究论文
下载Doc文档

猜你喜欢