空间面板参数估计的小样本特性探究,本文主要内容关键词为:样本论文,面板论文,特性论文,参数论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
空间因素在计量经济研究中逐渐被学者们所重视,其应用领域也日渐增多。其中空间面板数据模型的应用领域尤为广泛,被应用于城市经济学、区域经济学、劳动经济学、能源经济学等多个领域。如Egger(2005)、Franzese(2007)等研究。Kholodilin(2010)综合利用了空间面板的估计方法,应用于欧盟的区域经济收敛性研究得出了稳健的估计结果。Baltagi(2010)将空间面板数据的研究模型应用于德国动态工资方程研究,进一步拓展了空间面板的实证研究领域。骆永民(2008)利用我国31个省份的空间面板数据分析了财政分权对经济增长的促进作用和空间溢出效应。符淼(2009)利用空间面板模型,分析了经济活动空间聚集与技术溢出的空间分布特征,并得出了技术溢出效应强度的递减半径。刘秉镰和武鹏(2010)采用空间面板数据模型方法,实证检验了中国交通基础设施投资与全要素生产率增长之间的相互关系。丁志国和赵宣凯(2011)利用了空间面板数据模型,分析了城市化进程对于城乡收入差距的直接影响与间接影响。
空间面板数据模型通常可选择的估计方法主要可以划分为两种类别,一种是基于极大似然函数(Maximum Likelihood Estimation)的估计方法;另外一种方法是基于广义矩的估计方法(GMM)。依据现有的研究,在大样本情况下GMM估计方法在给定的残差分布无论是同方差还是异方差条件下,得到的估计量都是渐进有效的。MLE(包括QMLE方法)的适用条件是残差分布必须满足正态分布并且同方差,否则得到的参数的估计结果是有偏的,然而当分布的残差满足正态与同方差分布时,GMM的参数估计效率低于MLE。在实证研究过程中,由于中国年度宏观数据的特点,使得有限样本属性往往成为空间面板计量经济模型估计时面临的首要问题,例如学者们通常以中国的30个省份为基本的分析单元,由于统计数据的可获得性与时间序列数据的连续性,使得横截面数据个体,通常限定在6~30个省份,而时间序列方面,通常所能够获得的数据序列是1978年以后的统计数据,时间序列纬度的数据在10~40之间。因此这里我们采用蒙特卡罗模拟的方法,分析ML、GMM和SOLS参数估计的有限样本属性,并就相关参数检验效率进行对比研究,为实证研究过程中,选择恰当的实证研究方法,提高参数估计的有效性与一致性提供可以借鉴的理论与实践参考。
一、空间面板数据模型的估计方法
空间面板计量经济学模型的识别与估计在过去十年中得到了迅速发展。Elhorst(2003、2010)将空间面板划分为如下几种不同的类型,即空间面板滞后模型(Spatial Panel Lag Model)、空间面板的误差模型(Spatial Error Model)、空间面板Durbin模型。其估计方法分为两种类别,即空间面板的极大似然估计和广义矩估计方法。
1.空间面板固定效应模型的极大似然估计
(1)空间面板滞后模型估计。在空间因素存在情况下,空间面板的滞后模型的基本设定为:
对于方程(1)而言,如果不考虑空间因素进行估计,就是非空间的固定效应回归,这显然存在明显的缺失必要解释变量问题以及内生性问题;显然这里直接的回归其中的解释变量,由于ρ Wy的存在,将形成内生的解释变量的偏差。将方程(1)可以表示为:
y=M δ+ε (2)
将模型(1)表示为矩阵形式如式(5)所示:
将μ的值带入到式(6),并依据估计面板固定效应估计时通常所采用的去平均化的过程得到拟似然函数:
(2)空间面板误差模型估计。空间面板的误差模型的基本模型设定如式(9)所示:
与空间面板的滞后效应模型相类似,得到如式(10)的空间面板的误差模型的极大似然函数:
2.空间面板的随机效应估计
显然空间面板随机效应滞后模型的估计,是通过联合估计空间面板的固定效应与非空间面板的随机效应模型来实现的。
(2)空间面板的随机效应误差模型。如果模型(9)中的空间效应参数变量是随机的,那么它的似然函数如式(17)所示:
从而得到目标参数的稳健估计量。
3.空间面板模型的广义矩估计
正如我们在前文中所阐述的那样,采用极大似然估计的方法,估计空间面板数据模型,它的基本假定是回归残差满足正态分布,而当回归残差的极限分布不满足正态分布时,可以采用广义矩的估计方法。显然两者基本的前提假定明显不同。空间面板的2SLS和空间面板的GMM估计是采用矩估计方法估计空间面板数据模型的两种不同方法,Kelejian和Prucha(1999、2010)推导了横截面数据条件下的GMM参数估计的渐进分布特征。Kappor(2007)在空间面板分析框架下,基于Kelejian和Prucha(1999)的基本原理,推导出了空间面板滞后模型框架下参数的有效估计量。Moscone和Tosetti(2010)在空间面板固定效应的条件下,分析了残差分布存在异方差情况下的空间面板GMM估计,经有限样本蒙特卡罗模拟试验证明参数估计量的效率优于空间面板的QML估计。空间面板的GMM估计对于模型(1)而言,可以使用空间的2SLS来进行估计,假设Wy的线性预测值,即基于与模型(1)的第一阶段的OLS估计值为:
因此进行空间面板的广义矩估计,无论是空间面板的滞后模型,还是空间面板的误差模型的GMM估计的权重选择,都是基于矩条件的方差协方差矩阵的逆。
二、空间面板数据模型的识别与检验
空间面板数据模型在实际应用过程中,通常面临的模型形式选择可以划分为两种类别:第一种类型是空间面板具体模型形式的识别;第二种类型是选择空间面板的固定效应还是随机效应,这可以通过Hausman检验的方法来识别。
1.空间面板模型检验
空间面板模型形式方面,从现有的研究来看,主要可以划分为四种不同的类型,一种是空间滞后模型(SPLAG)如式(1)所示;第二种形式是空间面板误差模型(SPEM)如式(9)所示;第三种形式是广义空间模型即SARAR如式(26)所示;第四种模型即是空间Durbin模型如式(27)所示。
其中代表随机误差项,其他的解释变量含义与前述模型相同。对于不同的空间面板计量经济模型而言,具体模型形式的识别取决于回归后得到参数ρ和λ检验的显著水平,因而可以采用Wald检验、LM检验和LR检验的方法识别空间效应的存在性。依据四种不同类型的空间面板的分类,可以将检验划分为两种不同类型,一种是基于空间面板滞后模型和空间面板误差模型的检验;另外一种类型是空间面板的Durbin模型的识别性检验。基于第一种类型的参数检验,正如Debarsy和Ertur(2010)的研究,我们以为空间面板中空间效应的识别,可以划分为六种不同类型的检验:
第一,ρ=λ=0,联合检验参数,备择假设是其中至少有一个空间效应模型系数不为零。
第二,ρ=0,备择假设模型是空间面板的自回归模型(SPAR);
第三,λ=0,备择选择模型是空间面板的误差模型(SPEM);
第四,λ=0,并且ρ≠0,备择假设是一个广义的空间模型SARMA;
第五,ρ=0,并且λ≠0,备择假设是一个广义的空间模型SARMA。
在实践应用中,空间Durbin模型也是经常被利用的模型形式,并且它所包含的空间经济学含义也更为明确,这可以通过Wald检验的方法来识别。相应的Wald检验如检验式(6)所示。
第六,χ+ρ β=0,并且ρ=0,备择假设是空间Durbin模型。
2.空间面板Hausman检验
空间面板数据模型在实证研究中的一个关键点是区分空间面板固定效应与空间面板随机效应模型,它们检验的统计量与传统面板的Hausman检验相类似。空间面板Hausman检验的原假设是:m=0,其中参数m的取值如式(28)所示:
三、蒙特卡罗模拟实验设计
为了模拟有限样本属性特征条件下空间面板的GMM估计与QML估计的效率差异,我们设计了数据生成系统:
其中β=[1,1,1]';参数W代表空间加权矩阵;,其残差满足标准正态分布。为了分析有限样本条件下的参数估计特征,我们将蒙特卡罗模拟样本中的横截面个体,采用了N=6、12、13、30。时间纬度的选择方面,T=5、10、20、30。我们所选择的时间序列的长度与我国学者在实证研究过程中所能获得的宏观统计数据序列长度紧密相连,1978年改革开放以后所能获得的年份的时间序列数据为30年。如果是1990年以后的统计数据,我们可以能够获得的数据点为20年。在横截面数据个体方面,由于我们进行实证研究时,通常以省份数据为基础,考虑到西藏的统计数据缺失,数据选择点通常在30以下,当以更小的区域经济尺度来分析的时候,例如长三角、珠三角、环渤海的省份分析时,横截面数据样本数会更少。体现空间效应存在性的参数ρ、λ的变化区间[0.1,0.9],并且每次增加0.025,其中每个参数的蒙特卡罗模拟次数是1000次。
空间加权矩阵W是我们进行空间面板计量模型估计中重要外生参数。空间加权矩阵的设计方面,我们采取了三种不同类型的空间加权矩阵,以考察空间加权矩阵形式,对于参数估计有效性的影响。第一种空间加权矩阵,是以临近为权数的空间加权矩阵,即如果省份i与省份j在地域上是临近的,那么W中的相应元素,反之则为零;第二种空间加权矩阵是以距离为权数的空间加权矩阵,通常而言,这样的空间加权矩阵能够在一定程度上识别空间溢出效应的潜在形式,我们采用球面距离的方式,计算不同省份之间的距离;第三种空间加权矩阵,基于不同省份之间的内在的经济联系,我们以跨省份间的贸易流量矩阵构建空间加权矩阵。省份之间的贸易流量矩阵,来源于李善同(2002)的中国区域间投入产出表。作为参照我们在进行蒙特卡罗模拟时,对于模型(29)进行了空间面板固定效应的参数估计,以综合的比较它们与GMM、QML在小样本数据情况下参数估计的有效性与一致性。
四、蒙特卡罗模拟结论
依据蒙特卡罗模拟实验设计,我们对于模型估计和参数检验功效进行了广泛的模拟分析。蒙特卡罗模拟的结果分为两种类别:第一类模拟是综合比较空间面板的固定效应(SOLS)、ML(或者QML)和GMM参数估计有效性;第二类模拟是在既定的数据生成系统条件下比较空间面板相应参数检验功效。
1.参数估计的一致性与有效性分析
表1是在不同样本和不同的空间效应参数条件下,空间面板固定效应(SOLS),空间面板广义矩(GMM)和空间面板的极大似然(ML)条件下估计得到的参数β、ρ和均方误差(RMSE)的值。参数估计的一致性以参数估计偏差来表示,如以和来表示;参数估计的有效性方面,通过均方误差来表示①。表中数据表明,随着数据样本量的增加,参数估计的有效性与一致性显著提高。然而SOLS的估计始终存在正的偏差,并且出现了先上升后下降的趋势。GMM的参数估计存在正的估计偏差,而ML存在负的估计偏差,当表征空间自相关的系数ρ提高到0.9时,我们发现GMM和ML的估计偏差在逐渐地缩小都收敛于0。均方误差方面,我们发现随着数据样本量的达到30,无论空间自相关系数多少,GMM参数估计的均方误差都小于ML和SOLS,说明GMM得到的参数估计是高度有效的,SOLS的估计得到的均方误差最大。因此SOLS参数估计存在明显的联立性(Simultaneity),在实证研究中这种估计方法也仅能用作参数估计的参考。
图1(见第28页)分别绘制了不同估计方法条件下的ρ的估计偏差与实际的ρ之间的关系。图1中数据表明,在不同数据样本条件下,横截面个体的样本容量个数与不同的估计方法得到的参数估计的稳健程度紧密相连。随着样本容量的增加,参数估计的有效性明显提高,随着空间效应存在性参数ρ、λ的增加,直接的空间固定效应回归(SOLS)得到的参数偏差越来越大,显然缺乏空间因素会引致明显的估计偏差,这与我们的理论预期相一致。图1中数据表明在不同数据样本条件下随着反映空间自回归效应的参数ρ的提高,GMM的参数估计存在正的估计偏差,而ML则存在负的估计偏差,而当数据样本量逐渐地增大条件下,GMM与ML参数估计的一致性在显著提高。但在有限样本属性条件下GMM的参数估计明显优于QML和SOLS的估计。
图2(见下页)给出了不同空间自相关情况下的GMM、ML和SOLS的估计的均方误差的分布情况,表中数据表明在数据样本为N=13、T=20的情况下,GMM估计的均方误差明显小于ML和SOLS的估计的均方误差,随着空间自相关系数的提高,整体而言三种估计方法的均方误差在显著降低,SOLS估计的均方误差显著高于GMM和ML估计。在N=30、T=20的数据样本情况下,我们发现随着空间自相关系数的提高,均方误差随着显著的递减趋势并且GMM估计的均方误差明显低于ML和SOLS的均方误差。因此在实证研究过程中当样本容量低于30的情况下,从参数估计的有效性与一致性考虑,应该选择GMM的估计方法。在大样本情况下,GMM与QML参数估计的有效性与一致性并无本质上的差异。然而当数据样本分布在不满足正态分布的条件下,GMM的参数估计显然更为有效。
2.空间面板参数有效性的检验功效
检验功效(Test Power)是表征参数检验有效性的依据。检验的功效体现了如果我们不能拒绝原假设,而假设是错误的检验概率,检验功效是由1减去发生这种检验错误的概率值。正如我们在空间面板数据模型检验中所提及的,我们的检验涉及7种类不同统计量的检验的功效。这里设定的检验的功效的参考概率是0.05。表2~表5列举了在横截面数据样本分别为6、12、13、30的情况下,时间序列维数分别是10、20情况下的空间面板的参数检验的功效②。表3(见下页)给出了参数的联合空间效应存在条件下的检验功效情况。当ρ=0,λ=0的条件下,检验功效与检验的规模一致。和分别代表联合检验的拉格朗日乘子检验和似然比检验。联合检验的临界值都是0.05,数据表明随着空间自回归效应增大,相应的和检验而言,检验的功效,接近检验的临界值0.05,而检验的功效相比较而言,要明显低于检验的功效。反映空间自回归的系数ρ与空间误差自相关的系数λ逐渐增长,分别达到0.325和0.225的时候,我们发现检验的功效接近于1,因此能够有效识别模型中存在的空间效应及其形式。随着模型中样本容量的增加,例如从13增长到30,我们发现和的检验功效显著提升,并且检验也接近于0.05的检验临界值,如在N=30、T=20的数据样本情况下,其检验的临界值达到0.048。
图3给出了当N=13,T=20以及N=30,T=20数据样本条件下,经过1000次蒙特卡罗模拟得到的Wald检验空间Durbin模型的检验功效。表明随着样本容量的提高,Wald检验的功效显著提升,接近于0.05的检验功效临界点。而随着空间自相关系数的提高,我们发现检验功效收敛于1,显然在进行实证分析的时候借助于Wald检验,能够有效的识别空间面板数据条件下的空间Durbin模型、空间误差和空间自回归模型而不存在有限样本检验功效的偏差④。
图4描述了在N=13,T=20和N=30,T=20不同数据样本条件下,通过Hausman检验识别空间面板的固定效应与空间面板随机效应的检验功效。作为参照图4中给出了0.05检验功效临界值直线。表明在进行空间面板的随机效应和固定效应的识别方面,Mutl和Pfaffermayr(2011)提出的空间面板的Hausman检验在小样本情况下(N<13),检验功效小于0.05的检验临界值,因此在小样本情况下倾向于选择空间面板固定效应模型。当N>30以后看到模型识别检验的临界值大于0.05,因此能够提供更为稳健的识别空间面板随机效应模型。
依据蒙特卡罗模拟结果,发现在空间效应存在的条件下,如果直接采用面板固定效应回归,在有限样本条件下会产生缺失变量偏差因而应该采用极大似然估计方法和广义矩的估计方法。在有限样本情况下(N≤30,T≤30),我们发现GMM估计方法无论是参数的有效性还是参数的一致性方面,都明显优于QML估计方法,因此在区域经济、城市经济研究中,如果以珠三角、长三角、环渤海和东北老工业基地为研究的数据样本来源,或者以中国全部省份为研究的数据样本,由于其有限样本属性,对于空间效应进行估计我们应该采用GMM的参数估计方法,而不是目前被广泛采用的ML(或QML)的参数估计方法。在空间效应的识别方面,我们发现在有限样本属性条件下,应该采用稳健的拉格朗日检验,而不是似然比检验。基于Wald检验的空间面板Durbin模型识别是高度有效的。空间面板的Hausman检验,在小样本情况下易于接受固定效应空间面板数据模型而不是随机效应模型,因此在实践的过程中,应该依据实证研究的问题的不同,合理地选择空间面板的模型形式。在城市与区域经济研究领域,空间计量经济学方法的应用领域在逐渐地扩大。在这种背景下模拟实验表明,在空间效应存在的有限样本属性条件下,应该恰当合理地选择模型估计的方法和检验统计量,以提高参数估计的有效性与一致性。空间面板模型中引入时间与空间的滞后效应,构成了空间动态面板(Spatial Dynamic Panel Data)数据模型,在有限样本属性条件下参数估计有效性与一致性以及相关检验功效,将是本文进一步的研究方向。
①限于篇幅,这里仅给出了部分数据样本情况下的模拟值,从整体的模拟结果来看与我们这里所给出的部分模拟结果是一致的。
②我们也进行了更为广泛的蒙特卡罗模拟,将样本容量从30扩展到50,时间序列纬度从30拓展到50得到的参数检验的功效与表2~表5类似,限于篇幅,这里仅给出部分蒙特卡罗模拟的结果。感兴趣的读者可联系作者索取。
③限于篇幅,这里并没有给出条件参数检验以及不同空间加权矩阵情况下的参数检验功效。感兴趣的读者可以联系作者索取。
④限于篇幅这里我们仅给出了这两种数据样本情况下的Wald检验功效,作为参照我们也模拟了空间自相关系数在[-0.9,0.9]的区间范围内的检验功效曲线。
标签:参数估计论文; 固定效应模型论文; 面板数据论文; 空间分析论文; 样本容量论文; 参数检验论文; 有限空间论文; 蒙特卡罗模型论文; 样本空间论文; 误差分析论文; gmm论文;