空间计量——模型、方法与趋势,本文主要内容关键词为:模型论文,趋势论文,方法论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
最近几十年,空间受到了经济学界的格外青睐。与空间纳入经济学模型形成新经济地理学一样,空间进入计量经济学便有了空间计量经济学。空间计量经济学源于地理学的定量革命,之后经历了萌芽(20世纪70年代中到80年代末)、起飞(20世纪90年代)和成熟三个阶段(21世纪后),目前已经从城市和区域科学的边缘成长为计量经济学领域的主流(Anselin,2006;Anselin,2010)。 我们使用的数据大多与空间有关,空间单元的异质性与空间单元之间的相互关联,决定了按照标准计量经济学同方差和截面无关假设估计出来的结果是有偏和无效的。为了解决这些问题,Cliff and Ord(1981)、Anselin(1988)、LeSage and Pace(2009)、Elhorst(2014)等学者将区位、距离和拓扑变量在计量模型中显式表达出来,创立了空间计量经济学。空间计量经济学是处理地理单元(或由网络连接的个体)之间空间相互作用效应的学科,它着力解决空间依赖与空间异质两大主题(Elhorst,2014)。空间依赖是某一空间单元与其他空间单元的功能性关系,是空间过程与空间(行政区)边界不一致的结果(应龙根和宁越敏,2005)。空间异质是空间的不均匀性和复杂性,它在模型中体现为异方差、因空间变化的系数等。与时间序列模型引入时间滞后反映序列相关一样,在空间计量模型中,空间依赖与空间异质是通过引入空间滞后来实现的。空间滞后是相应变量在邻近区域的加权平均值,它可以是因变量的滞后、自变量的滞后、误差项的滞后,还可以是三者的不同组合,属于空间平滑的一种方式(LeSage and Pace,2009;McMillen,2012)。 遗漏变量是计量模型最为棘手的问题之一,空间滞后的引入使得这个问题得到了一定的缓解。因此,空间计量在经济社会科学的各个领域得到了广泛应用。经济增长和趋同研究是空间计量应用最广的领域之一。Rey and Montouri(1999)、林光平等(2005)、Gallo and Dall'erba(2006)使用空间计量模型分别考察了美国、中国和欧盟区域经济的收敛性;吴玉鸣和李晓霞(2006)对工业全要素生产率进行了空间计量估计;Hu et al.(2014)探讨了中国制造业增长差异的空间原因;空间计量在空间相互作用、区域竞争、房地产、交通、能源、环境等领域也得到了大量应用。基于增长极理论和中心地理论,柯善咨(2009)对中国市县的扩散回流效应进行了分解和测度;踪家峰等(2009)、李涛和周业安(2009)、郭庆旺和赵旭杰(2012)讨论了中国地方政府之间的博弈以及经济周期波动;李永友(2014)对中国房价增长的地理涟漪效应进行了研究;Chen and Haynes(2014)研究了交通基础设施对区域经济的影响;朱平辉等(2010)则讨论了工业污染物的空间溢出效应。 空间计量的崛起,成为继新经济地理学之后推动区域科学复兴的新力量。然而,国内对空间计量既有研究的总结仍然集中于空间滞后和空间误差等基本模型及其应用方面(吴玉鸣,2005;沈体雁等,2010;林光平和龙志和,2014),对理论模型的最新进展、估计方法和估计过程的介绍相对不足。为了更好地推动空间计量在国内的应用,文章对空间计量的理论模型、估计方法和估计过程进行较为系统的总结。在此基础上,探讨了空间计量的不足和发展趋势。 文章余下部分的安排如下:第二部分讨论了权重矩阵的设置和甄选,第三和第四部分系统总结了空间计量的模型体系、估计方法和诊断过程,最后是未来研究的方向。 二、权重矩阵 空间计量经济学着力解决空间依赖与空间异质两大核心问题。将空间依赖与空间异质纳入计量模型,是通过引入权重矩阵实现的。为此,我们首先归纳一下权重矩阵的类型和甄选方法。 (一)矩阵类型 任何事物之间都存在关联,但是空间相近的事物具有更大的关联性。Tobler第一定律是权重矩阵设置的基本依据。根据矩阵元素设置方法的不同,可以将权重矩阵分为以下几种类型。 1.邻界矩阵 根据空间单元是否具有共同的边界设定矩阵,如果具有共同的边界,相应元素设定为1;否则,设定为0。 2.地理距离矩阵 权重矩阵的元素设置为空间单元之间的地理距离。地理距离可以是欧式最短距离,也可以是时间最短距离。为了考察地理距离的非线性,还可以将权重矩阵设为地理距离的平方等。实际操作中,往往对地理距离设置一个断点,将空间关联限定在一定范围内,从而便于计量模型的估计。 3.经济距离矩阵 经济水平相似的区域,空间关联度较大。因此,空间依赖也与经济距离相关(Fingleton et al.,2008)。通常将经济距离矩阵的对角线元素设为0,非对角线元素为分别为i和j区域的经济水平。 这些矩阵在空间计量模型中得到了广泛使用,但是这仍然无法掩饰矩阵元素设置的主观性。为此,学术界还发展了其他设置方法。一种方法是根据数据估计权重矩阵。Bhattacharjee and Jensen-Butler(2013)首先不考虑空间效应,对每个区域进行估计,然后使用残差形成的空间协方差矩阵构建权重矩阵。另外一种方法是使用非参方法检验空间连接性,进而设定空间权重矩阵(Lopez et al.,2010;Ord and Getis,2010;Aldstadt and Getis,2006)。 (二)矩阵选择 不同的权重矩阵意味着不同类型和不同大小的空间关联范围。因此,使用不同的空间权重矩阵,会使得估计结果具有一定的差异性。这自然涉及权重矩阵的甄选问题(Leenders,2002;McMillen,2012)①。目前主要有两种甄选方法: 1.基于拟合度选择权重矩阵 假定存在S种权重矩阵,选择对数似然函数值最大的权重矩阵。尽管这种方法受到批评,但是Monte Carlo模拟表明该方法可以大大减少犯计量模型第二类错误的可能性(Harris et al.,2011)。 2.基于贝叶斯事后概率选择权重矩阵 使用对数似然函数值进行矩阵选择时,需要将模型限定为嵌套模型,否则LR检验就没法进行。而贝叶斯事后模型假定各个矩阵的事前概率都相等,使用贝叶斯方法计算事后概率,然后选择事后概率大的权重矩阵(LeSage and Pace,2009)。由于该方法不要求估计模型为嵌套模型,因此具有更大的应用空间。 三、模型架构 相比于标准的计量模型,空间计量模型的突出特点是引入了空间滞后。空间滞后可以是因变量、自变量和误差项的滞后,包含固定效应、随机效应的空间滞后,还可以是固定系数和随机系数情形下的空间滞后。空间滞后的不同组合构造了空间计量模型体系。 (一)基本架构 空间计量模型的基本架构是针对截面数据而言的。按照从一般到特殊的方式,空间计量模型的基本架构是(Elhorst,2010): 1.Manski模型 六个基本模型经过了不同的发展过程。2007年之前,空间计量模型主要包含空间滞后或空间误差的一种类型。2007年之后,出现了Kelejian-Prucha模型和空间Durbin模型。空间Durbin模型的优势在于即使真实的数据生成过程是空间滞后或者空间误差模型,仍然可以得到无偏估计。此外,该模型没有对空间溢出效应的大小作限定,既可以是全局的,也可以是局部的,还可以因解释变量的不同而不同(Elhorst,2010)。为此,LeSage and Pace(2009)建议将空间Durbin模型作为空间计量模型分析的起点。 图1 空间计量模型的基本构架及其相互转换 资料来源:Elhorst(2010)。 (二)拓展模型 当使用面板数据时,空间计量模型在两个方面得以拓展:第一,引入固定效应(地区固定或时间固定),控制空间异质性;第二,将估计系数设为随机变量,将固定系数模型转变为随机系数模型。在固定效应、随机效应、固定系数、随机系数四种模型的基础上,引入空间滞后和空间误差,得到空间计量的拓展模型(Elhorst,2003;Elhorst,2012)。 1.固定效应和随机效应的空间计量模型 固定效应模型把个体效应作为截距项来看待,随机效应把个体效应作为误差项看待。二者在模型的形式上具有很大的相似性,为此将二者合在一起阐述。 空间滞后的面板模型为(μ是个体效应):Y=ρWY+Xβ+μ+ε。 空间误差的面板模型为:Y=Xβ+μ+φ,φ=λWφ+ε。 2.固定系数的空间计量模型 固定系数模型的每个空间单元对应一个方程,各个方程误差之间具有即时相关性(该模型又称似不相关模型)。由于协方差已经反映了不同空间单元的相互作用,所以,在似不相关模型中没有必要再考虑空间误差。而包含空间滞后的固定系数模型,几乎等价于线性联立方程组,表达式为: 3.随机系数的空间计量模型 固定系数模型具有大量的待估参数,估计过程会损失大量自由度,从而降低估计效率。为了解决该问题,可以将参数设为随机变量。随机系数的空间误差模型是。由于参数是随机的,这本身就反映了空间的异质性,没有必要对空间相互作用的性质再作设定。另外,由于对随机元素的假设导致模型的识别和估计难度很大,完全的空间滞后随机系数模型是不存在的。 近年来,空间动态面板模型得到越来越多的使用(柯善咨,2009;Bouayad-Agha and Vedrine,2010)。其中,空间滞后的动态面板模型已经形成了空间递归(pure spatial-recursive)、时空递归(time-space recursive)、时空同时(time-space simultaneous)、时空动态(time-space dynamic)四类模型(Matyas and Sevestre,2008;Lee and Yu,2010)。 四、估计与诊断 (一)估计方法 对于空间误差模型,如果误差项与自变量不相关,那么,OLS估计是无偏的,但不是最有效的;对于空间滞后模型,由于滞后的因变量与误差项相关,OLS估计是有偏的,所以必须选择其他方法进行估计。目前主要有四种估计方法:最大似然(ML)估计、工具变量和矩(IV/GMM)估计、贝叶斯马尔科夫链蒙特卡罗(MCMC)估计、非参和半参估计(Elhorst,2010;McMillen,2012)。其中,前两种方法的应用较为广泛。 1.ML估计 ML估计首先假定误差项服从某种分布,根据该分布推导似然函数,然后根据似然函数对各个参数进行估计。由于需要事先假定误差项符合某种分布,因此ML估计往往需要大样本数据。 ML估计是空间计量模型中使用最广泛的方法。林光平等(2005)使用ML估计,探讨了中国省区经济发展的β收敛情况。Gallo and Dall'erba(2006)构造了同时包含时间异质、空间异质和空间依赖的似不相关模型,对欧盟地区的经济趋同进行分析。吴玉鸣和李晓霞(2006)对中国省区工业全要素生产率进行估计,发现空间计量模型在此测度中具有较好效果。李婧等(2010)、Bai et al.(2012)使用空间计量模型,探讨了区域间空间溢出对区域经济增长和创新的作用。Chen and Haynes(2014)以美国东北部走廊为例,研究了高速公路、铁路和长途汽车对区域经济的影响。 2.IV/GMM估计 内生性问题是计量模型最为棘手的问题,IV/GMM估计是解决这一问题的主要方法。与ML估计不同,IV/GMM估计不需要事先假定误差项的分布。同时,由于IV/GMM估计没有使用雅各比项,可以避免许多繁杂的计算(但由于没有使用雅各比项,估计系数可能会超过参数范围)。因此,IV/GMM估计得到了广泛应用。IV/GMM估计的难点在于工具变量的选择。当自变量X外生时,Kelejian et al.(2004)建议将[]作为工具变量。g通常取1或者2。g的值依赖于估计系数的个数和模型类型。空间Durbin模型已经包含了X和WX,因此g大于1。当一个或多个自变量内生时,则选择[]为工具变量,这里ex是指那些外生的X变量。 经验研究中,Badinger et al.(2004)使用滤波技术和GMM估计方法,讨论了欧盟NUTS2区域的趋同问题;柯善咨和姚德龙(2008)基于工业聚集和城市经济效率二者的内生性和城市间经济活动的相互作用原理,构建了工业聚集和城市经济效率的空间计量经济联立方程,发现工业集聚和劳动生产率在邻近地域上有明显的连续性和黏滞性;李涛和周业安(2009)讨论了中国省级政府间的财政支出竞争;柯善咨(2009)针对GDP、资本、就业建立包含空间效应的联立方程,对中国市县的扩散回流效应进行了分解和测度,认为省会和地级城市对下级县市有回流效应,而下级县市对上级城市有市场区隔效应。 3.贝叶斯MCMC估计 当待估参数众多、样本时间序列长度有限时,使用ML、IV/GMM估计会进一步损失自由度,使得估计结果具有较大偏误。而贝叶斯MCMC估计则可以很好地处理这个问题。贝叶斯估计假定参数是符合某种先验概率分布的随机变量。根据参数的先验分布、历史数据和内省、经验或理论依据等信息得到后验分布,然后根据后验分布进行统计推断。由于未知参数的后验分布在绝大多数情况下没有显式表达式,因此,需要采用一些方法计算后验分布的均值和方差等。MCMC是一种非常方便的方法,它不是直接从复杂的后验分布中抽取样本,而是构造一个平稳分布为后验分布的马尔科夫链。当马尔科夫链收敛后,根据该链上的样本点序列求均值和方差(林静等,2005;孙瑞博,2007)。 在经验研究上,Autant-Bernard and LeSage(2011)使用空间Tobit模型,定量测度了产业内部和产业之间、区域内部和区域之间的知识溢出;郭庆旺和赵旭杰(2012)则使用贝叶斯MCMC估计,探讨了中国地方政府投资竞争与经济周期波动的关系。 4.非参和半参估计 标准的空间计量模型假定模型是已知的,而且对估计系数也进行了限制。估计系数是否刻画了真正的效应、估计系数对模型的设置是否敏感等问题都是未知的。非参和半参方法减少了对参数和模型的限制,它认为真正的模型是未知的,使用简单的移动平均或者局部曲线拟合,得到与实际近似的函数形式(Greene,2012)。最常用的非参估计方法是核回归,表达式为:。其中,是y在x点的加权平均值,权重是核函数K,带宽窗口)是h。核函数有多种选择,常用的有高斯函数、双平方函数、三次方函数等。 当变量较多时,方差很大,非参估计受到了维度限制。这种情况下,半参方法是较好的选择。半参方法将模型分解为参数部分和非参部分,一般形式为:Y=Xβ+f(Z)+ε。f(Z)是非参部分。半参方法的优势在于它加入了参数结构,同时保留了非参结构,因此得到较多的应用(McMillen,2010;McMillen,2012)。郭炬等(2012)使用空间计量模型与非参数模型结合的方法,对中国省区技术创新能力聚集性进行了分析。 (二)统计诊断 在模型估计之后,需要对模型进行选择。通常首先估计OLS模型,然后使用LM检验和稳健性LM检验,推断哪种空间计量模型更为合适。 在OLS模型与空间滞后、空间误差或者空间Durbin模型比较中,如果OLS模型被拒绝了,就估计空间Durbin模型。然后,检验空间Durbin模型是否合适。如果使用最大似然进行估计,用似然比(LR)检验空间Durbin模型是否退化为空间滞后和空间误差模型。如果上述两个假设都被拒绝了,则空间Durbin模型是最好的模型。如果第一个假设没有被拒绝,LM检验也认为空间滞后模型较好,则空间滞后模型是好的模型。如果第二个假设没有被拒绝,LM检验也指出空间误差较好,则空间误差模型较好。如果两个条件中有一个没有满足,即LM检验结果与LR检验结果不一致,则空间Durbin模型较好(Elhorst,2010)。 在OLS模型与空间滞后、空间误差或者空间Durbin模型比较中,如果OLS估计没有被拒绝,则应该引入滞后的自变量重新进行OLS估计,并检验滞后自变量的系数是否为0(:θ=0)。如果这个假设没有被拒绝,则OLS是好的模型。如果这个假设拒绝了,则应该估计空间Durbin模型,并检验因变量滞后项的系数是否为0(:ρ=0)。如果ρ=0被拒绝,则选择使用空间Durbin模型;如果ρ=0没有被拒绝,则仅包括空间滞后的自变量就足够了(Elhorst,2010)。 需要说明的是,对于不包含空间滞后项的标准线性计量模型,估计参数表示边际效应。但是对于空间计量模型,则不能根据估计系数分析自变量对因变量的影响,而应该考虑直接、间接和总效应(Corrado and Fingleton,2012;Elhorst,2010)。 五、争议与方向 (一)争议 经过三十多年的发展,空间计量已经趋于成熟,但仍存在诸多争议与不足。第一,空间计量模型往往没法区分因为自变量高度相关导致的空间相关与因为空间溢出而产生的空间依赖或空间因果,容易将空间相关理解为空间因果,从而放大空间溢出的作用。即存在无法识别问题(Pinkse et al.,2010;Partridge et al.,2012)。为此,有些区域科学专家提出放弃空间计量的方法(Gibbons et al.,2012)。 第二,由于权重矩阵是事先给定、不随时间变化的,从而忽视了权重矩阵的内生性。使用较长时间维度的数据时,如何处理权重矩阵的内生性是空间计量面临的一个问题(Corrado et al.,2012;Harris et al.,2011)。此外,经济系统中两个区域之间的相互作用可能是非对称的。如何处理非对称的权重矩阵,也是需要解决的一个问题。 (二)未来方向 针对上面的争议,许多空间计量经济学家提出了未来研究的方向。第一,加强空间机理的把握。参数估计的准确性和因果关系的甄别,依赖于模型的结构(McMillen,2012),而正确的模型形式依赖于对空间机理的把握。目前的研究仅仅给出了空间相关和空间异质的形式,但是没有解释背后的原因。未来研究需要更好地理解空间、空间—时间相关背后的基本过程(简博秀,2004;Anselin,2010;赵映慧等,2010)。同时,通过对空间机理的把握,理解空间权重矩阵是如何内生演化的,空间相互作用为什么以及如何影响模型的其他部分,也有利于解决权重矩阵和区位的内生性等问题。 第二,探索处理大数据的技术。信息技术的发展为我们提供了海量的数据流。在海量数据面前,标准的样本—总体范式或者空间随机过程范式不再适用;均衡与显著性,在大数据面前也不再有意义(Anselin,2010)。因此,未来还需要借助计算机技术,比如分布计算、云计算等,开发新的算法,以处理大数据的问题。 ①LeSage和Pace(2010)认为,当空间计量模型的边际效应得以正确计算时,采用不同的空间权重矩阵,得到的估计结果是稳健的。标签:固定效应模型论文; 随机效应模型论文; 参数估计论文; 随机误差论文; 参数检验论文; 矩阵分解论文; 误差分析论文; 经济论文; 自变量论文;