中国区域经济增长集聚的空间统计分析_人力资本论文

中国区域经济增长集聚的空间统计分析，本文主要内容关键词为：统计分析论文,经济增长论文,中国论文,区域论文,空间论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：F061.5/F290　文献标识码：A　文章编号：1000-0690(2004)06-0654-06

引言

目前有关中国经济增长的研究取得了丰富的成果，获得了一些非常有价值的结论。但是，大多研究采用的是时间序列分析，较少进行截面的空间分析；涉及的主要是资本、劳动等传统变量，较少涉及人力资本、技术创新、贸易、地理地形等因素。在有关经济增长差异及集聚方面的研究，主要集中于空间分布格局的描述或统计分析[1,2]，较少进行区域经济增长在不同地区之间的空间相似性（集聚）或差异研究，以及解释产生这种空间格局的原因的研究[2]。

中国幅员辽阔，地区间的空间差异非常明显，利用整个全国性的综合时间序列数据，往往会掩盖这种十分显著的区域空间差异。因为存有空间差异，传统的时间序列回归方法不再适合于解释经济增长（如人均GDP）与其它影响变量间的复杂关系，可供选择的统计与计量方法有截面回归方法和时空数据模型[3,4]。截面回归包括一般回归方法（主要采用普通最小二乘(OLS)估计）和地理加权回归方法(GWR)[5,6]。虽然二者都可以进行空间相关性研究，但截面回归使用的数据信息只是同一个时期各个区域的情况，是一种静态分析，无法反映各个区域在不同时期的动态信息，因而具有一定的局限性。这种不足主要表现在：横截面数据（通常选取某一年中国31个省、市及自治区的有关数据），虽然可以在一定程度上弥补时间序列数据所不能反映的地区间差别性的缺陷，但其只能静态地反映某一个时点的经济情况，而不能全面、动态地从一个时段上描述经济现象的变化态势及形成原因。而且，单纯的截面模型的计量分析，不能体现时期特征的不足，没有考虑各个地区（如各省、自治区、直辖市）的特殊性，暗含了一个与现实不符的假定：各地区具有相同的经济结构和技术水平，并且选择不同年份的截面数据计算结果可能不同，难以得出一致的分析结论。

根据中国区域经济发展的实践，整体而言，中国经济增长差异及其集聚的原因，应该与地理位置、地形、距离等空间因素有关[7]，因此我们推测经济增长与地理特征及空间分布有关，新经济地理学者的观点支持了我们的推测[8-10]。为了从空间统计及计量的角度验证我们的猜测，本文首先引入空间统计Moran指数，检验中国31省域（注：本文的研究区域包括中国大陆31个省、直辖市、自治区，不包括香港、澳门和台湾。）之间的人均GDP在地理空间上是否具有相关性；然后再使用空间计量经济学的时空数据(Panel Data)模型，进行省域经济增长因素的统计检验和计量分析，对经济增长集聚的原因进行探究，期望能反映区域经济增长集聚的时序影响，揭示不同地区之间集聚增长的空间差异及其成因。

1　研究方法与数据样本

1.1　空间自相关分析

检验区域经济增长集聚的空间相关性存在与否[11,12]，空间统计学较常使用两个统计量：一者是由Moran(1950)[13]提出的空间相关指数Moran I；另一为Geary(1954)[14]所定义之Geary c。在实际的空间相关分析应用研究中，由于Moran I和Geary c的作用基本相同，而Moran I更为常用，因此以下介绍Moran I的基本计算原理，并将之应用于中国区域经济增长差异与集聚的空间相关性实证研究中。

Moran I定义如下

因为我们将Moran I可看作各地区观测值的乘积和，其取值范围为-1≤I≤1。若各地区间为空间正相关，I的数值应当较大；负相关则较小。具体到经济增长的空间依赖性问题上，当经济增长的目标区域数据（如人均GDP）在空间区位上相似的同时也有相似的属性值时，空间模式整体上就显示出正的空间相关性；而当在空间上邻接的目标区域数据不同寻常地具有不相似的属性值时，就呈现为负的空间相关性；零空间自相关性出现在当属性值的分布与区位数据的分布相互独立时。

根据空间数据的分布可以计算正态分布Moran I的期望值

1.2　时空数据(Panel Data)模型

本文研究的时段为1998～2002年，既有空间单元数据——31个区域，也有这些区域在5年的时间序列变化情况，反映的是不同时间（5年）和不同区域（31个省、直辖市、自治区）的经济增长，因此以下我们引进对n个个体（区域）连续观察T时期得到的时间和空间合成的时空数据回归模型——Panel Data模型，并采用适当的估计技术进行模型估计和检验。一般的合成数据模型可以表示为

由于模型(4)中有nT(K+1)个系数和nT个方程，无法从模型中直接识别所有参数，所以实际应用中需要对模型附加一些约束条件。如果经济增长的差异主要表现在横截面（区域）的不同个体之间，则假定时间序列参数齐性，且参数满足时间一致性，也就是参数值不随时间的不同而变化，模型(3)可写为

模型(7)中潜变量对截距和斜率系数都无影响，此时相当于将T个时期横截面数据融合成一个“混合样本”（样本容量为nT），所以称模型(7)为“混合回归模型”。

对于Panel Data，有以上三个模型可供选择，模型的设定非常关键，否则容易产生较大的估计误差。根据样本数据性质的不同，变系数模型(5)和变截距模型(6)又有确定效应模型(Fixed Effects)和随机效应(Random Effects)模型之分，并分别对应不同的参数估计方法。如果研究者仅以样本自身效应为条件进行推论，宜采用确定效应模型；如果欲以样本对总体效应进行推论，则应采用随机效应模型。

1.3　模型选择与建立

在时空数据(Panel Data)模型背景下，由于我们建立的仅仅是中国各省市区的计量模型，运用的也仅仅是各省市区的数据资料进行分析和研究，而且样本的时间序列比较短，研究的目的也是对中国各省级区域自身的数据进行研究，而且考虑了未观测到的31个地区特有的变量对模型的影响，故宜选择确定效应模型而非随机效应模型进行估计。因为随机效应模型要求所忽略的变量与模型的解释变量无关，这显然是一个与现实不符的假定。

由以上空间相关分析可知，中国各省级区域的经济增长确实存在空间的差异和集聚现象，需要强调地区效应，因此本文未对样本进行F检验，而直接采用变截距模型。

影响经济增长差异的因素很多，如经济发展水平、劳动力、外商直接投资、人力资本、贸易、经济体制、市场规模、经济政策、地理区位、环境管制、文化差异等。由于中国是一个发展中国家，各个地区经济发展的水平很不平衡。因此，本文在选择变量建立理论模型时，充分考虑中国的具体国情和经济发展的阶段性，构建的线性化计量模型为

人均GDP：人均GDP取了自然对数InGDP，为被解释变量。

解释变量分别为：①资本形成率：由于缺乏各个地区的资本缩减指数，我们用各省域固定资本形成总额与资本形成总额之比，表示资本形成率（投资率）INV。②外商直接投资：各省域外商直接投资流入数量与各省域当年的GDP之比，以FGDP代表。从理论分析可知，FGDP与被解释变量lnGDP应呈正相关关系，表示外商直接投资的技术溢出对经济增长起了促进作用。③劳动力：本研究以各省域全社会年底从业人员占总人口比重，衡量劳动力情况对经济增长的影响。当然，该指标没有包含劳动力的素质信息，也就是说，劳动力无法反映人力资本的变化。我们以LAB代表劳动力情况。④人力资本：由于劳动力质量的提高主要依靠教育的途径实现，在中国劳动力接受小学、中学（中专、职中）、大学（包括大专）、研究生的教育，他们各自的边际生产力也不同。本文参考Barro和Lee[15,16]的方法，考虑到目前我国区域经济发展的实际情况，如果与外商直接投资需要较高素质的人力资本相联系，采用中学生衡量其对经济增长作用显然不太合理，因此，本研究改进为以各省区每万人在校大学生人数(HK)来衡量中国地区人力资本的存量水平。⑤技术创新：以各省域三种专利授权量授权数量来衡量。专利数量是一个国家技术创新能力的重要标志，是一个衡量知识吸收和技术进步比较理想的变量。在实际的计量分析中，取其自然对数，以lnTIN代表区域技术创新能力。⑥国际贸易和区际贸易。考察贸易对经济增长的影响，可以从国际贸易和国内贸易（区际贸易）两个方面着手，但是首先需要消除国家和地区规模大小的影响。国际贸易ITR：本文以进出口总值与GDP的比值ITR衡量各个地区国际贸易对经济增长的作用；区际贸易DTR：选用了《中国统计年鉴》上公布的按销售单位所在地分的社会消费品零售总额占GDP的比重DTR作为区际贸易的具体测量指标。期望通过DTR与GDP回归的系数来检验区际贸易对区域经济发展的作用。⑦政府干预：以政府消费支出占GDP的比重(GCON)，代表地方政府的平均规模及其对经济增长的干预。

1.4　数据来源与估计方法

根据1999～2003年的《中国统计年鉴》[17]，我们选择并采集了1998～2002年中国大陆31个省市自治区的数据，样本数据由5个时期，每个时期31个区域个体构成，总数为155。其中，1998～2002年的GDP数据及其隐含的缩减因子来源于《中国统计年鉴》(1999～2003年），我们以同年的环比增长指数（即上年为100）进行了平减生成了实际GDP，再除以相应年份的人口获得真实人均GDP

Panel Data可以有效解决回归分析数据太少的不足及扩大样本容量的问题。但在采用Panel Data模型的计量方法进行模型估计时，考虑到Panel Data既包括时间序列数据又包括横截面数据，直接使用普通最小二乘法(OLS)估计模型，可能会产生异方差性和序列相关性问题，从而使OLS法失效，因而在数据可以得到的情况下，采用广义最小二乘法(Cross Section Weights,GLS)进行估计，以消除异方差的影响，保证研究模型的有效性。

2　空间统计分析

2.1　空间相关分析

首先检测31个省域的经济增长在地理空间上的相关性即空间相互依赖性。表1是利用公式(1)～(3)计算的衡量中国31个省级区域经济增长空间自相关性及集聚的人均：GDP的Moran指数及其检验值。

表1　中国区域经济增长人均GDP的Moran I指数及其Z值

Table 1 Per capita GDP and index of Moran I and its Z value in China's regional economic growth

时间

Moran I　E(I)

VAR(I)

Z值

P值

1998

0.5001　-0.0333　0.0233　4.5035　0.0000

1999

0.5069　-0.0333　0.0233　4.5551　0.0000

2000

0.5112　-0.0333　0.0233　4.5978　0.0000

2001

0.5059　-0.0333　0.0233　4.5532　0.0000

20020.5013 -0.0333 0.0233 4.5326 0.0000

表1中Moran I的正态统计量Z值均大于正态分布函数在0.01水平下的临界值(1.96)，表明中国31个省、直辖市和自治区之间以人均GDP衡量的经济增长在空间分布上具有明显的正自相关关系（空间依赖性），说明全国各省域人均GDP的空间分布并非表现出完全随机状态，而是表现出相似值之间的空间集聚，正的空间相关代表相邻地区的特性类似，即具有较高人均GDP的省区相对地趋于和较高人均GDP的省区相靠近，或者较低人均GDP的省域相对地趋于和较低人均GDP的省域相邻的空间联系结构。因此，从整体上讲是省域之间的经济增长是存在空间相关性的，也就是说中国省域经济增长存在着空间上明显的集聚(Clustering)现象。

以上定量地证明中国省域经济增长确实存在着空间的集聚现象，地区差异比较显著。这表明对于中国区域经济增长的理论与实证研究，传统研究的思路只从时间维度出发，忽视空间维度的相关性和异质性，在理论上存在严重不足，与经济发展现实不符。而在时间序列数据的基础上引入空间地理单元（横截面）数据，综合使用时空数据所表达的时间和空间集成信息，进而解释区域经济增长在时空演变中的机制和规律是一种很好的研究思路和框架。

2.2　区域经济增长成因的空间统计分析

空间相关分析虽然可以定量证明中国省域经济增长的空间相关性，但对造成省域经济增长集聚行为的影响因素和形成原因未能做出定量分析。为此，以下我们采用时空数据分析法，以中国大陆31格省域为空间单元进行区域经济增长成因的空间统计检验和计量分析。

为了减少由于截面数据造成的异方差影响，以中国大陆1998～2002年31个省市区的时空数据进行回归分析，采用变截距模型(6)式及理论模型(8)使用可行的广义最小二乘法(Feasible Cross Section Weights,FGLS)进行估计，具体的测算与检验结果见表2。

表2中的结果检验表明，调整后的决定系数高达0.999，说明模型的拟合优度非常高，F和t检验值在5%的水平下可以通过显著性检验，DW值为1.6，表明参差没有明显的序列相关。因此，从整体上讲，该变截距模型的效果很好。需要指出的是，由于劳动力未能通过10%的变量显著性检验，因此在表2中没有列出该变量的系数与检验情况。

表2中的回归系数显示了中国31个省级区域经济增长空间集聚的来源：劳动力系数未通过t检验，说明其对区域经济增长的影响不明显，中国各个地区的就业形势依然严峻；与劳动力形成鲜明对比的是，人力资本与经济增长之间具有显著的正相关性，表明人力资本已经成为决定中国省域经济增长的重要因素；资本形成对经济增长具有正面影响，对增长仍然发挥着重要作用；技术创新对经济增长表现了一定的直接正面影响，但是作用比较小；外商直接投资(FDl)、国际贸易和区际贸易对经济增长具有显著的正效应，FDI对具有很强的技术溢出效应，其技术溢出对中国经济增长起了明显的促进作用，国际贸易和国内贸易对经济增长都很重要；政府平均规模较大，对省域经济增长具有较大的干预作用，进行政府职能改革是当务之急。

表2　中国区域经济增长Panel Data变截距模型估计及检验结果

Table 2　Estimation and test results of variation interceptions of Panel Data model in China's regional economic growth

3　主要结论

综合上述研究，我们得到如下主要结论：

1)中国省域经济增长具有明显的空间依赖性，而且省域经济增长在空间上确实存在比较显著的集聚性，区域经济增长的空间差异也比较明显。对于中国区域经济增长的理论与实证研究，传统研究的思路只从时间维度出发，忽视空间维度的相关性和异质性，在理论上存在严重不足，与经济发展现实不符。需要在时间序列数据的基础上，引入空间地理单元（横截面）数据，综合使用时空数据所表达的时间和空间集成信息，进而科学地解释区域经济增长在时空演变中的机制和规律。

2)空间相关以及由此带来的国际国内贸易及外资等经济活动频繁程度，在很大程度上引起了31个省域区际经济增长的空间不均衡，空间集聚使得在经济增长过程中地理区位（距离）产生的空间成本降低，弱化了原来的空间差异对经济增长产生的影响，但地理特征也深刻作用于区域经济增长空间集聚的中心和外围关系。

3)追究区域经济增长集聚和差异存在的原因，改革开放带来，不断提高的人力资本、不断加剧的经济全球化、日新月异的技术进步状况以及日益雄厚的物质资本积累，在提高中国区域经济效率方面产生了巨大的作用，同时也对中国经济增长的区域集聚及空间差异产生了影响，近来中国区域经济增长的良好态势充分证明了这一点。

4)尽管技术进步日新月异，国际区际贸易、人力资本、技术创新等因素对中国区域经济增长的贡献非常重要，但它却不能轻易改变经济地理的规则，经济增长因素在地理空间上的非均衡集聚导致了迥然不同的区域经济增长格局。

收稿日期：2004-03-17；修订日期：2004-05-18

标签：人力资本论文; 中国统计年鉴论文; 经济增长论文; 经济论文; 相关性分析论文; 集聚效应论文; 区域经济学论文; 相关性检验论文; 统计分析论文; 地理论文;

中国区域经济增长集聚的空间统计分析_人力资本论文

猜你喜欢