转型期中国制造业产业集聚分布特征及动态演进——兼论EG指数衡量产业集聚的有效性,本文主要内容关键词为:产业集聚论文,转型期论文,有效性论文,特征论文,中国制造业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F263 文献标识码:A 文章编号:1000-176X(2016)01-0025-09 作为经济活动的基本特征,产业集聚被很多学者当作实证分析的背景或视角。然而,其中许多实证研究的分析结果存在较大差异,甚至出现了基于同组数据却得到相左结论的现象。那么,为什么会出现这种情况呢?数据质量直接决定了实证分析的生命力。我们发现,学者对中国产业集聚分布特征仍然存在争议,这是导致相关实证分析结果存在争议的重要原因。以EG指数[1]为例,目前国内采用该指数测算中国制造业产业集聚且影响较大的文献是路江涌和陶志刚[2]、文东伟和冼国明[3]的研究,均是基于工业企业数据库进行的测算,但两篇文献所测算的产业集聚分布特征截然不同,路江涌和陶志刚测算结果的分布呈现“金字塔”结构;而文东伟和冼国明测算结果的分布呈现“倒金字塔”结构。如果基于上述两组EG指数分别进行实证分析,所得到的结果很可能是存在较大差异,甚至截然相反。鉴于此,我们认为有必要从技术与经济角度对产业集聚指标研究设计中存在的问题进行讨论,以求尽可能准确地反映中国产业集聚分布的现实状况。 本文试图通过对EG指数中关键参数的讨论,明确中国制造业产业集聚分布特征。在明确EG指数关键参数为赫芬达尔指数(HHI)与空间基尼(G)基础上,本文进行了以下两方面改进:一是从静态角度比较不同HHI算法对产业集聚分布特征的影响,并结合转型期特征对按照不同算法得到的结果进行评价;二是对产业集聚动态演进过程进行分解,讨论G对制造业产业集聚分布特征的影响,为其提供经济解释。 二、文献评述 (一)产业集聚指标及应用状况评述 截至目前,学术界一共提出了三代产业集聚衡量指标。第一代指标包括CR[,n]指数、Hoover指数、赫芬达尔指数、空间基尼系数和区位熵等,设计思路是通过衡量某区域若干排名靠前企业产值占全行业比重或个体与行业均值间的偏差。之后,在一篇非常有影响的文献中,Ellison和Glaeser[1]认为第一代指标未考虑同一产业中企业规模的分布差异,无法识别各种溢出效应对企业选址的影响,会造成偏差。基于企业选址思想,他们对空间基尼系数指标进行了优化,提出了γ系数,即EG指数。随后,Duranton和Overman[4]、Marcon和Puech[5]、Scholl和Brenner[6]提出了DO指数、M函数等第三代产业聚集度指标,试图进一步减小企业规模和区域边界对测算结果产生的偏误。 从上述三代产业集聚指标在经济学研究中的应用情况来看,现在很多国外学者已将EG指数应用于本国产业集聚问题研究当中,EG指数也因此成为衡量产业集聚的主流方法。然而,国内学术界目前所使用的产业集聚指标仍然以第一代为主,主要原因在于微观数据的限制。随着工业企业数据库的出现,学者对微观数据重视程度日渐提高,近年来越来越多的学者开始关注EG指数,出现许多使用该指标的实证论文,应用前景非常乐观。至于第三代产业集聚指标,由于计算繁琐,并且对微观空间数据要求较高,仅有少数学者使用。 (二)基于EG指数的文献评述 总的来说,国外学者基于EG指数的研究主要包含三个方面:第一,衡量产业集聚程度。Maurel和Sedillot[7]、Devereux等[8]分别采用EG指数对法国、英国的制造业产业集聚程度进行了测算;第二,讨论产业集聚形成的原因及推动因素。Rosenthal和Strange[9]、Dumais等[10]分别在EG指数模型框架下,讨论了美国产业集聚的决定因素,Puga[11]、Syverson[12]分别基于EG指数测算从生产率分布差异角度讨论了推动产业集聚的原因;第三,分析产业集聚对其他经济活动的影响。Delgado等[13]在EG指数测算结果基础上,讨论了产业集聚对企业进入的影响。Duranton和Puga[14]则使用EG指数讨论了产业集聚对创新以及产品周期的影响。 虽然目前国内学术界基于EG指数的研究尚处于起步阶段,总体文献数量较少,但呈逐年增长趋势。罗勇和曹丽莉[15]、路江涌和陶志刚[2]最早使用EG指数分别测算了1993-2003年和1998-2003年期间全国制造业聚集程度。之后,文东伟和冼国明[3]再次测算了1998-2009年全国制造业EG指数。此外,邱灵和方创琳[16]测算了北京市区生产性服务业的EG指数,赵黎明和邢雅楠[17]测算了中国旅游产业的EG指数,刘艳[18]测算了中国战略性新兴产业的EG指数,赵浚竹等[19]测算了汽车制造业集聚程度,等等。文东伟和冼国明[20]基于EG指数测算结果,讨论了制造业空间集聚、融资约束和全要素生产率等因素对中国制造业企业出口的影响。 综上所述,与国外同行相比,国内学者在EG指数应用方面,无论在范围还是在深度上均有待提高。然而,在我们将EG指数用于实证分析之前,首先需要明确的是由于EG指数同时考虑了规模集聚和空间集聚,学者在使用EG指数测算产业集聚时,比第一代指标拥有更高的自主度,能够弥补第一代产业集聚指标中存在的部分问题。但另一方面,这又可能导致新问题的出现。路江涌和陶志刚[2]、文东伟和冼国明[3]关于产业集聚分布特征的矛盾就是最好的证明。因此,本文研究目的之一便是希望通过讨论基于EG指数测算的产业集聚分布特征,使学者注意到EG指数存在的问题以及影响,并在实证分析中给予足够关注。 三、EG指数测算方法及数据来源 (一)EG指数测算方法 Ellison和Glaeser[1]提出的EG指数计算公式如下:① 与第一代产业集聚衡量指标相比,EG指数优势是非常明显的。由于EG指数中包含了HHI和G两项指标,能够将规模集聚和空间集聚两方面因素纳入到统一的分析框架中,算法实现简便且弹性较好,能够方便地对不同地区与不同行业集聚水平进行测算及比较。但这也对学者提出了更高的要求,由于选择弹性更大,所以学者想得到能够准确反映产业集聚状况的结果,需要结合研究主题确定HHI与G算法,否则很可能出现偏差。 (二)EG指数算法的静态比较 (三)G算法与HHI的选择 在使用EG指数测算产业集聚之前,学者必须要做以下两个选择:第一,确定地理范围。第二,确定企业数量。关于这两个选择,文东伟和冼国明[3]均进行了讨论,他们发现,地理范围划分越细,则EG指数结果就越小,原因在于地理范围越小,则就越小,就越小;而行业范围越细,则EG指数结果就越大,因为行业范围越小,则就越大,HHI就越大。 除此之外,注意到HHI算法也会对EG指数产生影响,也就是进入HHI计算公式的企业数量。目前,计算HHI的方法主要有两种:一是代表法,即从所有样本中截取部分(或按照一定比例,或按照固定数量)用以计算HHI;二是平均法,即采用所有样本计算HHI。与平均法相比,按照代表法计算的HHI数值较高。因此,在某些情况下,采用平均法可能会低估规模集聚水平。参考Ellison和Glaeser[1]的研究,国内已有研究在计算HHI时多选择平均法计算HHI,而这样的处理可能是并不恰当的,我们将在下一部分中对此问题进行重点讨论。 (四)数据来源及清洗 为了验证上述讨论,我们将在给定空间基尼系数G算法的情况下,基于不同HHI算法测算EG指数。与已往研究一致,本文主要采用1999-2009年中国工业企业数据库中的行业从业人数与主营业务收入两项指标③进行测算。首先,根据聂辉华等[21]、Brandt等[22]的建议,在测算之前要对数据进行清洗。具体来说,当估计4位代码行业时,数量达到400个以上,其中包含少量规模非常小的行业,对这些行业进行测算的经济意义不大。因此,我们剔除了就业人数小于10、主营业务收入小于0的企业以及企业数量少于10个的行业。其次,由于国民行业代码划分标准在2002年时进行了更新,④所以在数据配对过程中,对2002年国民行业代码变化前后的行业进行了合并处理,并且仅对样本考察期内持续存在的行业进行测算。简便起见,我们并未对“省、市、县”三种地区划分方式全部进行测算,仅测算按省划分的EG指数。我们分别基于代表法排名前10、前15、前1%企业HHI测算了EG指数,为了设定基准,还基于平均法的HHI进行了测算。最后,我们还根据测算结果对Ellison和Glaeser[1]给出的分类标准进行了调整,将γ<0、0<γ<0.02、0.02<γ<0.05和γ>0.05四种情况分别定义为分散、低度集聚、中度集聚和高度集聚。 四、产业集聚分布特征及HHI算法选择 (一)基于EG指数测算结果的产业集聚分布特征 如表1所示,采用不同HHI算法的EG指数测算结果之间差别是非常明显的。首先,基于代表法HHI测算EG指数结果显著低于基于平均法的EG指数测算结果。从表1中可以看到,基于代表法HHI测算EG指数算术平均数均是负的,而基于平均法HHI测算EG指数算术平均数均为正值,与路江涌和陶志刚[2]、文东伟和冼国明[3]的研究结论类似。上述结果说明HHI算法的变化将会影响学者对产业集聚整体情况的判断。其次,基于代表法HHI测算EG指数产业集聚分布特征与基于平均法HHI测算的EG指数产业集聚分布特征存在明显差异。基于代表法HHI测算的EG指数时,产业集聚水平分布呈现“哑铃结构”,与路江涌和陶志刚“金字塔结构”的研究结果更为接近,而基于平均法HHI测算EG指数时,产业集聚水平分布则呈现“倒金字塔结构”,与文东伟和冼国明的研究结果一致。更为重要的,在样本期内,基于代表法HHI测算的EG指数产业集聚分布特征较为固定,而基于平均法HHI测算的EG指数产业集聚分布特征则发生了明显变化。 (二)制造业产业集聚分布特征评价及EG指数有效性 那么,究竟哪个结果能够更准确地反映制造业产业集聚分布特征呢?这是本节内容主要讨论的问题。我们认为,基于平均法HHI测算的EG指数结果会高估产业集聚水平和高估产业集聚演进速度的情况。因此,无论从技术角度还是经济解释角度,基于代表法HHI测算的EG指数均更加符合实际情况。原因在于:第一,工业企业微观数据库中相当比例4位代码行业具有以下两个基本特征:一是规模较小,特别是企业数量少;二是排名靠前的企业主营收入占的市场份额较高,加之产业集聚具有明显的范围经济特征。根据产业组织理论,在这些行业中排名靠前的企业将依靠技术、人才等方面优势抬高行业门槛,形成局部垄断,阻止新企业进入,从而阻碍空间集聚水平提升,影响产业集聚水平提高。在这种情况下,基于代表法测算的HHI可能低估这些企业的市场势力,导致EG指数测算结果偏高。第二,与西方国家相比,中国经济制度环境具有以下两点特征:一是行政性分权与经济型分权以及由此产生的市场分割;二是行政垄断、混合所有制等转型经济体特征。制造业产业集聚分布形成很可能会受上述两方面特征影响。首先,出于提升或保护本地优势行业竞争力的目的,地方政府会过度对特定企业进行补贴或减税,当政府补贴或被减的税收进入企业利润函数之后,就会刺激企业加大投入,考虑到中国企业更偏好规模扩张而非技术研发,进行扩张的主要方式就是增加本地产能或者在其他地区设立新厂,带动所在行业及其上下游行业的发展;其次,出于维护本地企业利益以及发展本地经济的目的,政府会采取保护措施,阻止来自其他地区企业或商品进入。因此,产业集聚分布特征很可能存在分化的情况,即高度集聚产业越来越趋于集聚,而低度集聚产业越来越趋于分散。通过分析,我们认为,基于代表法HHI测算的EG指数更符合上述描述。第三,作为复杂的经济现象,产业集聚演进涵盖的影响因素及微观机理非常复杂,演变过程是非常缓慢的。已有研究也证明了这一点,Dumais等[10]基于EG指数测算结果考察了美国20年来产业集聚演进情况,发现分布特征几乎没有发生变化,Maurel和Sedillot[7]、Devereux等[8]学者也得到了类似的研究结论。因此,直观上,基于平均法HHI测算的EG指数结果会高估产业集聚演进速度。我们认为,上述问题主要是由工业企业数据库统计过程中的技术性因素造成的,随着国民经济规模不断增加,虽然规模以上企业统计标准经过若干次向上调整,然而企业数量一直处于大幅增长状态,导致代表法HHI的测算结果出现技术性下降,难以准确反映实际情况。 五、产业集聚动态演进过程分解 确定基于代表法HHI测算的EG指数更符合实际情况之后,我们给定HHI算法的影响,试图从空间基尼系数G角度研究产业集聚动态演进过程,进一步为转型期中国制造业产业集聚分布特征提供经济解释。 (一)理论模型 如前所述,产业集聚动态演进主要是在空间集聚和规模集聚双重影响下实现的。如果给定某行业EG指数不变的结果,很可能是由以下两种情况造成的:一是空间集聚和规模集聚朝相反的方向变化,即G增大H减小,或者G减小H增大,并且两者影响相互抵消;二是新企业在旧企业原址上继续生产。由于第二种情况无法在产业集聚指标上体现,所以这里主要讨论的是第一种情况。现实中,空间集聚与规模集聚的影响是很难完全抵消的,这是为何产业集聚在不断变化,Dumais等[10]认为这种变化可以通过从业人数变化予以反映,具体如式(2)所示: 将式(2)代入式(3),并经过化简之后,可以得到式(4): 其中,是j行业在t时刻就业人数的空间基尼系数。根据式(4)的结果,j行业的空间集聚变化被分解为均值效应与随机效应两部分。其中,均值效应大小取决于,即式(2)中的空间变化。因此,当β<0时,表明i地区j行业的从业人员流向其余地区,导致i地区j行业的空间集聚水平下降;当β>0时,表明j行业的从业人员持续向i地区流入,空间集聚水平提高。随机效应包含了所有除从业人员数量变化以外因素的影响。由于经济活动趋于集中是人类活动的天性,在稳定的经济社会发展局面下,促进产业集聚增加的因素远多于导致产业集聚减小的因素,因此,随机效应总是大于0的。根据之前对EG指数的静态比较分析,空间集聚程度越高,产业集聚水平就越高,可以通过估计式(4)检验空间集聚对产业集聚的影响。 (二)实证分析方法与相关系数 与Dumais等[10]不同,本文将采用面板数据进行模型估计,首先需要解决计量模型选择的问题。由于估计式(4)使用的数据是4位代码行业的空间基尼系数,属于典型的“N大T小”短面板数据。在这种情况下,固定效应模型是最常用的。然而,式(4)当中并未包含常数项,而固定效应模型中必须包含控制个体效应的截距项,这样的话,我们就无法衡量式(4)中随机效应的影响。因此,我们将采用不包含截距项的MLE随机效应模型进行估计。为了对比两种估计方法对测算结果的影响,我们仍将给出固定效应模型估计结果。此外,为了比较异质性产业集聚的动态演进过程,我们一共测算了三组分析结果:全样本、按集聚程度与按2位代码行业划分的样本。⑦ 进行实证分析之前,首先给出不同年份4位代码行业EG指数间的相关系数,如表2所示。从结果可以看到,4位代码行业EG指数的相关系数满足以下特征:第一,前期产业集聚与后期产业集聚之间均是正向关系,表明产业集聚演进存在一定的惯性。第二,相关系数值随年份增加逐渐减小,表明前期产业集聚与后期产业集聚之间的密切程度不断减弱。第三,2003年之前产业集聚水平相关性较低,2003年之后产业集聚水平相关性较高。此外,与Dumais等[10]研究中美国历年产业集聚相关系数均在0.9以上相比,中国不同年份制造业产业集聚相关系数值是比较低的。 (三)实证结果与分析 1.全样本以及集聚程度分组 表3给出了采用MLE随机模型估计的产业集聚动态演进分解结果,报告了各组回归的EG指数均值、式(4)中的、t值、残差的均值γ与标准差σ。 结果显示:(1)除EG指数小于0行业(即分散行业)以及中度集聚行业两类分组之外,其他分组估计得到的均是正值,且在1%显著性上通过了检验,表明除分散和中度集聚行业外,其余程度集聚行业的均值效应均促进了空间集聚变化。(2)均值效应在高度集聚和低度集聚两类行业当中影响最大,估计系数分别达到0.163、0.105,高于全样本分组的估计系数,而中度集聚行业未通过显著性检验。在剔除分散行业之后,全样本估计系数达到0.138,高于低度集聚行业。此外,分散行业估计系数为-0.036。上述结果表明均值效应在不同程度集聚行业影响存在“两极化”趋势,即高度集聚的行业更趋于集聚,而分散行业更分散,而对中度集聚行业的影响并不明显,这为EG指数分布特征呈现“哑铃结构”提供了解释。(3)不同分组中的随机效应的影响是不同的。其中,高度集聚行业的γ和σ明显高于其他组,而分散行业以及中度集聚行业两类分组的γ和σ明显低于其他分组,特别是分散行业分组的γ符号为负,说明不仅空间集聚,外部因素也是导致产业集聚分布呈现“哑铃结构”的重要原因。 2.按2位代码行业分组 第一,与按照全样本以及集聚程度分组的回归结果一样,除了造纸及纸制品业与水的生产和供应业的估计结果系数为负之外,其他分组估计结果均是正值,并且大多数估计系数在1%显著性水平上通过了检验,表明在绝大多数行业中,均值效应促进了空间集聚提升。第二,不同行业当中均值效应影响的差异比较大。在剔除估计系数为负值的行业之后,估计系数最高的行业依次为农副食品加工业、电子机械及器材制造业、医药制造业、橡胶制品业以及烟草制品业,估计所得到的系数均在0.2以上;废弃资源和废旧材料回收加工业、木材加工及木、竹、藤、棕、草制品业、纺织业等13个行业的估计系数在0.1—0.2之间,其余行业的估计系数在0.1以下。需要特别指出的是,所有估计系数在0.1以下的行业均未能通过显著性检验,而估计系数在0.1以上的行业,除了印刷业和记录媒介的复制与化学纤维制造业以外,多数行业均在1%显著性水平上通过了检验。上述结果说明,均值效应的影响呈现两极分化,这与全样本及集聚程度分组的实证结果是一致的。。第三,通过比较不同行业EG指数均值、估计系数、γ值和σ值可以发现,总体上,估计系数、γ值和σ值与EG指数均值间呈现负相关,即随着产业集聚升高,驱动产业集聚的力量逐渐减弱。这与直观感觉一致,随着产业集聚提高,进一步提升的难度也在增加。 3.估计结果有效性比较 为了检验估计结果的稳健性以及对比不同估计方法对结果的影响,我们采用固定效应模型估计的产业集聚动态演进分解结果,限于篇幅不在文中列示。 结果显示:(1)采用MLE随机效应模型得到的估计系数显著性低于固定效应模型,且估计系数明显小于固定效应模型,如果按照估计系数大小对两次估计结果分别进行排序,则一些行业排名出现了较大变化。原因在于:第一,在控制个体效应之后,估计系数值与显著性均出现明显的提升。这一结果并不出人意料,因为估计使用的是4位代码行业EG指数,这些子行业均同属于2位代码行业,经营环境是比较相似的,所以在控制固定效应之后,不同组别估计系数值与显著性均会有所提升。第二,由于2位代码行业之间自身存在的差异,导致不同行业的固定效应也是不同的,这种差异决定了估计系数变化的大小。(2)采用MLE随机效应模型得到的γ和σ高于固定效应模型。如前所述,由于控制了行业固定效应,所以与MLE随机效应模型相比,在固定效应模型估计残差中影响产业集聚的因素减少。上述变化导致固定效应模型中的γ和σ偏低。综上所述,MLE随机效应模型的优势在于对随机效应的衡量更为准确,而固定效应模型由于控制了个体效应的影响,对均值效应估计更为准确,但由于未能将个体效应纳入到残差中,对随机效应的衡量逊于MLE随机效应模型。总体来说,固定效用模型估计结果是稳健的。 六、研究小结 近年来,随着以产业集聚为研究主题的实证论文越来越多,产业集聚指标测算结果准确性问题愈加重要,然而,目前关于中国产业集聚分布特征的系统讨论尚不多见。鉴于此,本文以基于工业企业微观数据库测算的EG指数为例,讨论赫芬达尔指数(HHI)与空间基尼(G)两个关键参数变动对产业集聚分布特征测算结果的影响。研究结论表明:(1)国内已有研究在计算HHI时多借鉴Ellison和Glaeser的研究选择平均法,但这一选择很可能会高估产业集聚水平以及分布变化速度,使用代表法计算HHI更为合适。(2)无论从均值效应还是随机效应来看,空间集聚变化均呈现“两极化”趋势,即高度集聚的行业更趋于集聚,而分散行业更分散,且对中度集聚行业的影响并不明显,符合基于代表法HHI测算的EG指数分布特征。(3)基于代表法HHI测算的EG指数结果,制造业产业集聚分布呈现“哑铃结构”。综上所述,我们建议学者在使用EG指数衡量产业集聚时,应根据研究主题确定HHI与G算法。 ①由于篇幅原因,这里不再给出EG指数的推导过程,详细推导参见Ellison和Glaeser[1]。 ②用归纳法能够证明G>A是不可能出现的,我们之后的测算结果也印证了这一点。 ③由于2000年从业人数指标的缺失,该年的EG指数空缺。 ④由GB/T4754-1994转为GB/T4754-2002。 ⑤假设扰动项与其他系数之间满足正交关系。 ⑥在式(3)中,空间基尼系数被用于替换EG指数衡量产业集聚变化。在不影响最终结果的前提下,这样处理主要出于以下两个原因:第一,简化分解过程;第二,空间基尼系数能够更准确地衡量企业选址变化所导致的产业集聚水平变化。此外,按照面板数据的估计方程,我们对其分解模型进行了相应调整。 ⑦此处需要说明的是,2位代码行业的实证分析结果是基于其4位子类行业估计得到的。转型期中国制造业集聚的分布特征与动态演化--兼论EG指数在衡量产业集聚中的有效性_产业集聚论文
转型期中国制造业集聚的分布特征与动态演化--兼论EG指数在衡量产业集聚中的有效性_产业集聚论文
下载Doc文档