产业地理集聚、产业集聚与产业集群:测度与识别_地理论文

产业地理集中、产业集聚与产业集群:测量与辨识,本文主要内容关键词为:产业集群论文,测量论文,地理论文,产业集聚论文,产业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

产业通常集中在少数地区,其原因可能包括资源优势、区位优势、内部规模经济、外部规模经济以及相关制度安排等[1]。产业地理集中反映产业产值或就业集中在少数地区,但产业地理集中可能是由于内部规模经济或资源优势导致少数几个大企业在少数区域的集中,也可能由于外部经济吸引大量中小企业而导致的地理集聚,而大量相互联系的中小企业的地理聚集可成为产业集群。

近年来,产业地理集中的研究成为经济学家和地理学家共同关注的重要研究领域,发表了大量的关于产业集中的研究成果。这些实证研究的一项关键任务就是找到合适方法来客观而准确地衡量产业的地理集中程度。文献中使用了许多衡量产业地理集中的系数,一些衡量产业的总体地理集中程度,另一些控制产业内企业规模分布的影响,衡量产业地理集聚;一些系数是基于区位理论提出的,另一些则缺乏理论基础,仅是统计参数;一些基于行政单元,另一些基于连续空间。为了辨识产业集群,学术界从20世纪60年代以来发展了许多方法,如基于投入产出表的图谱分析和主成分—因子分析、基于产业空间分布的空间联系与空间相关分析和区位商法等。Combes和Overman[2]认为测量产业地理集中或集聚的指数要满足一些基本条件:

(1)不同产业之间可以比较。根据计算结果可以比较哪些产业更为集中,哪些产业比较分散;同样可以说明不同产业分类的地理集中程度,如两位数、三位数以及四位数产业的集中程度;

(2)不同空间尺度可以比较。根据计算结果,可以比较产业是在哪些区域比较集中或分散,或者比较在国家和区域层次的集中程度;

(3)在产业随机分布的“零假设”前提下,指数的估计值是确定的或唯一的;

(4)需要能够检验指数估计结果的显著性,能够明确指数的估计值达到多少产业是集中的或是分散的;

(5)在空间尺度或空间规模改变的情况下能够保证指数估计无偏性;在产业分类改变的情况下,能够保证指数估计的无偏性。

Duranton和Overman[3]也指出,衡量产业集聚的指数要符合如下条件:(1)产业间可比;(2)能够控制经济活动的总体集聚程度;(3)能够控制产业集中程度;(4)空间尺度与产业分类的不同不会改变指数估计值的无偏性;(5)能够进行估计结果的显著性检验等。Czamanski和 Ablas[4]认为辨识产业集群需要同时考虑产业的技术联系和产业分布的空间联系,任何只考虑产业联系或空间关联的方法都是片面的。本文旨在对各种衡量产业地理集中的方法进行综述性的梳理,并作简要评述。

2 衡量产业地理集中

测量产业地理集中程度需要产业—区域数据,即每个产业在各个区域内的规模,如就业或产值,区域内产业数据的统计通常是按照行政单元统计的。现有文献中采用了大量的衡量总体产业地理集中的系数,包括赫芬代尔系数、赫希曼-赫芬代尔系数、胡弗系数、信息熵系数、锡尔系数和基尼系数等。如白重恩等人[5]采用胡弗系数测量中国工业省区集中程度,Fan和Scott[6]计算了2000年我国主要制造业的赫芬代尔系数,贺灿飞等[7]采用基尼系数测量了我国1980~2003年间制造业的地理集中程度。这些衡量产业地理集中的系数采用人为划定的地理单元,受空间单元划分程度的影响。下面评述几个常用的系数。

2.1赫芬代尔系数(Herfindahl)和赫希曼—赫芬代尔系数(Herschman-Herfindahl)

赫芬代尔系数是各区域某产业产值或就业比重的平方和,即

如果所有经济活动都集中在一个区域,那么H=1最大,如果经济活动平均分布在各个区域,H=1/n。这个系数实际上仅衡量了产业的空间分布,并没有与其他经济活动相比较,衡量的是产业绝对集中程度。为了衡量产业的相对集中程度,赫希曼改善了赫芬代尔系数,

2.2信息熵(Entropy index)和锡尔系数(Theil index)

信息熵原本用来测量一个系统的复杂程度。一个产业的空间分布越分散,表明这个系统越复杂;反之,产业在空间上越集中,则该系统越简单。产业空间分布的信息熵如下:

锡尔系数经常用来测量收入的区域差异,也可以衡量产业的地理集中程度,计算如下:

与赫芬代尔系数一样,信息熵和锡尔系数仅衡量产业空间分布,是绝对的集中或分散程度。

2.3基尼系数(Gini Coefficient)

上述各类系数多数测量产业的空间分布,没有与其他经济活动相对比。基尼系数将某产业分布与其他产业对比,是使用最广泛的系数之一,计算公式如下:

基尼系数等于洛伦茨曲线与45°线之间面积的两倍,洛伦茨曲线是基于s[,ij]递增排序,并将累计s[,ij]置于纵轴,而累计的区域数置于横轴绘制而成的。如果产业在各区域平均分布,基尼系数为0,如果产业集中在一个区域,基尼系数为1。Krugman[8]还提出区位基尼系数,是基于产业区位商排序计算得来,

上述各项系数都是测量产业的总体地理集中程度,并不考虑产业内企业规模分布对产业地理集中的影响,不能区分产业地理集中形成的原因。产业地理集中可能由于产业内少数几个大企业集中在少数区域或者大量的中小企业在某些区域的集聚。Holmes和Stevens[9]发现企业规模与产业地理集中显著相关,地理集中程度高的产业,平均企业规模也较大。也就是说,产业的组织集中很大程度上可以解释产业的地理集中。为了辨识产业地理集中是源于内部经济还是外部经济,最近的研究提出了基于企业区位模型衡量产业空间分布的方法。如 Ellison和Glaese[10]和Maurel和Sedillot[11]等提出的指数可以控制企业规模分布对产业地理集中的影响,因此称为产业集聚指数

3 衡量产业地理集聚

根据Ellison和Glaeser,如果企业区位决策不是独立的,那么企业选择某个区位是为了利用某个区位的自然优势,如接近原材料或从与其他企业临近中获得好处[10]。从企业空间临近的溢出效应出发,他们导出衡量产业集聚的系数。

两个企业位于任何相同区域的概率则为

为了估计γ,Ellison和Glaeser[10]首先引入了总地理集中指数,即某个产业的区域比重与所有产业的区域比重推导出来的,

在这个基础上得到γ的估计公式,

Maurel和Sedillot[11]则直接估计两个企业位于同一个区域的概率,有两种方法:①简单的频率估计,即某个区域内的企业对数与全国企业对数值之比;②对每一个企业加权,这个权重就是给定企业就业占整个行业的就业比重

计算得到

因此γ的估计如下:

如果一个产业的估计值为正,说明该产业在空间上集聚,反之则分散。不管是EG还是 MS指数,γ的意义很直接:如果企业随机选择区位,而且相互独立,γ的平均值为0,这种情况下,外部性和资源禀赋都没有影响企业的区位选择,产业地理集中仅仅是由于产业集中造成的。一个产业γ值较大,也就意味着额外的集中,亦即比随机过程导致的集中更显著。两者衡量的是控制企业规模分布的地理集中,但是EG系数并不能表明这种额外集中是由于资源禀赋、集聚经济还是其他原因。虽然EG指数采用赫芬代尔系数来控制产业集中的影响,Holmes和Stevens[9]指出EG指数仍然受产业内企业规模影响。很多产业中,如果不考虑小企业,那么EG指数会增加。

MS与EG的估计存在一些差异,但这个差异的期望值为零,因此两者的估计都是无偏估计。但是MS估计含义更明了,因为MS是直接从概率模型推导出来的,尤其MS估计中的H系数直接源于估计的概率。MS和EG的差异体现在对总体产业地理集中的衡量方法的不同。说明γ可以反映企业区位选择的相关性,衡量的是控制产业集中后的地理集中。MS与EG估计相比,特定产业与总体经济活动的分布偏差的重要性是不同的,对MS估计而言,特定产业在某个地区较总体经济活动的比重大,对MS估计的作用是正的,反之则是负的;如果一个地区的总体经济活动占全国的比重较大,特定产业在该地区的比重更大的话,对于MS估计的正作用将会是非常大的,所以如果一个产业在产业中心集聚,MS估计值将比较大。EG估计则无论特定产业比总体经济活动的比重是大还是小,对其估计都是正的作用,但如果一个产业集中在产业中心,EG估计要较MS估计小[12]。

4 基于距离的产业集聚测量

Marcon和Puech[13]认为现有的产业集中或产业集聚的衡量方法都以行政单元为基础,只能描述单一空间尺度上的产业集聚程度,这些行政单元通常规模差异很大,比如中国的新疆和内蒙古比安徽、江西、浙江等省区空间上大很多倍。这种基于行政单元计算的产业地理集中或集聚程度指数可能会误导人们对产业空间模式的判断。要能够比较准确地描述经济活动的空间模式,需要能够同时描述产业在不同空间尺度的空间结构,而非依赖人为的空间划分或行政单元。将不同企业归并在一定的空间尺度,将导致归并产业的空间分布的虚高度相关。为了克服传统衡量方法的问题,March和Puech[13]和Duranton和Overman[3]分别引入了基于距离和企业数据的产业集聚衡量方法。

March和Puech[13]的衡量方法基于Ripley的K函数。假定企业的空间分布已知,每个点代表一个企业,表示为(x,y),企业的空间分布可以理解为点模式随机过程的结果。

在均匀分布时,点密度λ(x,y)是固定值P(dS)=λ(dS)。在随机而独立的点分布中,在面积s的区域内点个数不是固定的,而是服从带有参数为λs的泊松分布。

为了衡量点分布是集中还是分散,我们可以计算任何点在其半径r内的邻居个数,然后将平均邻居个数与期望邻居个数λπr[2]相比,如果一个点的平均邻居数比期望值高,那么该点及其周围的邻居是集中分布。Ripley将这个逻辑与g(.)函数联系起来[14]。Ripley的K函数描述一个点过程的空间分布,K(r)定义为邻居个数除以平均点密度,对每一个点半径r内的期望点数为λK(r)。在均匀分布和均质性的假设(λ为固定值)前提下,仅取决于两点的距离。Ripley(1977)建立K函数为

L(r)>0表示集中分布,L(r)<0表示分散分布。

总之,K和L函数通过计算任何点在一定半径内平均的邻居个数来测量点分布的集中与否。在研究产业空间分布时,可以认为每一个点代表一个企业,可以计算每个企业在一定半径范围内的企业数,并比较观测的分布模式与通过蒙特卡罗法产生的随机点分布做比较,从而判断企业的分布是否集中。基于距离的产业集聚衡量方法可以测量一个产业内的企业在多大距离范围内是集聚的,可以比较真实地反映产业的空间集聚程度。但是基于距离的测量方法对于数据和计算工具的要求比较高。首先必须有每一个企业的精确的地理位置,并能够将企业在地图上标注,这样的数据在很多地区是保密的,难以获取。其次,如果企业数量比较多,这种方法的计算工作非常繁重,因为需要计算每一个企业在不同半径内的其他所有企业数目。再次,计算L或者K涉及每个企业的一定半径范围内的邻居个数,然而对于那些位于区域边界的企业,由于企业的半径范围内部分区域在研究范围之外,其邻居个数显然被低估。因此正确地运用L或K函数衡量产业集聚需要进行边界效应矫正处理。不规则的研究区域将显著增加基于距离计算方法的复杂性。最后,由于L函数或K函数的分布是未知的,两者的方差没法估计,因此需要采用一些随机方法产生大量独立随机分布的点来构建每一个选定半径r的相对应的L值或K值的致信区间。

5 产业集群的定量辨识方法

产业集群是相互联系的企业和组织在空间上的聚集,联系很强的产业可能在空间上比较接近。辨识产业集群需要同时考虑产业联系和空间临近,但反映产业联系的数据投入产出表经常难以获取。许多研究试图通过产业数据辨识区域内的产业集群,研究者采取了几种不同的方法。由于产业集群具有丰富的内涵,完全依赖定量方法来判断和辨识产业集群是非常困难的,使用这些方法还必须辅之以研究人员的经验判断。

5.1区位商法(LQ)与标准化区位商法

区域i产业j的区位商计算如下:

其中E[,ij]区域i产业j的就业或产值,反映产业在某个区域的相对专业化程度。如果LQ> 1意味着某个产业在这个区域有一定的专业化水平,通常这些产业可能构成产业集群。采用区位商判断区域内产业集群要确定到底LQ应该多大才可以形成产业集群。实际上并没有明确的数值门槛,一些研究根据区位商超过1.25来判断产业集群,另一些研究根据区位商大于3[16~18]。区位商的另一个问题就是没有考虑区域内产业的绝对规模,也可能在某个区域内区位商很大,但产业规模很小。为了克服这个缺点,Fingleton[19]等引入了另外一个指数 (HC)来衡量超过预期规模的产业就业,产业预期规模是区位商等于1时的产业就业。同样地,HC也没有明确的门槛标准。考虑到产业集群应该包括大量中小企业,在区位商基础上辅之以企业数目的门槛也可以帮助判断产业集群。

O'Donoghue和Gleave[20]认为统计上显著的区位商是判断产业集群的标准。区位商是否显著可通过标准化区位商来判断,产业集群是在5%自信度内的区位商。首先,计算区域产业的区位商;其次,检验区位商是否正态分布,以5%为显著水平。区位商的分布可能正偏,取值可能会大于2但不会低于0。如果这种不对称非常严重的话,需要对区位商进行对数变换。最后,将区位商进行标准化,所有区位商换成Z值。

其中μ和δ分别是区位商的平均值和标准差。然后根据Z>1.96来判断产业的集聚情况,也就说如果一个产业在某个区域的区位商超过其平均值两个标准差,那么该产业在该区域可能形成产业集群。考虑到单边检验,实际上如果某个区域内某个产业的标准化区位商 Z>1.65即可看作是产业集聚。标准化区位商方法也存在局限性。首先是区位商的分布要求符合正态分布,但区位商是否正态分布取决于产业就业数据在空间和产业上的分类情况。其次,标准化区位商方法没有考虑不同区域内的企业规模分布的影响,因此不能区分产业集群是由于大量中小企业的集聚还是几个大企业导致的就业集中。为了克服这个问题,可用中小企业的就业区位商作为补充,

其中Sf表示中小企业,i表示产业;e和E分别表示区域和全国的就业。根据区位商的修正值可以判断一个产业集中是否是大量中小企业的集聚。第三,区位商法没有考虑产业间联系,因此并不能直接判断产业集群。但是区位商比较容易计算,仅需要产业—区域数据,容易获取。至于没有考虑产业间联系,可以通过将采用细分产业的数据来弥补,如可以计算采用四位数甚至五位数产业的区位商来判断一个地区的产业集群,因为四位数甚至五位数产业实际上是沿着产业链来划分的,如果在一个地区同条产业链上的不同四位数或五位数产业的区位商都比较大的话,应该可以判断产业集群的存在。

5.2联系方法(Spatial Association和Industrial Linkages)

产业集群是一组相互联系的产业在空间上的集聚,Streit[21]试图将产业联系与空间分布联系结合判断产业集群,理论上产业联系很强的产业应该分布在相同区域,也就是其空间分布应该显著相关。他首先统计所有产业在各个区域的就业,然后采用皮尔逊相关系数衡量每对产业的空间分布的相似性,计算如下:

如果两个产业的空间分布相关性很强,表示两个产业可能位于相同的地区。他根据投入产出表设计了如下方法衡量产业联系:

显然这种方法从理论上是完全符合产业集群的定义,但是采用这种方法来判断产业集群需要细分产业,但是细分产业的投入产出数据却不容易获得。

5.3多元统计方法(Multivariate Analysis)

Bergsman等[22,23]首先将因子分析和等级聚类等多元统计方法来辨识区域产业集群。 Bergsman等[22]计算了186个产业在203个美国大都市区分布的皮尔孙相关系数矩阵,然后采用因子分析方法(Factor Analysis)提取了58个因子,这些因子相当于产业集群。Bergsman[23]等计算了311个大都市区480个产业分布的序列相关系数,得到一个480×480的矩阵,然后采用层次聚类法将分布相似的产业聚成一类,总共辨识了40个产业集群。Bergsman等人研究方法中的一个问题就是没有考虑产业的实际联系,许多产业都倾向于集中在大城市,因此虽然两个产业分布显著相似,两产业可能不存在任何联系。通过聚类方法辨识的产业集群,每一个产业只能属于其中的一个产业集群,这不符合事实。

Roeple[24]等则根据44×44的投入产出流矩阵来判断加拿大安大略省的产业集群[24]。首先根据产业联系矩阵计算投入联系矩阵、销售联系矩阵以及产业间的双向联系矩阵,然后采用因子分析方法提取因子,在此基础上判断产业集群,总共辨识出13个产业集群。基于投入产出表,Czamanski提出不同的辨识产业集群方法[25]。首先计算下列4个系数:

矩阵A中每一列表示一个产业的中间投入行业结构,矩阵B中每一列代表一个产业的中间销售行业结构。相关分析可以用来衡量产业之间的中间投入和销售的联系强度。根据矩阵A和B,我们可以计算如下四个相关系数来全面衡量产业i和j的投入产出结构的相似性:衡量两产业中间投入行业结构的相似程度;测量两个产业的中间销售行业结构的相似程度;表示产业i中间投入的行业结构与产业j中间销售行业结构的相似程度;衡量产业i中间销售的行业结构与产业j的中间投入的行业结构的相似程度。对n个产业当中每一对产业计算四个相关系数,然后取绝对值最大者构成一个 n×n对称矩阵R,其中每一列表示一个产业与其他产业之间的联系强度。

然后采用因子分析对上述相关矩阵提取因子,这些因子是构造产业集群的基础。根据投入产出表,也可以构造产业相似矩阵,然后采用聚类方法将联系比较强的产业生成一个产业类。有很多方法可以构造这个相似矩阵。一种方法就是将技术系数矩阵A中的a[,ij]标准化,产业技术相似性可以通过计算标准化后矩阵的两列相关系数来衡量。另外一种方法就是采用原始的A矩阵中的a[,ij]系数,但是要引入增加值系数作为额外的变量,形成一个新的矩阵,并计算该矩阵中各列之间相关系数。第三种方法就是直接计算每对产业的联系强度,如

第四种方法是基于列昂节夫逆矩阵,Blin和Cohen[26]建议计算列昂节夫逆矩阵的每两列的相关系数来反映产业技术的相似性。由于列昂节夫逆矩阵反映直接和间接的联系,更能综合地反映产业间联系。

另外也可计算产业间距离,如根据技术系数,可以计算每对产业的欧氏距离,

通过因子分析方法可以将产业分布一致或产业联系很强的产业聚集在对应的因子上,这些因子可以作为判断区域产业集群的依据。贺灿飞[27]等根据这种方法研究了北京市的产业集群,得到了较好的结果。但是根据这种方法判断的产业集群没有空间维度,需要辅之以空间数据才能确定某个产业集群的区位。如果要研究大量产业,经常会在前面几个因子堆积大量产业,判断产业集群变得非常复杂,难以操作。

5.4图普分析(Graph Theoretic Approaches)

Campbell[28,29]根据区域投入产出表,根据一定的门槛值将产业间联系很强的产业辨识出来,然后通过绘制产业联系网络辨识区域产业集群。他们将1963年华盛顿州的投入产出表中的产业合并成19个部门,在矩阵中将价值流超过1/n总销售或总投入的格赋值为1,其他为0。这个产业联系矩阵可以通过图普来表示,并可根据产业联系矩阵计算产业的连接性,定义为联系矩阵中某个产业存在的联系数与可能存在的联系总数之比。然后需要产生一个距离矩阵,该矩阵在产业联系矩阵的基础上生成,对角线为0,其他数值表示在两个产业间建立联系的联系数,如果两个产业直接联系超过门槛,赋值为1,如果是间接联系,赋值超过1。根据距离矩阵,计算产业联系的中心性,定义为距离矩阵中产业的行的总和与整个矩阵左右数值总和的比值。相互联系很强的一组产业形成产业集群。这种方法对于大量产业的情况操作起来也比较难,而且在计算过程中大量信息被丢弃。

总之,由于产业集群的内涵非常丰富,难以完全依赖定量的方法来判断产业集群,尤其产业集群中存在大量的非物质联系,如企业与其他机构的联系等,是很难采用数量来表示的。目前还没有一个完美的定量方法能够准确地判断一个地区的产业集群,需要依赖数据可得性、产业复杂程度等选择相应的方法。但是采用定量方法可以在比较宏观的层次来判断一个区域或城市可能存在产业集群,可以作为进一步定性研究的依据。

6 对我国产业地理集聚研究的启示

我国自改革开放以来,产业地理发生了显著的变化,产业在80年代经历了短暂的空间分散之后许多产业快速向沿海地区集中[7]。产业的空间集聚与产业集群成为中国产业发展的突出特点,产业集群是中国产业国际竞争力的源泉,各地都出现了或政府主导或依托市场形成的产业集聚区。对于产业的空间特性的研究多数是案例研究,产业地理的系统性研究还远远不够。现有研究主要采用基尼系数等测量产业的地理集中程度,并没有区分产业的不同空间特征。要深化我国产业地理的研究,在进行大量案例研究的同时,需要加强定量分析,充分挖掘目前已经成熟的定量工具,科学地测量各种产业在不同空间尺度上的集聚程度。首先,要利用我国几次产业普查的企业数据来测量产业小类的省级空间尺度以下的空间集聚,系统性地揭示产业集聚的机制。其次,在城市内部的产业区位研究上引入基于离散空间的产业集聚系数,将城市空间结构与产业的空间集聚连接起来。再次,产业集群研究也需要引入定量分析,尤其是产业集群的辨识、产业集群的绩效评估、产业集群产业特征和区域特征的判定等更需要定量的科学分析。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

产业地理集聚、产业集聚与产业集群:测度与识别_地理论文
下载Doc文档

猜你喜欢