产业集聚效应测算的独立混合横截面数据模型,本文主要内容关键词为:横截面论文,效应论文,独立论文,数据模型论文,产业集聚论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]F062.9 [文献标识码]A [文章编号]1003-3637(2004)05-0232-05
自1990年代初以来,产业集聚成为当代西方经济学最引人注目的学说之一,理论界兴起了产业集聚研究的热潮(徐康宁,2003)。如何走出一条有中国特色的高效率的新型工业化道路,需要研究具体的产业发展形态。其中,产业集聚是需要引起足够关注和重视的问题(刘世锦,2003)。
产业集聚是指同一行业的企业以及该行业的相关企业和支持产业的企业在地域范围内的集中。由企业的空间集聚而产生的效益增加或成本降低称为产业集聚经济。产业集聚效应是用于衡量产业集聚经济大小的指标,它是产业集聚作用的表现,是指以专业化分工和协作为基础,与企业规模和产业集中相联系的,由内部和外部经济所产生的经济效果。因此,产业集聚效应的测算是产业集聚研究的重要内容。本文在概述产业集聚效应测算原理的基础上,指出传统产业集聚测算方法的不足,进而提出将横截面时间序列数据模型引进到对产业集聚效应测算中来,并以兰州市为例,作了具体应用。
一、产业集聚效应的测算
产业聚集经济就是一种通过规模经济的获得来提高劳动生产率和降低长期平均成本的系统力量。从根本上讲,规模经济反映的是要素投入与产出之间的关系。德瑞米斯(P.J.Dhrymes,1965)根据不变替代弹性生产函数(CES)推导出规模系数h:
式中,h是规模报酬参数,用来衡量集聚效应的大小,它可以通过CES形式的函数求解出,其中W为工资,Q为产量,L为劳动力,β是产出的工资弹性,γ是劳动力的收入弹性。德瑞米斯的规模效益是以不完全竞争的市场为条件的,因此有较大的适用性。
在德瑞米斯推导出的产业集聚效应(h)中隐含一个重要的微观经济学理论前提,即劳动者的收入或工资取决于劳动力的边际生产力。这一边际生产力假定并不完全符合我国的实际情况。在我国很长时期中,工资并不反映劳动力的边际报酬,不存在产出的工资弹性。为此,我国学者唐杰(1989)在实际测算中,将CES生产函数改写成下述方程:
其中P是行业的实际利润(或利税),Q为行业的工业总产值,K是行业的固定资产净值。对上述方程两边取对数,得到如下函数:
Lnp=LnA+βLnQ+γLnK (3)
由该方程推算出:
式中,β是产出的利润弹性,即每增加单位产出所实现的利润。γ是固定资产占用的利润弹性。当h≥1时,表明具有集聚效应,h值越高,所带来的产业集聚效应越大。当h<1时,表明整体经济或行业没有集聚效应。
二、传统产业集聚效应测算方法的局限
在实际的计量分析中,要描述产业聚集效应变化,传统上有两种方法:一是可以采取横截面数据,即以某年度内,该部门所有企业或代表性企业的利润、产值、固定资产净值数据对式(3)进行回归,从而得出每一年的h值。由于缺乏翔实的部门内代表企业的统计资料,一般不用企业截面样本资料作为分析的基础;二是运用移动平均数法对式(3)进行时间序列的线性回归。它是对动态数列进行加工的一种方法,即将地区或行业原有动态数列中的每一项都用该项和其前后相邻各项的算术平均数来代替。然后运用移动平均形成的新的时间序列,分段进行线性回归。唐杰(1989)正是采用这种移动平均数法,测算了天津市10个工业部门的聚集效应。后来,汪炜等人(2001)利用唐杰的模型对杭州市产业集聚经济效应进行了分析,黄燕(2002)对厦门、汕头的产业集聚进行了测算。
传统的产业集聚效应测算方法有很多局限。首先,最大问题是受横截面数据的限制,而不得不采用如唐杰所使用的那种移动平均分段回归的方法,然而在中国改革开放的特殊环境下,从1990年代中后期开始,大量工业企业在全球性结构调整中多年连续亏损、破产,不少行业甚至整个市区,连续数年出现工业全行业或市区工业亏损,这种严酷的事实,使得唐杰的算法在产业集聚效应分析中遇到了前所未有的难题,因而在客观上使这种方法的应用受到了限制。其次,即使使用横截面数据逐年单独建立回归方程的测算方法,所建立的“模型无法考虑到该行业中的技术进步为企业带来的随时间而增加的盈利能力”(Robert S.Pindyck,1998)。为了克服传统的产业集聚效应实际测算方法的缺陷,我们将横截面时间序列数据模型引进到对产业集聚效应的测算中来。
三、横截面时间序列数据模型
横截面时间序列数据是包含若干个体(家庭、公司、城市等)在一个时间区间内的样本(Robert S.Pindyck,1993)。它兼有横截面和时间序列两个方面的数据,常能给重要政策问题研究带来曙光(Jeffrey M.Wooldridge,2000)。利用横截面时间序列数据可以分析不能够用时间序列或横截面条件单独研究的问题(William H.Greene,1993),能够使研究人员将规模经济的作用与技术进步的影响分离开来(Robert S.Pindyck,1993)。贺铿(2003)将这种模型的优点概括为:第一,可以解决样本容量不足的问题;第二,可以估算某些难以度量的因素对被解释变量的影响;第三,有助于正确理解经济变量之间的关系。
按照数据资料的特点,可将横截面时间序列数据及研究方法大体分为两大类,一类是独立混合截面数据(independently pooled cross section),它是在不同时点从一个大总体里由独立抽取的观测值构成的;另一类是综列数据或叫板面数据(panel data),有时也称作纵横数据(longitudinal data),它和前者的最大区别是,要在不同时间跟踪相同的一些个人、家庭、厂家、城市、地区或别的单元。
用独立混合截面数据估计的模型一般形式为:
式中,i表示横截面单位数,i=1,2,…,n;t表示在T时期中的每一期观测,t=1,2,…,,y为因变量,X为不同的自变量,ε为误差项。由于总体在不同时期会有不同的分布,在上述模型中允许截距在不同年份有不同的值。此时可以通过引进虚拟变量的方法达到这一目的,式中D表示时间的虚拟变量,k为虚拟变量的个数,k=1,2,...,t-1,即其数目应该不多于(T-1)个。为常数项,β′是自变量的系数。
板块数据模型中常见的为固定效应模型和随机效应模型,它们可以表示为:
式中,变量概括了影响着的全部观测不到的、在时间上恒定的因素,通常把它称作个体效应,当它与每一个解释变量相关时,在应用中也把此类模型叫做固定效应模型(fixed effects model)。常被称作特异性误差或时变误差,它代表着因时而变化且影响着的那些非观测因素。当个体效应与每一个解释变量都不相关时,则上述模型变为随机效应模型(random effects model).
一般可用最小二乘法(OSL)来估计独立混合截面数据模型。对于板块数据模型中的固定效应模型和随机效应模型而言,估计自变量系数的方法比较复杂,例如固定效应模型可使用差分法、固定效应变换、虚拟变量回归等方法,而随机效应模型估计法首先要通过消除平均后的数据变换,然后再采用广义最小二乘法。尤其是要对由成千上万个横截面数据组成的纵深数据模型进行估计,可能超过一般计算机的存贮容量,必须采用分块回归的方法,国外已有许多计量经济软件都提供了求解此类模型的方法。
四、独立混合横截面数据模型在兰州市产业集聚效应测算中的应用
1.方法和资料
应用横截面时间序列数据模型,首先必须恰当判断数据的持点,只有这样才能选择适当的建模方法,所估计的系数也才能符合计量经济学要求。鉴于兰州市1998~2000年全市全部工业行业的利润总额连续三年出现整体亏损的状况,因此,采用唐杰提出的测算产业集聚效应的方法不能认为是最好的方法。使用行业横截面数据时,发现每年利润总额出现亏损的行业并不完全相同,而且各个行业之间也并非相关,如化学工业的亏损并不一定会与食品工业、有色金属冶炼业的状况有关。可见,这种样本更加符合独立混合截面数据的特点。因此,在兰州市产业集聚效应的测算过程中使用了独立混合截面数据模型,其截面是当年利润总额为正值的各工业行业数据,时间序列是1985~2002年。模型以全市国有企业和规模以上非国有企业工业各个行业的利润总额为因变量,以各行业工业总产值、年末固定资产净值为自变量,并用兰州市零售商品物价指数对上述数据剔除了价格因素。同时设定了1986至2002年的17个时间虚拟变量。在产业集聚效应h值的因素分解计算中,还使用了全市每年全部企业数、全市国内生产总值、全市国有企业和规模以上非国有企业的工业增加值,同期全国国内生产总值以及全国国有企业和规模以上非国有企业的工业增加值等。所有引用数据都来自1985~2002年历年《中国统计年鉴》和《兰州年鉴》。本文运用Eviews软件建立所有回归方程并进行统计检验。
2.横截面时间序列数据模型的估计
设LLR代表用对数表示的各行业年实际利润总额(万元),LZC为用对数表示的各行业年工业总产值(万元),LGZJ是用对数表示的各行业年末固定资产净值(万元)。建立横截面和时间序列数据模型:
上式中,分别表示1986、1987、…、2002年资产的利润弹性的增长率,若要计算某年的资产利润弹性值,和前述计算产出利润弹性的方法是一样的。由此可见,在估计出上述横截面时间序列数据模型的系数之后,还需要进一步求得历年的产出利润弹性和固定资产的利润弹性值,才能进行产业集聚效应h值的计算。
从首次模型估计结果的统计检验来看,虽然整体方程的拟合度、D.W检验和F检验都比较理想,但是各年总产值、固定资产净值的系数中有许多未通过t检验,即其年弹性增长率是不显著的。因此,需要采取逐步回归的方法剔除那些系数不显著的总产值和固定资产净值年度的成对变量。由于独立混合截面数据可能会既存在异方差性,同时又存在序列相关,因此在模型的估计过程中还需要对该模型进行必要的异方差性和序列相关性统计检验。
可以用帕克(Park)检验来诊断模型是否存在异方差。用resid表示上述横截面时间序列数据模型的残差,利用原始方程中的行业工业总产值的对数值(Ln(lzc)),构建方程进行帕克检验,删除不显著的常数C后其结果如表1所示。由于解释变量系数值为零的概率几乎为零,因而拒绝原假设,也就是说,首次建立的横截面时间序列数据模型存在严重的异方差性。
表1 兰州市横截面时间序列数据模型异方差的帕克检验
因变量:Ln(resid 2)
方法:最小二乘法
样本:1-556
计算的观测值:391
未使用的观测值:165
变量系数
标准误差
t统计量
概率
Ln(LZC) -0.797319
0.051653
-15.43599
0.0000
0.009877
因变量均值
-1.762471
校正的
0.009877
因变量标准差
2.287736
回归的标准误差 2.276410
AIC
4.485631
残差平方和
2020.997 SIC
4.495781
对数似然
-875.9408 DW统计量
1.978767
首次估计的横截面时间序列数据模型D.W=1.967,可以认为模型不存在序列相关。
为了消除上述模型中存在的异方差性,将模型的误差绝对值的倒数即1/abs(resid)作为权数,进行加权最小二乘法(WOLS)估计。经过上述处理后,最终得到比较理想的横截面时间序列数据摸型如下(表2):
表2 兰州市独立混合截面数据回归模型计算结果
因变量:LLR
方法:最小二乘法
样本:1-556
计算的观测值:391
未使用的观测值:165
加权序列:1/ABS(RESID)
变量
系数
标准误差
t统计量
概率
N86
-0.132902 0.008082 -16.44377
0.0000
N87
-1.002024 0.086715 -11.55532
0.0000
N88
-0.519301 0.112867 -4.601010
0.0000
M89
0.185339 0.237268 0.781135
0.4353
N90
1.407066 0.312601 4.501154 0.0000
N91
-1.265313 0.088141 -14.35551
0.0000
N92 -1.017165 0.017144 -59.32904
0.0000
N93
-0.146799 0.069277 -2.119023 0.0348
N94 -1.318001 0.021199 -62.17258
0.0000
N95
-1.238630 0.033727 -36.72530
0.0000
N96
-0.746530 0.292469 -2.552513
0.0111
N97
0.208958 0.465838 0.448565
0.6540
N98
-0.751316 0.332690 -2.258308
0.0246
N99
3.071748 0.053041 57.91314 0.0000
N20
-1.003016 0.131166 -7.646907
0.0000
N21
-0.806065 0.915605 -0.880363
0.3793
N22 -2.777147 1.440531 -1.927863
0.0547
LZC
0.493283 0.011179 44.12625
0.0000
LGZJ 0.534378 0.008778 60.87935
0.0000
LZC87
0.147690 0.019822 7.450706
0.0000
LZC88 0.329583 0.025510 12.91980
0.0000
LZC89
-0.350150 0.059228 -5.911934
0.0000
LZC90
-0.588259 0.037444 -15.71042
0.0000
LZC91
0.249673 0.031169 8.010160
0.0000
LZC93
-0.409433 0.037569 -10.89817
0.0000
LZC96 0.236044 0.102668 2.299094
0.0221
LZC97 0.199652 0.051572 3.871317
0.0001
LZC98
0.387523 0.121450 3.190792
0.0015
LZC99
0.117976 0.011582 10.18611
0.0000
LZC20
0.578302 0.044942 12.86787
0.0000
LZC21
0.514705 0.267167 1.926531
0.0549
LZC22
1.150938 0.337640 3.408776
0.0007
LGZ87
-0.068376 0.013316 -5.134855
0.0000
LGZ88
-0.323840 0.017241 -18.78360
0.0000
LGZ89
0.315391 0.050388
6.259297 0.0000
LGZ90
0.379181 0.018187 20.84927
0.0000
LGZ9l
-0.247336 0.031457 -7.862625 0.0000
LCZ93
0.310024 0.033478
9.260590 0.0000
LGZ96
-0.323279 0.091670 -3.526558 0.0005
LGZ97
-0.434156 0.034927 -12.43055
0.0000
LGZ98
-0.513758 0.153768 -3.341122 0.0009
LGZ99
-0.626718 0.010189 -61.50752
0.0000
LGZ20
-0.592800 0.032964 -17.98326
0.0000C
LGZ21
-0.600437 0.198649 -3.022597
0.0027
LGZ22
-1.082736 0.243096 -4.453947
0.0000
C
-2.189514 0.043957 -49.81082
0.0000
加权统计值
1.000000因变量均值
8.970260
校正的 1.000000因变量标准差 174.1811
回归的标准误差 0.000328AIC
-13.09634
残差平方和 3.71E-05SIC
-12.62943
对数似然
2606.334F统计量
22058549
DW统计量
2.114904概率(F统计量) 0.000000
非加权的统计值
0.718697因变量均值
6.193146
校正的
0.682005因变量标准差
1.771052
回归的标准误差 0.998714残差平方和 344.1133
DW统计量
1.902214
可以看出,上述回归模型统计检验结果比较理想。它表明,由方程中有关年度产出利润弹性增长率和固定资产利润弹性增长率分别计算的年度产值利润弹性和固定资产利润弹性值的变化是显著的。而且它反映出了简单的横截面模型所不能反映的问题——技术进步带来的随时间而增加的盈利能力。在上表中,常数c代表1985年技术进步形成的盈利能力,N86到N22反映了盈利能力的增减程度,可以看出,多年来兰州市工业行业技术进步引致的盈利能力大体呈现降低的趋势。
3.弹性值及产业集聚效应h值计算
由表2计算的产出利润弹性和固定资产的利润弹性及h值如表2所示。1988年的h值为异常值,应该舍弃。从计算结果看出,1980年代中期以来,兰州市一直具有产业集聚效应,而且年际间的变化是比较显著的。从1985年以来,产业集聚效应变化的特点是,第一,产业集聚效应总体呈现出降低的趋势;第二,1980年代中后期产业集聚效应比较高,平均值高达3.65(不包括1988年的异常值)。90年代虽有所降低,但仍有较强的集聚效果;第三、进入二十一世纪以后虽然仍具有一定的产业集聚能力,但明显比1980年代和1990年代有所降低,而且仍呈现出继续下滑的趋势(图1)。去除1988年的特异值之后,以时间t为解释变量,建立一元函数,可以看出,h值平均每年下降0.22个单位。
表3 产出的利润弹性(β)和固定资产的利润弹性(γ)及h值计算结果
年份 β
γh
1985
0.4933
0.5344
3.0281
1987
0.6410
0.4660
4.0833
1988
0.9706
0.1422 38.7910
1989
0.6204
0.4576
3.8398
1990
0.0321
0.8367
1.8977
1991
0.2818
0.5894
2.2131
1993 -0.1276
0.8994
1.6845
1996
0.1084
0.5761
1.7678
1997
0.3081
0.1420
1.6505
1998
0.6956
-0.3718
2.0639
1999
0.8136
-0.9985
0.0081
2000
1.3919
-1.5913
1.5088
2001
1.9066
-2.1917
1.3145
2002
3.0575
-3.2745
1.1054
h=3.5783-0.2237T (8)
(8.6086) (-4.2707)
=0.6238,S.E.=0.7065,DW=2.1519,F=18.2392,P=0.0013
图1 兰州市产业集聚变化趋势
4.兰州市产业集聚效应因素分解
集聚效应作为一个累积的总体概念,它是一系列集聚经济因素的综合反映,可以进一步分解为内部集聚经济、布局集聚经济和城市集聚经济(唐杰,1989)。内部集聚经济(ISE)是指某一工业部门内部企业规模扩大所引起的企业和整个部门长期平均成本的下降。在实际测算中,以兰州市某一行业的平均固定资产净值来表示,即:ISE=某年某-工业行业固定资产净值/该部门企业数。
布局(区位)集聚经济(LOC)是指受当地自然因素(矿产资源、水力资源、气候等)、经济因素(生产的发展水平、生产技术、生产能力、生产型基础设施等)、社会因素(人口的数量和密度、非生产业设施、消费市场的容量和性质等)的综合影响,某一工业部门在一特定地区布局有可能比在其他地区布局获得更大的集聚效果。在实际测算中用区位熵表示,在此为兰州市工业增加值占本地区GDP的比重与全国工业增加值占全国GDP比重的比值。
城市集聚经济(UBE)是用来估计某一行业的企业之间能否充分利用同类工业企业布局所形成的专业化分工协作的集聚效果。在计量分析中,将这一概念内涵缩小,仅研究工业在兰州市集中布局所带来的长期平均成本下降的收益,一般用一定时期工业行业中企业数的变化作为计算指标。为消除城市集聚经济效果指标与内部聚集经济效果之间可能存在的共线性,在计算过程中进行指数化处理,即以第一期1985年工业行业企业总数为100,以后各期均表示为第一期的指数。
对兰州市工业行业的集聚效应(h)进行因素分解,实际上是首先求解下列函数式:
h=f(ISE,LOC,UBE)
然后再对估计参数进行经济学解释。
利用1985-2002年《中国统计年鉴》《兰州年鉴》有关资料,计算出产业集聚三个分解因素的数值(表略),然后建立h值(去掉1988、1999两年的异常值)对上述三个因素的回归方程,由于内部规模经济因素变量(ISE)的系数没有通过t检验,因此将该变量删除,得到如下回归结果:
Ln(h)=1.3769×Ln(LOC)+0.1234×Ln(UBE) (9)
(3.2076)
(5.4016)
=0.5871,S.E=0.2733,D.W=1.6719,F=6.7966,P=0.01589
上述产业集聚效应因素分解的回归方程式估计结果是否理想,可以用残差项和系数值的稳定性的各种检验来判断。Q检验表明残差没有高阶自相关。LM检验表明残差没有两阶或一阶自相关。ARCH检验表明不存在条件异方差。WHITE检验表明不存在异方差。RESET检验表明模型设置基本正确。模型系数是否稳定,可利用RLS进行检验。模型系数稳定性检验结果表明,图形显示各系数非常稳定。CUSUM和CUSUM of Squares也落在5%显著水平的上下两条临界线内。N步预测检验没有发现断点,这些都表明模型结果比较理想。
由(9)式可以看出,第一,兰州市工业行业的集聚效应和内部聚集经济的关系不显著,也就是说,兰州市似乎还没有获取工业部门内部规模扩大所带来的收益;第二,区位或布局经济因素对兰州市产业集聚的影响较大。区位熵每增加一个百分点,则产业集聚效应增长1.3769个百分点。兰州1985~2002年的区位熵均大于1,说明兰州市工业具有一定的地区比较优势;第三,城市集聚经济因素对兰州产业集聚的影响较小。主要原因是兰州市工业行业之间以及工业行业内部企业之间的专业化分工与相互协作的能力较弱,工业企业融合度低,产业关联度不高。长期以来,以能源原材料生产为主的大中型企业对地方经济的辐射力和扩散效应较弱,区域内资源未能实现优化配置,出现了城市集聚经济因素的作用尚未能充分发挥出来的现象。
上述研究结果表明,兰州市工业行业在整体上具有一定的集聚效应,但这种集聚效应基本呈现出一种逐渐减弱的走势。兰州市形成的产业集聚效应主要是由传统的区位因素产生的。从“一五”到“三线建设”时期,在计划经济体制下,由于地处内陆、能源充裕、交通便利等原因,国家在兰州市建立了兰炼、兰化、兰石等石油化工、机械和电子行业,从而奠定了兰州市工业区位优势,尤其是得力于长期以来的政府规划、交通便利以及在相当时期中能源充裕等因素。兰州市工业产业集聚效应不断下滑的原因,一是行业内部规模经济不显著;二是行业内部企业之间的专业化分工与相互协作的能力较弱,产业关联度不高;三是多年来兰州市工业行业技术进步引致的盈利能力大体呈现出下降的趋势。兰州市产业集聚效应的主要特征和基本走势,在区域经济发展中应该引起高度重视。
标签:横截面论文; 时间序列论文; 集聚效应论文; 横截面数据论文; 产业集聚论文; 企业经济论文; 经济模型论文; 经济利润论文; 计量经济学论文; 经济学论文; 因变量论文; 唐杰论文;