基于动态空间面板模型的中国区域创新集聚研究,本文主要内容关键词为:中国论文,面板论文,模型论文,区域论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
改革开放以来,随着国家创新投入力度不断加大,创新活动所产生的巨大效益也日益受到学界的广泛关注。然而,由于区位因素、人文社会环境、经济发展水平、政策影响以及自身条件的差异,不同地域间的创新活动亦存在较大差别,特别是由于地理邻近(geographic proximity)或者非地理邻近(non geographic proximity)(Gertler,2003)的关系,还会产生区域间创新的集聚效应。以长江三角洲地区(包括江苏省、浙江省与上海市)为例,该地区是我国经济活动最为活跃的地区之一,也是我国创新发展的主要阵地之一。数据显示,2010年该地区专利授权量为301240项,占我国专利授权总量的40.7%,技术市场合同成交额146.48亿元,占全国总量的22.5%,这充分显示出创新活动的空间集聚效应——创新活动向特定的空间集聚,创新活动具有空间依赖性。
为克服经典计量经济学不考虑事物的空间联系,进而导致其所得出的各种结果不够完整、准确及缺乏应有的解释力等缺陷,Paelinck(1979)提出了空间计量经济学的概念,并经过Anselin(1997)等学者的不断完善,逐步形成了较为成熟的空间计量经济学框架体系。在有关R&D知识生产和溢出等研究领域,空间计量经济分析技术亦得到广泛应用。吴玉鸣(2006)、吴玉鸣和何建坤(2008)等从大学和企业研发的角度,对区域创新的空间依赖及其影响因素进行了分析;苏方林(2007)运用地理加权回归方法,对1993-2002年期间中国省域R&D知识溢出的空间非稳定性进行了实证分析;符淼(2008)用省级面板数据构造空间计量模型,分析了人口流动和知识传播等因素对区域创新活动的影响;黄苹(2008)应用MRW(1992)的模型,引入空间权重,分析了地区R&D溢出与本地区经济增长和邻区经济间的相互作用;符淼(2009)则深入分析了地理距离对技术和经济集聚的影响。
从国内外研究来看,相关领域研究主要存在以下两方面不足。首先,在对创新产出的衡量方面,已有成果大多采用专利指标衡量创新产出(符淼,2008)。事实上,创新活动作为生产过程,其产出包括中间产出(知识创新)和最终产出(经济收益)两部分(Acs et al.,2002),而现有研究对创新产出经济效益的衡量并不多见。另外,中间产出和最终产出是否在空间区位上重合,或者说不同区域知识创新成果转化为经济效益的能力存在怎样的差异也是值得关注的问题。其次,关于空间计量模型。已有成果主要集中于截面数据或是静态面板数据模型的研究,这两种方法均存在一定的局限性。第一,采用截面数据模型,仅用样本考察期内某一年的数据进行估计,一方面忽视了创新产出与投入间存在的时间滞后效应,另一方面由于数据信息没有被充分利用,增加了结果的偶然性和随机性;采用考察期内不同时间段的数据均值进行回归(吴玉鸣,2006;吴玉鸣和何建坤,2008),虽然考虑到创新产出与投入间的时滞效应,也在一定程度上平滑了可能出现的短期波动影响,减少了测量误差,但仍会造成大量数据信息流失,影响估计结果的准确性。第二,采用静态空间面板数据建立模型(符淼,2008;黄苹,2008;黄莹等,2009),扩大了观察值数量,达到渐近性质对大样本的要求,这样充分利用了数据信息,提高了模型的准确性,但仍可能忽略创新投入之外的诸多因素(如人文、制度、开放条件等)的影响。事实上,这些潜在因素对创新产出的影响是至关重要的,但在静态空间面板模型中并不能量化体现出来,这无疑会使模型的准确性受到影响。通过建立含有滞后产出变量的动态空间面板计量经济模型即可有效解决此类问题。
面板数据空间计量分析由Anselin(1997)首次提出,后由Baltagi & Li Dong(2000)将其分析方法具体化。Elhorst(2005)借鉴非空间动态面板数据模型的估计思想,提出用无条件极大似然方法估计空间动态面板自回归模型。本文根据Elhorst(2005)的研究,通过构建区域创新的动态空间面板计量模型,分析中国区域创新的空间集聚现象。设置动态空间面板数据模型的意义在于:一方面通过引入空间因素以反映区域创新活动的空间相关性和空间效应;另一方面将滞后期的被解释变量作为自变量引入模型,以检验未列入计量模型的潜在因素对创新活动的影响。
本文将以中国内地30个省区为研究对象(西藏由于缺乏相关数据,分析中将其略去),将动态空间面板数据模型引入中国创新集聚现象的分析中,并考虑创新过程的完整性,分别从创新活动的中间产出(以专利为代表)和最终产出(以技术市场成交合同金额为代表)①两个方面进行较为全面的考证,分析其成因,为相关部门制定政策提供参考和依据。
后续部分结构安排如下:第二部分,区域创新发展的差异性检验;第三部分,建立动态空间面板数据模型;第四部分,变量与数据说明;第五部分,实证结果的分析与讨论;最后为结论。
二、区域创新发展的差异性检验
本文采用Theil熵指数来度量区域创新发展的绝对不平衡程度。Theil将信息论中熵的概念引入经济学,用其度量收入的不平等,较好地反映出收入地区分布的不均衡性,其值越大说明观测值分布越不均衡。Theil熵的计算公式为:
文中借用Theil熵来度量区域创新发展的地区间不均衡程度,包括了专利的地区不均衡性和创新产品经济效益的地区间不均衡性。
从表1的结果来看,2000到2010年11年间中国区域创新Theil熵除少数年份波动外总体呈逐年增大趋势,表明我国区域创新的空间不平衡程度逐渐加剧,领先和落后省区间创新水平差距逐渐增加。另外,合同金额Theil熵总体大于专利Theil熵,且这种差距逐年扩大,在一定程度上揭示了随着地区经济发展,对较落后省份而言,先进省份在科技成果转化上更具有优势,这样进一步扩大了地区间创新发展的差距。
三、动态空间面板数据模型及其估计
借鉴Griliches(1979)、Jaffe(1989)的研究,本文采用其提出的知识生产函数,将创新投入和产出联系起来,分析各种相关因素对创新产出的影响。知识生产函数的基本形式可以表示为:
Y=f(X) (2)
式(2)中,Y为创新产出,X为创新研究与开发资源投入。其中创新产出主要包括创新知识产出和创新产品产出,创新投入主要包括研究与开发资本投入和人力资源投入。
由Theil熵指数可以看出中国区域创新活动存在空间差异性,因此必须考虑空间效应对创新产出的影响。另外,就创新生产活动来讲,产出变量除了受研发经费投入、人员投入等投入变量影响之外,还受到诸如人文环境、制度因素、对外开放条件等多种潜在因素的影响,而这些潜在因素的影响能够通过滞后的创新产出反映出来。
(一)模型的建立
鉴于区域创新活动的滞后效应,我们将创新产出的一阶滞后变量作为自变量引入模型,同时考虑其空间效应,最终建立一阶滞后区域创新集聚动态空间面板数据模型:
(二)模型的估计
空间动态面板数据模型由Hepple(1978)首次提出,并指出带有连续滞后因变量的经验模型,用普通最小二乘估计(OLS)结果将不再具有一致性,此时应该用极大似然法进行估计,但并未给出模型的估计结果。之后,有学者分别用非空间的动态面板数据模型(Buettner,1999;彭建平和张建华,2007)和静态空间面板计量模型(Elhorst,2003;何江和张馨之,2006;黄苹,2008;符淼,2008、2009)对区域创新进行研究,但都没有采用动态空间面板数据模型。
面板数据的空间计量分析最初由Anselin提出其基本思路,而后Baltagi & Li Dong将分析方法具体化。2000年后,学者们开始深入研究对空间动态面板模型的估计技术。对空间动态面板的估计,大致分为两类:一类是在进行估计之前将空间相关性剔除,然后使用传统的面板估计技术。剔除数据空间相关性的主要方法有Griffith法(Griffith,2000)和Getis法(Getis & Griffith,2002)。另一类是对传统的极大似然估计方法的改进。Elhorst(2005)借鉴非空间动态面板数据模型的估计思想,提出用无条件极大似然方法估计空间动态面板自回归模型。首先,用一阶差分法消除面板数据的固定效应,然后用每个空间单元一阶差分值的密度函数的乘积,建立一阶差分模型的无条件极大似然函数。第一类通过剔除空间相关性的方法,其结果虽然排除了空间相关性的影响,但空间因素究竟对模型产生多大影响并没有有效说明。鉴于此,本文借鉴Elhorst(2005)的研究,采用无条件极大似然的方法,分别运用BS逼近(Bhargava & Sargan,1983)和NB逼近(Nerlove & Balestra,1996;Nerlove,1999、2000)对模型进行估计②。
四、变量与数据
空间计量模型的建立需要适当选取投入与产出变量。相关文献中通常采用R&D经费和R&D人员数量作为创新生产活动的两项投入变量(刘顺忠和官建成,2002;池仁勇等,2004;虞晓芬等,2005)。R&D经费支出是一项流量指标,反映了当期的创新投入水平。然而,创新活动对知识生产的影响不仅反映在当期,对以后若干期也具有重要影响(吴延兵,2006),因此,需要核算R&D资本存量。本文借鉴(吴延兵,2006、2008)的研究,采用永续盘存法来核算R&D资本存量,其计算公式为:
对于基期资本存量,假设R&D资本存量的增长率等于R&D经费的增长率,则基期资本存量的估算公式为:
对于另一项投入指标R&D人员,本文选用R&D人员全时当量来衡量。
产出变量方面,本文从创新的过程出发,用发明专利来表征创新的中间知识产出,该指标也反映了地区的原始创新能力和科技综合实力(刘凤朝,2006;Cohen,1990);用技术市场成交合同金额来表征创新的最终产出,该指标亦反映了地区科技与经济相结合,技术成果转化为市场价值的水平。
本文分析数据纵向覆盖11年(2000-2010),横向覆盖中国内地30个省区(西藏由于缺乏技术市场成交合同金额方面的数据,分析中将其略去)。原始数据来源于各年《中国科技统计年鉴》和《中国统计年鉴》。
根据Acs(2002)等的研究和我们之前的分析,为测度中间产出(知识创新)和最终产出(经济效益),分别用发明专利和技术市场成交合同金额两个不同的变量建立计量模型为:
五、实证结果
为了比较,本文首先对非空间静态面板数据模型进行极大似然(ML)估计,接着,考虑创新活动的空间效应,建立静态空间面板数据模型,最后,考虑因变量自身的时滞效应,建立动态空间面板数据模型。
(一)非空间静态面板模型估计结果
表2为非空间静态面板数据模型估计结果,经豪斯曼检验,选用固定效应模型。
表2中的非空间面板模型估计结果显示,模型1(调整R2=0.939,F=118.751,DW=1.123)、模型2(调整后R2=0.913,F=55.540,DW=1.072)存在自相关性问题。这种自相关性是否是由空间因素造成的呢?从前文中Theil熵和Moran指数的计算可以看出,省域创新产出均受到邻近省份的影响,区域创新活动存在空间自相关性。在空间均质假定下非空间静态面板模型的估计中,由于忽略了空间相关性因素的影响,模型存在一定问题。因此,需对模型的空间相关性进行检验。
(二)空间相关性检验与模型的选择
为了进一步验证区域创新空间相关性,以及选择适当的空间计量经济模型,首先分别对模型进行空间相关性检验,包括Moran指数、拉格朗日乘数形式LMERR、LMLAG及其稳健形式检验等。在验证空间相关性的基础上,对模型进行修正,建立空间面板数据模型,以消除空间相关性的影响。经Moran指数(误差)检验,模型存在空间相关性。
表3结果显示,拉格朗日乘数误差和滞后及其稳健性检验表明,模型1中LMLAG、LMERR、R-LMERR均通过了10%水平的显著性检验,R-LMLAG未能通过显著性检验;模型2中LMERR、R-LMERR、R-LMLAG通过了10%水平的显著性检验,而R-LMLAG未能通过10%水平的显著性检验。
根据Anselin et al.,(2004)提出的判别准则④,模型1、2均应选择空间误差模型(SEM)进行修正。
(三)空间静态计量经济模型估计结果
为了避免模型系数估计值的有偏或者无效,空间误差面板数据模型需通过工具变量法、极大似然法或广义最小二乘估计等方法来进行估计。借鉴Anselin(1988)的研究,采用极大似然法估计空间误差模型(SEM)的参数。
表4显示了静态空间误差面板数据模型的估计结果,根据豪斯曼检验,选择固定效应模型。(软件采用Matlab6p5软件以及Spatial Econometric模块)。
从表4中可以发现:
第一,区域专利与研发资本投入和研发人员投入之间存在显著的空间相关关系(四种空间误差参数的估计值统计检验均显著),这反映出邻近省级区域之间的创新专利产出与创新投入之间具有明显的相似性和集聚效应。而区域技术市场合同金额与创新投入之间存在负的空间相关性,但并不显著(空间相关系数分别为0.147和0.313)。
第二,在专利模型的四种回归结果存在明显差别。无固定效应影响的估计中,假定地区之间的创新发展水平是相同的,这显然与事实不符。事实上,中国区域创新活动存在结构性差异,东部省份的创新水平普遍高于中西部省份,所以这种忽略了创新活动结构性差异影响的估计,势必导致结果的偏差;截面固定效应影响的估计中,考虑了地区的结构性差异影响,但忽略了时期的影响,同样会造成结果的偏差⑤;同理,仅考虑时间固定效应的模型也是如此。而同时考虑时间固定和地区固定影响的估计,既考虑了创新活动地区的差异性影响,同时又考虑了时期的影响,避免了由时间和空间差异产生的结果偏差,其结果较为可靠。另外,从R2ADJ、、Log-likelihood来看,既存在空间固定效应影响又存在时间效应影响的估计相对于其他三种影响的估计均有所改善⑥,这也可以进一步印证中国区域创新活动同时存在地区之间的固定效应影响和时间固定效应影响。
第三,区域专利与研发资本和人员投入之间存在显著的正向空间相关性,一个省的专利产出受邻近省份研发投入的影响,这可能是由于邻近地区间技术水平、管理能力以及政府行为等因素的相互扩散与渗透造成的。研发资本、人员与专利存在显著的正相关关系,这与Pake & Griliches(1984)、Hall et al.,(1986)、Mansfield(1988)、Goto & Suzuki(1989)等人的研究基本一致,表明研发投入越多,专利产出也就越多。就创新投入的贡献来说,研发资本对于专利产出的贡献大于研发人员的贡献(系数分别为5.564和0.243),在一定程度上说明中国区域创新生产过程基本呈现为资本投入拉动的创新发展模式,研发资本在创新生产过程中发挥着更大的作用。另外,研发资本的产出弹性大于1,说明研发资本的增加将带来专利产出的更大增长,李习保(2007)的研究也有类似的发现。近年来伴随着我国研发资本投入的不断加大,极大地改善了研发创新环境,提高了研发人员的创新积极性,有力地促进了创新产出的更快增长。本文的研究结果与近年来我国发明专利授权量的增长速度明显高于研发资本投资的增长速度的事实是相一致的,这同时也启示进一步提高研发资本投资对提升我国创新能力具有重要意义。
第四,同时考虑地区的结构性差异影响和时期影响之后,模型所有变量均通过了1%显著性水平检验,研发资本与人员投入对于区域技术市场合同金额均有正向影响(系数分别为8.431和0.552),说明目前区域创新经济产出同专利类似,亦是更多地依赖于研发资本的大量投入。技术市场合同成交金额反映了研发成果在技术市场上的表现,由于研发人员主要从事研发活动,一般情况下并不直接从事技术成果的交易,而这一活动通常由市场人员来做,所以,研发人员对技术成交金额的贡献较小也是情理之中的。
由于专利模型中表明区域专利与创新投入之间存在显著的正向空间相关关系,我们通过对30个省级区域的地区固定影响值来考察各区域专利产出与投入之间的空间影响。
从各地区固定影响值来看,各省级区域间的固定影响值具有很大差异。地区经济发展水平越高,创新的投入产出效率也越高,如北京、上海、广东等地区,而经济发展水平相对落后的地区,其创新投入产出效率也相对较低,如东部经济发展水平高的省份和地区明显高于西部经济相对落后的地区,如青海、宁夏、内蒙古等地区。从东中西部平均水平来看,依旧呈现出东部沿海等经济发达地区为最高,中部次之,西部地区最低的势态。
(四)动态空间面板模型估计结果
区域专利和合同金额的静态面板空间误差模型仅考虑了区域创新活动的空间滞后效应,而区域创新作为连续的系统性活动,其产出不仅与当年的创新投入相关,还会受到创新投入之外的其他一些因素(诸如文化环境、制度因素等)的影响,而这些因素往往又不能有效量化,因此,还应充分考虑创新活动的时间滞后效应。一种常见的处理方法是将产出的一阶滞后项作为自变量纳入模型,建立动态空间面板数据模型。表6为创新中间产出(专利)和最终产出(合同金额)的动态空间面板模型结果。
由表6可以得到如下结论:
第一,考虑一阶滞后变量的动态空间面板模型中,区域专利和合同成交金额分别与研发资本和人员投入产生显著的正向空间相关性(专利模型空间相关系数δ为0.101、0.113;合同金额模型相关系数为0.075、0.083),这与静态空间面板模型中的空间相关性并不一致。由此,我们认为静态模型中仅仅用研发资本和人员投入作为自变量考察创新产出可能并未完全地反映实际情况,特别是动态模型中合同金额与投入变量间的空间相关性符号发生变化,更反映出建立动态模型的必要性。
第二,从两种逼近的估计结果来看,NB逼近在、Log-likelihood中相对于BS逼近估计结果均有改善,采用NB逼近的回归结果好于BS逼近的回归结果。在BS逼近中,研发人员对专利产出的影响为负且不显著(p=0.536),而在NB逼近中,这种影响显著为正(p=0.061),其他变量的显著性亦有增强。因此我们如下根据NB逼近的结果进行讨论。
第三,从空间相关系数来看,静态空间模型过高地估计了空间相关性(模型3=0.147,模型4=0.313;模型5=0.113,模型6=0.083)。可能的原因是由于没有考虑文化环境、制度等其他创新投入以外的因素对因变量的影响,而将这些影响笼统地归结为空间相关性。而在动态模型中,加入了因变量的一阶滞后变量作为自变量,可以部分地将其他影响因素从空间因素中分离出去,使模型对空间因素影响的估计更为可靠。
第四,用滞后一期的创新产出作为自变量,其系数为正,表明除创新资本投入与人员投入外的其他因素(诸如文化环境、制度因素等)对创新产出亦有显著的正向影响的贡献。当然,在对创新产出的贡献因素中,所起到的作用最大的还是创新活动的经费投入,而又以其对合同成交额的贡献更为明显,这与模型1、2和模型3、4的结果一致。
六、简要结论
基于2000-2010年中国内地30个省区的专利与技术市场合同成交金额数据对创新集聚现象进行了测度与分析。结果表明,中国区域创新活动的发展存在空间不平衡性且逐渐加剧,无论从中间产出(以专利为代表)水平及其增长率还是从最终产出(以合同成交金额为代表)水平及其增长率来看,都具有明显的空间依赖性(相关性)。依据区域创新活动的空间相关性和时间滞后性,分别建立静态和动态空间计量经济模型分析区域创新活动的空间集聚效应。结果表明,区域专利和区域技术市场成交合同金额与创新投入之间均存在显著的空间相关性;相对于研发人员投入,资本投入对于创新活动的贡献更大,可能与我国研发人员整体素质不高以及粗放型的创新增长模式有关;较之专利,技术市场合同成交金额更强烈的受到空间因素的影响;考虑一阶滞后变量的专利与合同模型结果显示,动态模型中专利和合同金额模型同样具有显著的正向空间相关性,但影响的绝对值变小。其原因可能是,在动态模型中将可能影响创新产出的其他因素与空间因素分离,减弱了创新产出相对于投入之间的空间相关性。
①根据Acs et al.(2002)等学者的研究,创新过程的产出包括中间产出(知识创新)和最终产出(经济收益)两部分,因此,本文研究中也将对两类产出进行检验,考察其空间集聚现象。
②由于篇幅所限,动态空间面板计量模型的估计文中没有列出,如有需要,请向作者索取。
③该指数的计算公式:R&D支出价格指数=0.55*消费价格指数+0.45*固定资产投资价格指数
④Anselin等(2004)指出,如果LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。本文主要参考了J.Paul Elhorst与James P.LeSage等人编写的程序。
⑤一些文献中采用截面固定效应模型估计空间面板数据模型,而在我们的结果中,由于截面固定而时间随机,使得空间固定影响系数偏高(由于篇幅所限,文中略去)而解释变量系数偏低,故文中采用时间固定、截面固定效应模型。
⑥从R2ADJ、、Log-likelihood来看,地区固定效应影响的估计结果要好于时间固定效应影响的估计,也从一定程度上说明了中国区域创新活动的地区结构性差异的影响较时期差异要明显一些。
⑦东部包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、海南11个地区;中部包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南9个地区;西部包括广西、重庆、四川、贵州、云南、陕西、甘肃、青海、宁夏、新疆10个地区。
标签:固定效应模型论文; 面板数据论文; 技术合同论文; 合同管理论文; 相关性分析论文; 空间分析论文; 静态分析论文; 静态模型论文; 动态模型论文; 差异分析论文; 动态分析论文; 相关性检验论文; 专利管理论文; 投入资本论文; 经济论文;