中国工业企业全要素生产率的稳健估计,本文主要内容关键词为:生产率论文,工业企业论文,稳健论文,中国论文,要素论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近年来,采用中国工业企业数据库估计企业层面的全要素生产率已经成为国内外经济研究的一个热点。但现有研究在全要素生产率估计方法的使用、生产函数模型选择、样本范围与数据处理等方面各不相同,进而导致估计结果差异较大(见下页表1)。由此产生的问题是:在全要素生产率估计中,不同估计方法等因素对估计结果的影响程度究竟有多大?各种全要素生产率估计方法的特点、优劣以及适用范围又是什么?在我们的视野范围内鲜有研究回答这一基本性的重要问题。 企业层面的全要素生产率估计是一项相对复杂的系统工程。在给定中国工业企业作为样本的前提下,研究者首先要面对如何处理中国工业企业数据库中报告的投入产出变量。以企业实际资本存量的处理为例,大多数研究对企业实际资本存量的使用主要采取两种处理方式:一是直接使用固定资本原值或者固定资产净值代表企业的实际资本存量(Hsieh和Klenow,2009;李玉红等,2008;李春顶,2010);另一是将1998年作为基期,只对1998年之后资本形成的价格因素进行调整,即通过固定资产投资价格指数对1998年之后的名义资本进行价格平减来估计实际资本存量(谢千里等,2008)。只有Brandt等(2012)尝试对企业的实际资本存量进行详细估计。其次,在生产函数模型的选择上,现有研究主要采用产出模型和增加值模型(见表1)。再次,现有研究采用的价格因子也各不相同,有的采用行业价格平减指数,有的采用省际价格平减指数,有的则不加说明(见表1)。最后,全要素生产率估计方法的使用可能是差异最大的,现有研究更多的是强调方法的先进性,而忽略估计方法对模型选择、样本范围以及价格因子的敏感性。由于上述各种因素的存在,导致现有研究结论的差异较大。 事实上,采用各种全要素生产率估计方法,考虑生产函数模型选择、样本范围以及数据处理等各种差异,对企业全要素生产率进行系统估计处理与比对分析,不仅是一项基础性研究工作,而且有着重要的实践意义。为此,本文首先整理出估计微观企业全要素生产率的7种方法,对这些方法的估计原理以及优缺点进行简要介绍。其次,有效、科学的数据处理是企业全要素生产率估计的前提条件,本文参考Brandt等(2012)、聂辉华等(2012)等的方法对中国工业企业数据库再次进行了处理。然后,将经验研究划分为生产函数模型选择、样本范围与名义变量处理3类要素。为了观测这些因素对估计结果的影响,本文以2×2×2的对照结构对各种估计方法进行对比,分解模型、样本和数据3种要素对估计结果的具体效应。最后,在基准的处理方式下,本文对照了各种估计方法的估计结果,分析异质性企业对不同估计方法的敏感度,总结不同估计方法的应用条件与适用范围。 据笔者所知,本文可能是国内第一篇详细分析不同的处理方式对企业全要素生产率估计结果影响的文献。Van Biesebroeck(2007)的论文与本文较为相关,该文针对大多数研究在估计企业全要素生产率时,常常忽略多数高度相关的异质性,研究了5种常用全要素生产率估计方法(指数法、数据包络分析、随机前沿法、工具变量法和半参数方法)对要素价格异质性、测量误差以及生产技术差异等3种随机因素的影响。但是该文的稳健性分析采用的是蒙特卡洛方法,即通过数据生成过程引入随机因素的方式来分析这些方法的敏感性,仍然属于理论层面的探讨。而本文通过采用文献中广泛使用的7种全要素生产率估计方法,既保证了理论分析的先进性,同时又直接采用目前广泛使用的中国工业经济数据库进行检验与分析,实现了研究的现实性,是对现有该类文献的重要拓展,推进了企业全要素生产率的稳健估计在实际操作层面的发展。 需要进一步指出的是,本文与Van Biesebroeck(2007)研究的差异主要体现在三个方面:一是影响因素。Van Biesebroeck(2007)分析了不同估计方法对要素价格异质性、测量误差和生产技术扰动等几种随机干扰因素的稳健性;而本文基于现有研究实践,总结了使用中国工业企业数据库估计全要素生产率中存在的生产函数模型选择、样本范围与数据处理三个方面的差异。二是研究思路与手段。Van Biesebroeck(2007)使用模拟的企业投入产出数据,通过在数据生成过程中引入随机因素,采用蒙特卡洛模拟方法分析全要素生产率估计方法的敏感性;而本文直接用中国工业企业数据库进行实际估算与比较,分析实际数据下各估计方法对于不同处理方式的敏感性,并在同一处理方式下,对比各种不同估计方法的结果。三是研究结论。Van Biesebroeck(2007)认为,除非数据中存在大量测量误差,否则指数法可以得到一致且精确的生产率估计量,当技术在企业间差异较大并且规模报酬可变时,数据包络分析方法更有效,考虑到联立性问题,使用OLS来估计生产函数通常是不可取的;而本文的研究结论更丰富,更有针对性与借鉴意义。 二、估计方法 对企业全要素生产率的估计可以分为参数估计法和非参数估计法,在以下所要观察的几种估计方法中,指数法和数据包络分析属于非参数估计方法;随机前沿分析、普通最小二乘法、OP法、P法和工具变量法(系统广义矩估计)属于参数估计方法。两种方法各有其优缺点,适用于具有不同特性的样本。 (一)指数法 该估计方法首先需要设定生产函数: 其中,t和τ表示时期,i和j表示企业。将企业下标固定(i=j)可得到企业全要素生产率增长率,将时期固定(t=τ)可得到企业全要素生产率的水平差异,可近似为企世全要素生产率。产出方程(1)允许企业生产技术不同,但式(2)是对不同企业全要素生产率进行对比,需假定企业使用同一生产技术,要素替代弹性即为要素份额。 利用等式(2)中各项比率以要素份额为权重的加权平均值,可估计全要素生产率的增长率,整个测算过程不需要任何参数估计: 即企业生产率是与行业平均值进行比较的相对值,劳动投入差异的权重是,资本投入差异的权重是。不同的企业与同一基准企业进行对比,以此得到生产率的相对值。 (二)数据包络分析(DEA) 数据包络分析也被称为非参数前沿分析,最早可以追溯至Farrell(1957)的研究。Charnes等(1978)将该估计方法可操作化后,大量研究开始采用该方法测量决策单元的效率水平(Seiford和Thrall,1990)。数据包络分析并不需要设定生产函数,效率被定义为产出的线性组合与投入的线性组合之比,线性组合中产出权重与投入权重()通过最大化所考察企业的效率确定。该估计方法对每个观测值求解一个线性规划问题,假定观测值为1,则其面临的问题为: 除了投入权重不能为负外,上述最大化问题面临的唯一约束是所有企业效率都不能超过100%。为了便于解出该线性规划问题,在求解之前都会对上述线性规划问题进行标准化处理:由于投入产出权重同比例变化将不影响求解过程,在求解过程中通常令。是可变规模报酬的互补松弛条件,在固定规模报酬设定下(=0)生产前沿是穿过原点的射线,在规模报酬可变的设定下生产前沿是所有观测值的包络线。 (三)普通最小二乘法(简称OLS) OLS是一种典型的参数估计方法,企业生产函数中的投入要素弹性系数根据样本估计得出,从而无需完全竞争市场的假设。规模报酬由所估计出来的要素弹性确定,也无需固定规模报酬的假定。 (四)OP估计法 由于投入变量与生产率相关,如果不控制生产率冲击对要素投入决策的影响,被影响的投入要素系数估计值将产生向上偏差。另外,同一生产率水平下具有更高资本存量的企业预期利润更高,生产率水平相同的大企业比小企业生存概率更大,造成企业的退出与企业规模相关,产生样本选择性问题,其结果是预期生产率与资本存量负相关,资本系数估计值产生向下偏差。 Olley和Pakes(1996)利用投资方程控制生产率冲击与中间投入的相关性来解决这个问题。具体原理为:由于正的生产率冲击将提高企业的生产率预期进而提高投资,因此投资是生产率的单调增函数,从而可由投资方程的反函数将观测不到的生产率表示为投资、资本存量和企业年龄等变量的显性方程,该方程可用来控制内生性问题。在实际估计过程中,OP法采取两步估计的形式:第一步,利用上述生产率显性方程控制生产率内生性后,估计出劳动投入和中间投入品系数的一致估计量;第二步,以企业生存概率方程控制样本选择性偏差,从而可以将资本投入等对投入决策的影响在其对产出的影响中分离,进而估计出资本投入等变量系数的一致性估计量。 (五)LP估计法 在实际应用中,对投资的估算是一个棘手问题,并且投资与生产率之间可能并不满足单调性条件,导致OP估计量不满足一致性条件。Levinsohn和Petrin(2003)发现,在一定条件下,中间投入品也能解决内生性问题,使用中间投入品作为生产率冲击的代理变量还有以下优点:首先,相对于投资,中间投入品使用量基本都为正数。其次,企业对中间投入品的使用比较容易调整,因此中间投入品对生产率冲击的反应比投资更灵敏。最后,因为不是状态变量,所以中间投入品易于将生产率估计方法与经济理论联系起来。 有鉴于此,LP法假定中间品的投入数量取决于资本投入和生产率冲击,中间投入品是企业生产率冲击的增函数,因此可以以中间品需求的反函数将生产率冲击表示为资本投入和中间投入品的显性函数。 (六)随机前沿分析(SF) 对于对生产函数估计带来严重干扰的生产率冲击,随机前沿分析直接假定该变量服从某一分布,从而将其从随机扰动项中分离。这种估计思想最早源于Aigner等(1977)、Meeusen和Van den Broeck(1977)的研究。因为设定了生产率具体分布,所以该方法利用最大似然估计法对生产函数进行估计。(6)式中生产函数的残差项若为负,则表示企业i在t期与生产前沿的效率差距。该方法初始用来估计截面企业样本,后来逐渐发展至面板数据样本。Battese和Coelli(1992)假定面板数据观测值的生产率函数为: 每个企业的相对全要素生产率为服从非负断尾正态分布且不随时间发生变化的变量。当η为正(负)时,所有企业非效率确定性部分以同样的速率递增(递减)。截面数据下,设定比较严格的假定是将随机扰动项中的全要素生产率部分分离出来的唯一方法;面板数据包含了更多信息,在相对弱假定下也可以识别出生产率。 (七)工具变量法(系统广义矩估计) 对于要素投入内生性问题,另一种解决方法是工具变量法。Blundell和Bonds(1998)提出了估计特定形式误差项的系统广义矩估计法,他们首先将这一估计方法应用于生产函数的估计。在系统广义矩估计(Sys-GMM)的模型中,全要素生产率被设定为具有一阶自回归性质的企业固定效应(),变量用以捕捉测量误差和短期生产率冲击。对生产函数进行差分可得到估计方程: 在(8)式中,ρ是差分系数,ω是全要素生产率固定效应。由于投入变量与各年生产率新息、当年生产率短期冲击和上一期的生产率冲击都具有相关性,估计上述差分方程仍然需要另外一些矩条件。(8)式的一阶差分形式剔除了企业生产率冲击固定效应,在初始条件的标准外生假设下,三期以上的投入与产出滞后和不相关。因为一阶差分方程中包含,该误差项与二阶滞后的产出相关(企业会基于该冲击做出投入选择决策),因此必须使用三阶滞后作为工具变量,更多滞后变量则可用来提高估计的精确性。 表2进一步概况了各种方法的优缺点,指出各种方法的异同和适用性。 三、数据处理 对中国工业企业数据库原始数据的处理主要涉及样本匹配、名义变量的价格平减以及样本筛选等步骤。 (一)样本匹配 企业代码是合并不同年份企业样本的主要依据,但由于企业的误报、改制或重组,可能出现企业代码和企业名称变动,识别出此类样本并进行匹配是基于面板数据结构的估计方法得到稳健估计结果的基础。目前解决这一问题的主要方法有交叉匹配法和序贯识别法,交叉匹配法先将企业按企业名称分别进行分组,然后将同一名称组下所有企业代码下的企业归为一组(对每一名称组都依此进行操作,不断重新归组,因此称为“交叉匹配”);序贯识别法先根据相同的企业代码识别同一家企业,然后以企业名称匹配企业代码无法识别的样本,最后利用法人代表、地区、电话号码的综合信息进一步匹配剩余样本。 (二)实际资本存量估算 资本存量是估计企业生产率的关键变量。数据库中企业上报的固定资本存量都是由以原始购买价格计价的各年投资剩余累积而成的原始资本存量。Brandt等(2012)尝试调整企业整个存续期内所有年份的价格因素。本文遵循同样的思路,以分行业、省份的资本增长率近似企业的资本存量增长率,进而估计出中国工业企业数据库(1998-2007年)中的企业实际资本存量。在此过程中,本文通过区分固定资产净值和固定资产原值两类不同的名义资本,改进企业名义资本增长率估算方法以及纳入历次工业企业普查信息,将企业名义资本存量向真实资本存量方向调整。 1.固定资产原值。首先估计企业成立年份(即基期)的实际资本存量: 在得到企业初期的实际资本存量的基础上,对企业各期名义资本变化量进行价格平减,然后根据永续盘存法可估算出企业各期的实际资本存量: (10)式中企业出现在中国工业企业数据库年份前后的实际资本存量估计有所不同。企业出现在中国工业企业数据库之前,因为缺乏相关信息,需要以企业资本存量增长率估计企业每年的固定资产投资。企业出现在数据库之后,可以获得其各年固定资本存量,无需以增长率拟合的方式估计企业每年的资本形成额,只需以企业每年名义资本存量年变化量计算固定资产投资流量,所得结果更为准确。 2.固定资产净值。首先以企业固定资产净值估计企业成立年份(即基期)的实际资本存量: (11)式中的符号解释同公式(9)。如果能够获得固定资产原值和净值的真实增长率,以固定资产原值和净值推算的企业初期实际资本存量在理论上应该是一致的。 在得到企业初期的实际资本存量的基础上,对企业各期固定资产净值变化量进行价格平减并累加即可估计出企业的实际资本存量。因为企业各期固定资产净值变化量中不包含折旧,因此可以直接对价格平减后的各年变量进行累加,而不再考虑折旧: (12)式中符号解释同公式(10)。同样,(12)式中企业出现在中国工业企业数据库年份前后的实际资本存量估计有所不同。企业出现在中国工业企业数据库之前,因为缺乏相关信息,需要以企业固定资产净值增长率估计企业每年的净固定资产投资。企业出现在数据库之后,可以获得其各年净固定资本存量,无需以增长率拟合的方式估计企业每年的资本形成额,只需以企业每年固定资产净值变化量计算每年的资本形成额。不同的是,这里的各年固定资本形成额已不包含折旧,因此可以直接累加得出企业实际资本存量。 企业资本存量增长率的拟合是估计企业实际资本存量的重要步骤,我们根据历史上的几次工业普查数据和已公布的中国工业企业数据库(1998-2007)估计1978-2007年的企业名义资本增长率。 折旧率是以固定资产原值估算实际资本存量的重要变量,因此,折旧率的选取对估计结果至关重要。目前的研究中,对折旧率的选取大都在5%~9%之间,为了明确折旧率对估计结果的影响,我们分别在这两个折旧率下估计出资本存量,并对估计结果进行对照分析。 估计结果显示,以固定资产原值估计出来的实际资本存量处于5%和9%的折旧率所估计出来的结果之间。5%和9%折旧率估计结果的均值与以资本存量净值估计得到的结果极其相近,这意味着企业的平均折旧率应该在5%~9%之间。实际上,折旧率的选取历来是实际资本估算中的难题,特别是对企业的实际资本估计,由于处于不同行业的企业资产组合不同,而不同类型资产的折旧年限长短不一,因此,以统一的折旧率估计企业实际资本存量可能出现偏误。企业固定资产净值是企业按照税法的规定对各种不同的资本按照不同的使用年限进行折旧处理后的资产价值,包含了企业资产折旧的微观信息,可以较为准确地反映企业资产折旧状况。因为企业折旧率在行业维度和时间维度上都存在着变化,无法获得统一的宏观层面折旧率,所以我们认为以企业资本存量净值对企业实际资本进行估计,所得结果相对更准确。 (三)劳动者报酬估算 指数法需要以劳动所得占增加值的比重估算劳动份额,中国工业企业数据库中包含劳动报酬的变量有工资、雇员补贴以及失业保险等,一般将这些变量之和作为劳动所得指标。然而,由此估算的劳动所得与宏观统计数据有较大冲突,由中国工业企业数据库统计得到的劳动所得占增加值的份额只有34.2%,而国民收入核算中工业行业的劳动所得份额大概为55%,企业报告的劳动报酬可能低估了支付给劳动的份额。Hsieh和Klenow(2009)在对生产率估计时,将所有企业的劳动工资份额等量调整至与国民核算中的份额一致,以纠正该偏差。本文用指数法估计企业生产率时,同样以该方式对数据进行纠正。 (四)行业代码统一 数据库中每个企业都有对应的4位数工业行业代码,标示企业所属行业,但国民经济行业分类体系在2003年进行了更改,行业代码内容和范围都有较大变更,因此,若进行行业层面研究,需要将2003年前后的行业代码进行统一。 行业代码统一还涉及名义变量价格平减,对名义变量进行价格平减的价格因子分为两类:一类是地区层面价格因子,一类是行业层面价格因子。采用行业价格因子对名义变量进行价格平减的问题在于,2003年以前并没有可用的行业价格指数(陈诗一,2011)。为了解决这一问题,本文借鉴Brandt等(2012)利用行业分类统一后的名义产出与实际产出之比估算出分行业价格指数。 本文将两种不同层面价格指数对比后发现,同一年内,各省之间价格波动幅度不大,而不同行业之间价格波动幅度较大(限于篇幅,表格未列出,备索),说明行业间价格差异远大于地区间价格差异,行业价格指数更能反映名义价值的波动。在时间维度上,行业分类下投入价格指数在各年之间的波动也要大于省际分类下价格指数,因此使用行业价格指数更为适宜。 (五)总产出估算与价格平减 总产出也是估计企业生产率的重要变量,该指标衡量方式有工业总产值和销售收入两个变量。由于存货的存在,与销售收入相比,工业总产值对总产出的衡量更为精确。但工业总产值是以当年价格衡量的企业产出,需要消除价格因素才能在不同年份之间进行对比。采用行业价格因子对名义变量进行价格平减的问题在于,1998-2003年并没有可供使用的产出价格平减因子,因此,需要利用数据库所隐含的信息进行估计。由于企业报告了企业的名义产出和实际产出,从而可以使用企业的名义产出与实际产出之比估计出当年的价格指数。为保证估计的稳健性,Brandt等(2012)在构建行业价格指数时,舍弃了与均值的差异超过方差一半的观测值(这些观测值占总观测值的15%~25%),然后以企业的工业总产出现值为权重,重新构建了行业产出价格指数。本文使用《中国统计年鉴》2004-2007年两位数行业分类下出厂价格指数对这一期间的观测值进行价格平减。 (六)中间投入品价格平减 产出、中间投入品和增加值存在着会计上的均衡关系,可以结合投入产出表和产出价格指数估计投入价格指数。各行业投入价格指数是产出价格指数的加权,权数从2002年投入产出表推算得出。由于投入价格指数中原材料和能源的权重较高,2003年以后原材料和能源价格大幅上升,导致投入品价格指数从1998到2007年上升了24.9%,是产出价格指数上升幅度的两倍。 由于产出与中间投入的价格波动方向并不一致,对增加值直接进行价格平减(即不变价核算中的单缩法(许宪春,2002)),隐含着二者价格指数相同的假设,可能存在一些误差。最好对产出和中间投入分别进行价格平减后,利用二者之间的会计关系估算出实际增加值,即不变价核算中的双缩法(许宪春,2002)。 (七)样本筛选 样本中的极端值往往会使估计结果出现不可预料的偏误,本文参照已有筛选过程对异常值进行处理,以确保估计结果的稳健性。在借鉴已有研究成果基础上,本文的剔除标准设计如下:首先,剔除估计生产率所需关键指标(工业总产值、工业增加值、职工人数、固定资本净值\原值、中间投入品)缺失或小于零的观测值。第二步,剔除职工人数少于8人的观测值。第三步,剔除Cai和Liu(2009)所定义的不符合一般会计准则的观测值。第四步,根据样本范围剔除所使用关键指标的前后1%。 四、对估计结果的分析 在模型设定、样本范围和变量3种要素中,生产函数模型的设定影响所有的参数估计方法以及非参数估计方法中的数据包络分析(DEA),样本选择将影响参数估计方法的估计结果,变量处理则涉及所有的估计方法。 (一)估计影响框架设计 生产率估计的重要差异体现在不同的生产函数模型选择。生产函数模型以是否包含中间投入品可分为产出生产函数和增加值生产函数。陈永伟和胡伟民(2011)认为,中国制造业生产对原材料依赖程度较高,增加值模型忽略了中间投入品的作用,可能导致估计结果偏误。然而何种生产函数模型更为适用并没有定论。为了观测模型设定对估计结果的影响,本文在其他因素相同的情况下,将增加值模型和产出模型的估计结果进行对比,评估生产函数模型对各种估计方法的影响方向和程度。 样本范围对非参数估计方法与参数估计方法的影响不同。(1)非参数估计并不受样本范围设定的影响:指数法以要素份额替代要素弹性,对企业生产技术的异质性是稳健的;DEA以线性规划问题求解企业效率,也不涉及生产函数。相比之下,参数估计将得到样本共同的参数,隐含着样本观测值要素替代弹性相同的假定。(2)在现实中,不同行业的企业要素弹性差别较大,分行业估计结果可能更为精确。以OP法和LP法为例,Olley和Pakes(1996)将该估计法的应用限于具有同类企业的通信行业内部;Levinsohn和Petrin(2003)同样对不同行业的企业分别进行估计。为观测不同样本范围对估计结果的影响,本文在其他处理方式相同的情况下,分别以全样本和分行业样本对企业全要素生产率进行估计①,对比观察不同样本范围所得估计结果差异。 价格因子的选择是另外一个影响企业全要素生产率估计的因素。本文保持其他两种要素一致,对比使用不同价格因子(行业层面价格因子和地区层面价格因子)的估计结果,以观测使用不同价格因子估计结果的差异度。 为了分解模型选择、样本范围以及价格因子3种因素对估计结果的影响,本文将经验分析设计为,两种模型设定一两种样本范围一两种价格因子的2×2×2结构(见表3)。在观测特定因素时,本文以其他两种要素不变,观测目标因素对结果的影响。 以生产函数模型的选择为例,增加值模型和产出模型分别有样本范围与价格因子组合的四组对应的估计结果Ⅰ、Ⅱ、Ⅲ、Ⅳ和Ⅴ、Ⅵ、Ⅶ、Ⅷ。其中,Ⅰ为全样本进行估计,产出价格使用行业价格指数进行平减,模型选择增加值模型的估计结果。Ⅴ为全样本进行估计,产出价格使用行业价格指数进行平减,但模型选择产出模型的估计结果,其余以此类推,Ⅱ对应Ⅵ、Ⅲ对应Ⅶ、Ⅳ对应Ⅷ。由此可以得到四组对应结果,取这四组对应结果的均值,即得到观测生产函数模型对估计结果影响指标,计算过程见式(10)-(12)。 由于异质性企业对不同处理方式响应程度不同,其生产率差异提供了比较好的观测要素影响估计结果的角度,可以作为观测因素影响的重要指标。本文观测的异质性企业有国有企业、出口企业、年轻企业、进入企业与退出企业五类。对于各类异质性企业,以对数生产率平均值差异观测其生产率差异度,该指标的计算公式为: 其中,为异质性企业平均对数生产率,为对照企业平均对数生产率,异质性因素(h)包含国有企业(soe)、出口企业(exp)、年轻企业(you)、进入企业(ent)和退出企业(exi)等五种企业,对照企业(s)则分别为非国有企业、非出口企业、成熟企业以及在位企业。 各种估计方法在不同模型设定、样本范围和价格因子下的详细估计结果限于篇幅未列出,备索。为了精炼估计结论,在这里对估计结果进行2次统计处理,以此就要素对各估计方法的影响进行总结性分析。在以下分析中,主要以统计量观测各因素对估计结果的影响,在不同要素下,该指标的计算方法分别为: 其中,X表示所观测的变量,包括资本系数(K)、劳动系数(L)、中间投入品系数(M)、各行业资本系数方差(Ksd)、各行业劳动系数方差(Lsd)、各行业中间投入品系数方差(Msd)、异质性企业生产率差异()、对数生产率均值(mean)和对数生产率方差(var)。Ⅰ-Ⅷ为不同要素组合代码,要素分别包括:生产函数选择中的增加值模型(va)和产出模型(y),样本范围中的全样本(all)和分行业样本(sub)以及价格因子中的地区价格指数(reg)和行业价格指数(ind)。 在分析结果中,大于1,表明处理方式f所得结果大于处理方式g,反之则f小于g;越接近于1,说明该要素对估计结果影响越小;若符号为负,则说明对要素采用不同的处理方式所得估计结果会完全背离。分析结果越接近1,说明本文所观察的处理方式对结果的影响越小,也就是说,估计结果对该处理方式越不敏感,其结果越稳健。为排除异常值的影响,所有结果均在去除对数生产率首尾1%后计算得出,下面是对3种要素影响的分析。 (二)模型选择对估计结果的影响 下页表4描述了各种估计方法在不同生产函数模型下的估计结果差异。下页表4表明,在所观测的投入变量系数估计值、估计结果相关性和异质性企业生产率差异等指标中,不同生产函数模型设定对估计结果的影响如下: 1.投入要素系数估计量。估计结果表明,两种生产函数模型下的估计结果差异非常大。大多数估计方法产出模型所估计出来的资本和劳动投入系数都只有增加值模型估计结果的30%左右,但LP估计法所估计出来的系数比较接近。系统广义矩估计对数据连续性要求比较高,而样本未能满足这个条件。从资本与劳动投入系数之比来看,增加值生产函数下的资本—劳动弹性之比()基本都高于产出生产函数下的资本—劳动弹性之比()。 2.估计结果的相关性。产出模型与增加值模型估计结果相关性在各种估计方法下普遍不高。参数估计法处于0.5-0.6之间,非参数估计法甚至更低,只有0.2左右。其中,相关性最高的是普通最小二乘法,相关系数为0.6214;最低的是数据包络分析,技术效率和规模效率的相关系数分别为0.1831和0.1924。参数估计方法中,系统广义矩估计在两种模型估计结果中的相关性最低,平均相关系数只有0.4735,显示了其对模型选择的敏感性。 3.异质性企业生产率差异。DEA在不同模型下估计出来的异质性企业技术效率和规模效率差异方向基本一致,但产出模型下异质性企业效率差异都要低于增加值模型。参数估计方法中,OLS估计法在不同的模型下对异质性企业的生产率差异估计结果方向也基本一致,只有对出口企业生产率差异方向估计出现分歧,但产出模型估计出来的异质性企业生产率差异度普遍高于增加值模型。LP估计法下两种模型所得到的异质性企业在差异度上比较接近。其余的3种估计方法都有两类异质性企业生产率差异方向不一致的情形,差异程度的差别也比较大。 从以上对比分析可以看出,生产函数模型设定对各种估计方法都有比较大的影响,对异质性企业生产率差异程度的估计基本没有完全一致的情况。其中,系统广义矩估计在两种模型设定下的估计结果差异最大,而LP法估计结果差异最小。这是因为LP的算法在设计之初便考虑不同模型下的估计方法,决定了其估计结果对不同生产函数模型设定比较稳健。从对异质性企业生产率差异的估计看,产出模型在参数估计法下所估计出来的异质性企业生产率差异基本都高于增加值模型,非参数估计则相反,增加值模型下的异质性企业生产率差异基本都高于产出模型。 (三)样本范围对估计结果的影响 参数估计方法假定样本企业具有同质性,因此使用不同的样本范围将影响估计结果。本文控制了生产函数模型和价格因子,观测不同的样本范围对估计结果的影响,结果见表5。在表5估计结果中,从所观测的投入变量系数估计值、估计结果相关性和异质性企业生产率差异等指标可看出,样本范围对估计结果的影响如下: 1.投入要素系数估计量。除了LP方法外,各估计方法在全样本下得到的资本投入系数较高,同时中间投入品系数较低。系统广义矩估计的两种结果相差极大,显示出该估计方法在样本连续性较差的情况下对样本范围也比较敏感。分样本估计系数的方差均值之比是分行业估计所得系数的方差与均值之比,反映了行业企业生产技术的差异程度。从该比值可以看出,各样本的劳动和资本替代弹性在样本均值的30%~100%之间波动,表明不同行业之间的要素弹性差异较大。在各种估计方法中,P方法和系统广义矩估计下要素投入系数的差异最大,随机前沿分析估计下的要素投入系数差异最小。 2.估计结果的相关性。OLS在两种样本选择下估计结果的相关性最高,相关系数为0.8557,其次是随机前沿分析,相关系数为0.8442;相关性最小的是系统广义矩估计,相关系数只有0.233。由此可见,系统广义矩估计对样本范围比较敏感。 3.异质性企业生产率差异。LP方法对样本范围最为稳健,在5种异质性企业中只有国有企业在不同样本范围下生产率差异方向不一致。而常用的OP方法,在4种异质性企业中,有2种生产率差异方向不一致,并且国有企业生产率差异程度的估计也明显不同。可以看出,以不同的样本范围进行估计将使OP估计法的结果出现严重混乱。 4.对数生产率均值与方差。全样本下估计出来的对数生产率均值基本都要大于分样本估计结果,其中,OP方法和系统广义矩估计在不同的样本选择下差异比较大。进一步探究其原因发现,在产出模型和行业价格因子下不同样本范围所得结果差异较大,是造成OP法估计差异较大的主要原因。另外,全样本下估计结果更为集中,即对数生产率方差更小。 (四)价格因子对估计结果的影响 使用正确的价格因子是去除名义变量中价格因素的关键,因为涉及投入产出变量的实际值估计,价格因子将影响所有的估计方法,下页表6列示了使用不同价格因子的差异。行业价格因子与产出价格因子随着时间差别扩大,行业价格指数在样本后期波动越来越剧烈,不同行业之间的价格差异越来越大,地区价格指数则比较平缓。从所观测的各种指标中可以看出,价格指数对估计结果的影响如下: 1.投入要素系数估计量。在地区价格指数下基本上资本系数和劳动系数相对较低,但中间投入品的系数比较高。原因在于,地区价格指数在水平值上高于行业价格指数,经过该价格指数平减得到的变量实际产出较低,因此所估计出来的劳动投入和资本系数相对较小。从和和三项指标可以看出,在分行业估计的结果中,地区价格指数所估计出来的资本和中间投入品系数相对分散,而劳动投入系数在各行业间相对集中,但趋势并不明显,且具体影响程度因估计方法不同而异。 2.估计结果的相关性。相比其他因素,不同价格因子所估计出来的结果相关性相对较高,除了DEA以外,基本都在0.9以上。相关性最高的是普通最小二乘法,相关系数达到0.9836,参数估计中相关性最低的是LP法,相关系数只有0.9193。从原数据中探究LP法相关性指数较低的原因可知,在产出模型分行业估计下,使用地区价格因子和行业价格因子两种估计结果的相关系数只有0.7左右,说明LP法的产出模型分行业估计对价格指数比较敏感。但对价格指数最为敏感的还是非参数估计中的DEA,不同价格因子下估计结果相关系数只有0.6左右,印证了DEA估计方法对数据测量误差比较敏感的估计特性,而价格指数恰恰是变量衡量准确性的关键一环,DEA对此反应剧烈,并不令人意外。 3.异质性企业生产率差异。在地区价格因子影响下,随机前沿分析的年龄异质性企业生产率差异方向不同,大部分估计方法在地区价格因子下年龄异质性企业生产率差异度都比较小。通过对不同年龄企业分布进行分析,发现数据库前期老企业较多,后期新企业较多,地区价格指数在时间维度上与行业价格指数差异较大,导致对两种企业生产率差异估计出现偏差。地区价格指数低估了出口企业的生产率差异程度;普通最小二乘法则对出口企业的生产率差异方向出现估计偏差,并且对其他异质性企业的生产率差异都有轻微的高估;OP法和LP法倾向低估异质性企业的生产率差异程度。在非参数估计方法中,指数法下年龄异质性企业的生产率差异方向不同,对其余种类的异质性企业生产率差异程度的估计相对较高;对于数据包络分析,地区价格指数则倾向于低估异质性企业技术效率和规模效率的差异程度。 相比生产函数模型和样本范围,价格因子对估计结果影响相对较小。但从数据分析的价格指数介绍可以看出,两种价格因子的估计差异随着时间渐渐增大。换言之,如果在时间维度上观测价格因子的影响,采用不同价格因子的估计结果差异会随着时间逐渐变大。 五、不同估计方法估计结果对比 通过进一步对比不同估计方法之间的差异,本文在一定程度上可以获得该估计方法是否稳健的重要信息。原因在于,整个投入产出数据集只有一种企业全要素生产效率的排序,不同的全要素生产率估计方法都是为了最终获得这一精确的生产率排序值,那么不同的估计方法所得结果的差异在一定程度上反映了这种估计方法的适用性。如果某种估计方法估计结果与其他估计方法差异过大,就需要利用其他的估计方法对其结论进行稳健性检验。 (一)不同估计方法估计结果对比 本节进一步将不同估计方法在同一处理方式下的所得结果进行对比,以观测不同估计方法的差异。采用的处理方式:首先,由于生产函数模型的选择是中性的,所以在对比过程中将同时保留产出与增加值两种模型的估计结果。另外,对增加值采用双缩法进行价格平减,先将产出与中间投入品利用相应的价格指数分别估算出实际值,再对二者相减求出实际的增加值。其次,对于资本存量,此处对所有年份价格因素都进行调整。最后,名义变量的价格因素以行业价格因子进行平减,参数估计方法以分行业样本进行估计。不同估计方法下的估计结果见下页表7。在所观测的投入变量系数估计值、估计结果相关性和异质性企业生产率差异等指标中,不同的估计方法表现出以下差异: 1.投入要素系数估计量。普通最小二乘法和随机前沿分析在两种模型下的估计结果比较类似。相比之下,系统广义矩估计得到的资本和中间投入品系数较低,劳动系数较高。OP法估计结果具有比较突出的特点,其资本和劳动系数基本都大于其他几种方法的估计结果,特别是资本投入系数远高于其他估计方法,达到了其“纠正资本投入内生性”的初衷。与之相比,LP法增加值模型下劳动系数远低于其他估计方法,产出模型估计结果也与其他模型有较大差异,表现在资本系数高于其他估计方法,而劳动系数和中间投入品系数低于其他估计方法方面。从纠正资本投入内生性来说,LP方法的产出模型有很好的体现,但增加值模型并未体现出这一点。 2.异质性企业全要素生产率估计差异。各估计方法对比结果如下:(1)国有企业方面,除了数据包络分析增加值模型下的规模效率和LP估计方法外,所有估计方法都显示,国有企业平均生产率低于非国有企业平均全要素生产率,其中,OP方法下二者的差异最大。(2)出口企业方面,大部分估计方法显示,出口企业平均生产率低于非出口企业平均生产率,支持了“生产率悖论”存在。(3)年龄异质性企业方面,大部分估计方法显示,年轻企业平均生产率高于年老企业,并且DEA估计出来的规模效率为负,证明年轻企业距离其最优规模相对较远。但LP估计法在两种模型下都显示,年轻企业平均对数生产率低于年老企业。(4)新进入和退出企业方面,各种估计方法的估计结果非常一致:新进入企业平均对数生产率低于在位企业,退出企业平均对数生产率高于在位企业。这意味着中国工业制造业中,进入企业存在着逆向选择,退出企业存在着逆向淘汰,即生产率较低的企业进入市场,而生产率较高的企业退出市场。 3.对数生产率均值与方差。增加值模型所得结果基本上高于产出模型。生产率的方差反映了企业生产率分散程度,具有重要参考价值。从估计结果中可以看出,LP方法在产出模型下所估计出来的生产率最为分散,其次是OP方法在增加值模型下的估计结果,分布比较集中的是OLS在产出模型下的估计结果。生产率的分散程度反映了各种不同估计方法对要素投入产出弹性不同的处理方式所产生的差异。 (二)不同估计方法估计结果的相关性② 相关性是评价不同估计方法差异的重要指标,从估计结果发现,不同估计方法和模型设定下的估计结果相关性具有以下特点: 1.非参数估计与参数估计结果之间相关性较低。与指数法相关性最高的增加值模型下OP估计法,其相关系数也就0.23左右,其余估计方法所得结果相关系数只有0.1左右。因参数估计与非参数估计的差异主要在于对企业异质性设定,二者估计结果差异在一定程度上反映了企业生产技术差异度。如果以非参数估计法估计结果为基准,即使分样本进行参数估计,行业同质性假设对估计结果仍有较大影响。 2.同一种方法下两种模型估计结果的相关系数一般在0.5-0.6。例如,普通最小二乘法下两种模型估计结果的相关系数为0.5537、随机前沿分析为0.5229,系统广义矩估计为0.4801,OP估计法为0.5380,LP估计法为0.4076,DEA中的技术效率(te)为0.6777,规模效率(se)为0.5093。二者的相关性并不高,意味着不同模型下的估计结果相差较大,进一步研究这种差异的含义具有一定的意义。 3.同一种生产函数模型设定下不同估计方法才可能有比较高的相关性。增加值模型下各估计方法平均相关系数为0.6375,产出模型下各估计方法平均相关系数为0.4745,而各估计方法产出增加值模型交叉相关性的平均相关系数只有0.3867。具体来看,相关性最高的几组估计结果分别为增加值模型下的OLS与随机前沿分析,产出模型下的OLS与随机前沿分析,增加值模型下的OLS与LP,增加值模型下的LP与随机前沿分析。在两种生产函数模型之间,增加值模型下不同估计方法的相关性比产出模型下不同估计方法相关性更高。 4.不同估计方法相关性较高的是OLS与随机前沿分析法,在同种生产函数模型之间具有非常高的相关性,其次是OLS与LP之间,以此来看,OLS、随机前沿分析法以及LP估计方法之间的差异并不是很大。 六、结论与启示 本文的价值就是要厘定估计全要素生产率过程中各种要素的影响大小与影响性质,从而为今后的研究采用合适的估计方法提供借鉴。为此,本文将全要素生产率研究中各要素进行分解,分离出各要素对估计结果的影响,并进一步对比了基准处理下各种估计方法的估计结果。 1.在生产函数模型、样本选择和变量处理3种要素中,生产函数模型对生产率估计结果影响最大。但对模型的选择是一个中性问题,目前并未出现有说服力的文献对二者进行区分。在各种估计方法中,系统广义矩估计对生产函数模型的选择最为敏感,数据包络分析和LP方法对该因素相对稳健。在基准处理方式下,各种估计方法在两种模型下估计结果相关性都不高,大概在0.5左右。 2.样本范围对估计结果的影响仅次于生产函数模型,在所观察的几种估计方法中,OP方法和系统广义矩估计在不同样本范围下估计结果差异最大。总体上看,全样本高估了企业的对数生产率,并且估计结果分布更为集中。 3.名义变量价格平减经常被忽略,但它却是影响估计结果的重要因素。地区价格因子将低估资本和劳动系数,同时高估中间投入品系数。在所有估计方法中,LP方法对价格因子比较敏感,但最为敏感的还是非参数估计中的数据包络分析法,不同价格因子估计结果相关系数最低,只有0.6左右,使用不同的价格因子在这两种估计方法下的估计结果差异比较大。在两类估计方法中,参数估计方法对不同的价格平减指数相对稳健,相比之下,非参数估计方法放大了价格因子带来的差异。 4.参数估计方法估计结果与非参数估计结果显著不同,特别是指数法,所得结果与其他结果的相关性非常小。Van Biesebroeck(2007)通过数据模拟证实,非参数估计方法的优点在于对企业异质性比较稳健,而参数估计方法因为考虑了随机因素,故而对变量测量误差相对稳健。本文对两类估计方法进行对比发现,两类估计方法的估计结果差异极大。如果以参数估计方法的估计结果为基准,意味着样本存在比较严重的测量误差,如果以非参数估计方法的估计结果为基准,意味着样本中企业在分行业估计下仍然存在严重的异质性问题。 5.现有研究表明,除非数据存在严重的测量误差,否则指数法是全要素生产率增长的一致精确估计,即使当企业生产技术存在异质性,该方法对全要素生产率水平的估计也非常稳健。DEA估计法在生产技术具有异质性以及规模报酬非常数的情况下比较稳健。因此,当研究者将不同行业、不同年龄或者不同国家的企业进行混合估计时,可考虑这种方法。由于要素投入与未观测的企业生产率之间存在广为人知的内生性问题,用OLS对生产函数进行估计,会对生产率水平值产生严重偏误。考虑这种内生性问题,可使用控制了该内生性问题的OP和LP两种半参数估计方法对企业全要素生产率进行估计。当确信生产率差异比较稳定、产出衡量比较精确以及企业间生产函数不存在异质性的情况下,随机前沿分析会得到全要素生产率的精确估计结果。在严重的测量误差和技术异质性的情况下,系统广义矩估计对全要素生产率水平值和增长率的估计最为稳健。 作者十分感谢匿名审稿人提出的富有建设性的修改意见,当然文责自负。 ①分样本情况下,本文在4位数分类下的行业内进行估计。4位数分类是最为详细的行业分类,在该分类标准下,中国工业制造业被分为425个行业。在如此细分的行业下,企业的生产技术差异比较低,可以近似为同质性企业。 ②限于篇幅,相关系数表未给出,感兴趣的读者可向作者索取。标签:全要素生产率论文; 生产率论文; 生产函数论文; 资本存量论文; 参数估计论文; 因子分析论文; 差异分析论文; 存量资产论文; 投入资本论文; 劳动生产率论文; 折旧率论文;