基于ICA的中国经济周期测度研究_经济周期论文

我国经济周期测量——基于ICA的研究,本文主要内容关键词为:测量论文,经济周期论文,我国论文,ICA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

经济的周期性波动是市场经济的一大特征,因而成为宏观经济研究的一个重点。虽然“二战”以来世界范围内的经济周期相比战前出现了温和化的特征,但是经济周期并未消失,尤其是近年来,由美国的次贷危机所引发的全球性金融危机使得各国经济纷纷进入收缩阶段,经济周期再次引起了人们的强烈关注。在诸多关于经济周期的研究主题中,经济周期的测量是最为基础的问题,也是一个成果丰富和发展活跃的领域。

虽然测量经济周期的方法有众多的流派,不过基本思想都是信号提取或滤波的方法。这种方法假定实际观测的时间序列中包含两个成分,即趋势成分和周期成分

这样,经济周期的测量就变成了对实际观测序列的分解,即提取出趋势成分后,剩余的成分即为周期成分:

根据提取趋势成分时,有没有规定一个参数统计模型,经济周期测量方法可以大体上分为参数方法(如状态空间模型、ARIMA模型、不可观测成分模型和马尔科夫转换模型等)和非参数方法(如简单移动平均滤波、Hodrick-Prescott滤波、Band-Pass滤波等)。Massmann等(2003)[1]曾对这些方法做了一个较为全面的文献综述。

在我国,经济周期现象同样引起了学者的浓厚兴趣。早期的研究多以直接对宏观经济变量进行描述性分析从而识别出经济周期,如刘树成(1996)[2]。近年来,我国学者在测量经济周期时,已经突破了传统的描述性分析,而是更多地借鉴了国际上通行的测量方法,例如钱士春(2004)[3]利用H-P滤波法,研究了主要宏观经济变量的波动性与GDP波动性之间的关联;陈昆亭等(2004)[4]利用多种滤波方法对中国经济周期波动的特征进行了分析;董进(2006)[5]利用线形趋势法、H-P滤波法、B-P滤波法和生产函数法,分别估计出了改革开放以后出现过的经济波动周期的起止时间。

然而,笔者认为,目前我国学者对经济周期的测量研究存在两方面的问题。

第一,在目前的研究中,通常是对单个序列(主要是GDP序列)的分解,即便是涉及多个序列,也是单独进行周期分解,然后与基准周期(即用GDP序列分离出来的周期成分)进行比较(如钱士春,2004)[3]。而根据经济学大师萨缪尔森对经济周期的定义,“经济周期是指经济体的总量产出、收入和就业的波动,通常持续2~10年,其特征是经济体中大多数部门的普遍的扩张或收缩”(Samuelson,1998)[6]。再看在经济周期的实证研究中常常引为依据的经济周期的定义,“经济周期是指一种由多数经济活动同时出现的扩张、随后又同时出现衰退和收缩、然后再次进入下一周期的扩张阶段的现象所构成的周期性波动”(Burns and Mitchell,1946)[7]。由上述定义可以看到,经济周期的测量从本质上说是一个多变量测量问题,而不应是仅仅依据单变量的测量。

第二,简单套用国外的研究方法,即从变量的水平值中分解出趋势成分,进而得到周期成分的做法,并不适用于我国目前的经济发展阶段。在发达的市场经济国家,其产品市场和要素市场都已经发展到较高的水平,而且市场机制对这些市场运行的调节能力很强,由此决定了在这些国家,从GDP水平序列中分离出来的趋势序列可视为潜在GDP序列,或者从失业率序列中分离出来的趋势序列可视为自然失业率序列,因此,实际序列与趋势序列的偏离可用来度量实际经济运行与自然率状态的偏离,此即为经济周期的本质。而我国正处于转轨时期,产品市场,尤其是要素市场,发育并不成熟,市场机制的调节作用还不充分,经济周期不免带有制度的强制性成分,在此情况下,从GDP水平序列中分离出来的趋势序列或者从失业率序列中分离出来的趋势序列很难被视为自然率状态序列,因此相应的周期序列也不适于用来反映经济运行中真正的周期波动。

为此,本文的研究在三个方面不同于以往的研究:第一,本文将利用经济增长率、通货膨胀率和失业率三个最为核心的宏观经济变量来测量我国的基准经济周期,是一种多变量方法,而不是单变量方法;第二,本文采用经济增长率变量,而不是经济产出的水平值(即GDP),旨在揭示经济变量的波动性,而不强求解释经济变量与自然率状态的偏离;第三,本文所用的周期提取方法为一种近年来新发展起来的信号提取方法,即独立成分分析(Independent Component Analysis,以下简称ICA)。该方法可以对多个变量序列背后隐含的潜在因素进行提取,在本文中,我们用它来提取多个变量序列中隐含的周期成分。

论文结构安排如下:第一部分介绍ICA的方法原理;第二部分利用ICA方法对我国经济周期进行测量;最后一部分总结研究结论。

一、ICA方法简介

ICA方法起源于20世纪80年代初,是一种潜变量分析方法。这种分析方法假定观测到的变量是由若干相互独立的潜变量混合而成的,其目的就是将这些潜变量,即独立成分分解出来。由于ICA能够抑制高斯噪声,并能分解出相互独立的潜变量,因而在潜变量研究方面具有其他统计分析方法(如主成分分析和因子分析等)所不可比拟的优点。

其中,,i=1,…,n,j=1,…,m是系数。用矩阵表示即为:

x=AS(1)

其中,A是m×n阶混合系数矩阵。该统计模型即为独立成分模型。

在模型(1)中,独立成分是潜在的变量,不能直接被观察到,而且混合矩阵A也是未知的,所有能观察到的仅仅只是随机向量x,ICA的基本任务就是估计出A和s。

从方法本质来看,ICA是一个优化算法,其目标函数在于实现独立成分的非高斯性最大化。该目标函数的设定可由中心极限定理直观地推出。中心极限定理表明,在大样本条件下,独立随机变量的和趋于高斯分布。独立成分模型表明观测变量是独立成分的线性组合,因此观测变量比独立成分中的任何个更接近于高斯分布。换言之,独立成分比任何一个观测变量更偏离高斯分布。

对式(1)表示的ICA模型进行如下的变换:

其中,w是一个待定的向量。如果w是A-1中的一行,式(3)的线性组合就等于一个独立成分。问题是怎样确定w?实际上,由于矩阵A未知,因此不能确切地确定w,但是可以找到一个很接近的估计。定义:

式(5)表明,y是独立成分的线性组合。由中心极限定理知,y通常比任何一个独立成分更接近于高斯分布,只有当这个随机变量恰好等于其中一个独立成分时,y离高斯分布最远,即其非高斯性最大。很显然,在这种情况下,向量z仅有一个元素是非零的,从而y就是独立成分之一。

综上可知,通过使的非高斯性最大化,便可得到一个独立成分。ICA的算法主要有随机梯度法和FastICA(固定点算法),本文采用后者进行分析。关于FastICA算法的详细介绍可参见Hyvarinen等(2001)[8]。

无论哪种算法,都需要对随机变量的非高斯性进行度量。一般来说,对于非高斯性的度量主要有峰度和负熵等统计量。在FastICA中,采用的是负熵准则。负熵J(x)的定义如下:

其中,函数H(x)为随机变量x的熵,函数为与x具有同方差的高斯随机变量的熵。极大熵定理指出,在具有同样方差阵的概率密度函数中,高斯分布的熵最大。由此可知,当且仅当x服从高斯分布时,负熵为零,否则J(x)>0,从而极大化非高斯性的问题就转化为极大化负熵。

由于x的分布未知,所以难以直接计算负熵。在实际应用中,通常采用非线性的方法对负熵进行近似计算,即:

其中,n是具有零均值且与x同方差的高斯随机变量,G(g)是非二次函数。实践表明,选择下面的G函数可以取得较好的效果:

下文实证研究中所采用的函数为log cosh的形式。

二、我国经济周期测量

(一)变量及其统计特征描述

1.变量与数据

如前所述,本文在测量我国经济周期时,所采用的指标有经济增长率、通货膨胀率和失业率,这三个指标是反映宏观经济运行状况的核心指标。其中,经济增长率用GDP的实际增长率测量,通货膨胀率利用GDP平减指数①计算,计算公式为:

失业率用城镇登记失业率测量。虽然城镇登记失业率在度量我国失业率方面存在很多问题,普遍认为城镇登记失业率低估了我国的失业率,调查失业率是更可取的指标,但是鉴于城镇登记失业率是目前我国官方正式公布的指标,本文仍然采用了该指标来度量失业率。另外,在测量经济周期时,如果不考虑周期的波动幅度,而关注周期的转折点,则只要城镇登记失业率的走势与真实失业率的走势相同,其数值的低估不会对周期测量造成严重的影响。

所有数据均为年度数据②,样本范围为1979至2006年,数据来源为历年《中国统计年鉴》。

2.变量的描述统计

上述三个宏观经济变量的基本走势见图1。由图1可以看到,经济增长率(growth)和通货膨胀率(inflation)都呈现出多次的循环往复的波动性,但是其波动性无论在波动幅度上,还是在转折时间上都不完全一致。相比之下,失业率(unemployment)只经历了一次明显的循环,其中1985年以前呈现单调下降态势,之后则在小幅震荡中呈现攀升态势。事实上,正是由于不同的经济变量波动特征各有特异性,才给经济周期的测量带来挑战性。

图1 宏观经济变量的走势

各经济变量的基本描述统计量见下页表1和图2。

由表1和图2可以看到,在三个经济变量中,通货膨胀率的波动范围最大,波动程度最大,而失业率的波动范围最窄③。同时还可以看到,经济增长率的平均水平无论用中位数还是用均值度量,都比通货膨胀率高,表明我国改革开放以来经济增长基本保持在高位运行。

表1 宏观经济变量的描述统计(%)

图2 宏观经济变量的箱线图

3.变量的高斯性检验

由图2可以看到,经济增长率和失业率的分布较为对称,而通货膨胀率则呈现明显的右偏分布。进一步对三个变量进行高斯性检验,由于样本容量较小,因此采用Shapiro-Wilk高斯性检验,检验结果见表2。由表2可以看到,在0.05的显著性水平下,可以认为通货膨胀率不服从高斯分布,不过不能拒绝经济增长率和失业率服从高斯分布的假定。

表2 宏观经济变量的高斯性检验

检验统计量 P值

经济增长率0.97730.7825

通货膨胀率0.9125

0.02271

失业率0.94230.1262

如果这三个变量是由潜在因素控制的,那么由通货膨胀的非高斯性可知,至少有一个潜在因素是非高斯分布的。

(二)独立成分提取

按照ICA方法的要求,独立成分个数不得大于混合信号的个数,因此本文能够提取的独立成分个数不会大于3;另外ICA方法要求在所有的独立成分中,至多有一个成分服从高斯分布。在实际问题的研究中,真实的独立成分个数究竟几何,需要结合经济理论和数据特征来判断。

从理论上说,决定经济增长率、通货膨胀率和失业率波动的潜在因素应该有共同的周期波动成分和若干特有成分,前者是我们要寻找的周期成分,后者则是独立于周期成分的其他潜在因素。在我国,劳动力市场长期以来发育滞后,失业问题一度表现为隐性失业,直到20世纪90年代市场化改革以来,失业问题才逐渐显性化,而且具有一定的爆发性,因此失业率变量可能具有特有的决定成分。同理,通货膨胀率也可能有特有的决定成分,因为我国的产品市场经历了由计划定价逐步过渡到市场定价的过程。由于这两个特有成分都与我国市场化改革进程有关,因此,二者有可能重合。总之,从理论上说,可以设定至少保持2个独立成分,其中一个成分是三个宏观经济变量共有的周期成分,其他的成分是体现市场化进程的特有成分。

从数据特征来看,利用主成分分析,可以辅助确定独立成分的个数。首先对数据进行主成分分析,观察主成分的方差,使累计方差比例达到一定阈值的主成分个数即为最终提取的独立成分个数。对三个变量进行主成分分析,结果见表3。由表3可以看到,第一个主成分的方差贡献率已经达到80%,前两个主成分的累计方差贡献率高达97.8%,因此以提取两个独立成分为宜。

表3 宏观经济变量的主成分分析

主成分1 主成分2 主成分3

标准差

5.22928772.4577702 0.85869612

方差比例 0.80136840.1770230 0.02160858

累计方差比例 0.80136840.9783914 1.00000000

结合理论分析和数据特征可知,对我国经济周期的ICA分析中,应提取两个独立成分。另外,前面对变量高斯性的分析表明,至少有一个独立成分服从高斯分布,因此本研究的数据特征适于采用ICA方法。利用fastICA方法,最终提取的两个独立成分如图3所示。

图3 我国经济周期的分析结果

在读取独立成分时要注意,ICA给出的独立成分没有顺序,所以不能直接判断图3的两个独立成分中,哪个是周期成分,哪个是特有成分。需要在经济理论的基础上,结合混合矩阵的信息判断不同成分的经济含义。我国经济周期ICA的混合矩阵如下:

由该矩阵可知,第一个成分对经济增长率和通货膨胀率具有同向的影响,而对失业率则有反向影响;第二个成分对通货膨胀率和失业率具有同向的影响,而对经济增长率的影响则相反。经济周期理论指出:在经济周期的扩张阶段,经济快速增长、价格水平上涨、就业率提高(即失业率下降);反之,在经济周期的衰退阶段,经济增长减慢甚至负增长、价格上涨幅度减小甚至出现通货紧缩、失业率上升。结合前面对特有成分的判断,易知第一个独立成分就是潜在的经济周期成分,而第二个成分则是反映市场化进程的特有成分。因此下面的分析就在第一个独立成分的基础上进行。

(三)我国经济周期的划分

由图3可以看到,1978年以来,我国宏观经济呈现出明显的周期性,其中,1985年、1988年、1994年和2004年处于波峰,而1982年、1986年、1990年和1999年则处于波谷。由此可知,1978年以来,我国宏观经济运行已经经历了四个完整的周期,自2005年起进入了第五个周期。除第二个周期持续期较短以外,其他三个周期的持续期均在5~10年。具体的阶段划分见表4。

表4 我国1978年以来经济周期阶段的划分 (年)

这种周期划分与直接根据单变量(即经济增长率)划分的周期有明显差异。

首先,周期性的表现程度不同。在图3中,周期成分的图形呈现明显的“V”形,因此周期性很明显,并易于判断波峰和波谷的位置;而图1中经济增长率的波动则多次出现持平的情形,例如1987年和1988年基本持平、1989年和1990年基本持平、1992~1994年基本持平等,这就给周期的测量带来很大的困难。

其次,转折点的确定存在差异。从经济增长率的波动路径来看,1984年、1987年和1992年处于波峰状态,1986年、1990年和1998年处于波谷状态,与多变量的分析结果不尽相同。一个突出的差别是,自1999年以来,经济增长率基本处于上升态势,直到样本期的最后一年,即2006年,经济增长率仍处于上升通道,难以判断是否已经到达周期的波峰;然而根据多变量的分析,2004年已经达到波峰。由上述两个差异决定了两种方法对具体周期的判断不同。关于前三个周期,两种方法确定周期差异不明显,然而关于第四个周期的确定,二者则存在明显的差异。本文的研究发现,第四个周期止于2004年,从2005年起,我国宏观经济实际上已经进入第五个周期,宏观经济面临收缩。而单从经济增长率来看,第四个周期一直持续到2006年。而且事实上,2007年的经济增长率为12.2%,要高于2006年的11.8%,因此按照经济增长率来判断,第四个周期到2007年仍未结束。

三、结论

本文利用ICA方法对我国总体经济周期进行了测量,对改革开放以来我国总体经济周期进行了阶段划分。基于如下两点原因,笔者认为,对传统的利用单变量测量经济周期的方法而言,本文的分析结论更加有力:

首先,本文所用的分析方法可取。经济周期是宏观经济的一种内在波动,在其控制和影响下,宏观经济变量表现出周期性波动。如果将宏观经济变量的波动视为一种可观测的经济信号,那么周期成分就是潜在的源信号。实践表明,ICA方法在信号识别方面具有非常好的效果,因此本文从分析方法上保证了经济周期测量结果的可靠性。

其次,本文得到的经济周期测量结果更符合实际。2008年,由美国的次贷危机引发了席卷全球的金融风暴,我国亦未能幸免。仅从GDP增长率来看,似乎我国宏观经济所面临的冲击是突发的,经济周期是骤然从波峰下滑。事实上,美国的次贷危机早于2006年初即露端倪,鉴于我国与世界经济,尤其是与美国经济的密切联系,我国宏观经济在2006年前后开始进入收缩期是非常合理的推断。

本文仅从经济总体角度测量经济周期,所得周期可作为基准周期。由于不同经济部门或不同经济领域的周期波动与基准周期并不总是保持同步,因此进一步的研究可就具体部门或具体领域展开,这些信息可用来判断不同部门或领域的周期与基准周期的时滞关系,其中周期领先部门或领域的波动可用于经济周期的预报。

注释:

①我国官方统计中并没有公布GDP平减指数,但是可以利用名义GDP除以不变价GDP计算得到。

②虽然用季度数据或月度数据可以更好地测量经济周期,但是受数据可获得性的制约,本文采用了年度数据。

③当然,失业率的相对稳定性有可能是由于数据调查统计方式决定的,真实的失业率不仅可能在数值上要高于官方公布的数据,而且在波动程度上也可能大得多。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于ICA的中国经济周期测度研究_经济周期论文
下载Doc文档

猜你喜欢