实体经济时间序列的计算、季节调整及相关经济意义_时间序列论文

实际经济时间序列的计算、季节调整及相关经济含义,本文主要内容关键词为:经济论文,序列论文,含义论文,季节论文,时间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

月度和季度经济时间序列往往呈现出季节性,在考察前一般需将其先行剔除。在季节因素稳定时,这点很容易做到,绝大多数经济计量软件都会提供一种或几种季节调整方法。但对于中国的很多经济时间序列来说存在着一些特殊的困难,主要就是春节日期的不确定性。

中国的大年初一转换成阳历后日期是不确定的,特别的,其所落在的月份也不固定,多数是在2月,少数则在1月份,而中国的很多经济活动都和春节有着密切的关系,典型的如工业生产和居民消费等,如果用一般的季节调整程序直接进行调整所得的结果往往不能令人满意,经常会在春节前后产生明显的异常点(犄角),我们虽从定性上知道这是春节所造成的影响,但在定量上很难作出一个合适的分析。

其实在国外也有一些类似的问题,典型的如西方的复活节,其日期就是不确定的,因此在这方面出现了很多研究以更好地处理它。迄今为止,有关的研究成果已经相当成熟并被吸纳到商业化的经济计量软件中去,但由于多数通用经济计量软件中所固化的季节调整过程都只针对某些特定因素(如复活节等),并主要针对西方国家的情况来设定,因此无助于调整中国的春节因素。本文借鉴了国外的已有成果,并根据中国的实际情况作了一些探索,具体针对工业增加值以及社会消费品零售额序列较好地得到了处理春节因素的方法。作为副产品,我们还对春节因素以及其它的,如工作日变化或“五一”、“国庆”放长假的影响从数量上作出了一个估计。

在国内做经济分析时遇到的一个普遍困难是缺乏合适的原始数据。一般在处理涉及到数量的时间序列时总是更关心其实际值,而我们一般可得到的数据往往是名义值,但又缺乏一个合适口径的价格指数对其进行缩减,并且所能得到的价格指数一般也多是同比值,而没有一个统一的定基比价格指数。即使从公布的名义值来看也存在诸多问题,例如中国的季度名义GDP在最后一个季度往往特别大,这里其实存在着一些统计上的问题而不仅仅是正常的季节间波动。但好在各种同比增长率还是广泛可得的,并且相对于根据公布的名义值推算的实际值来说更为可靠,因此本文将首先讨论只通过同比增长率所构造的任意序列对于不同季节调整方法的敏感性,为后面关于季节调整的讨论提供一个数据基础。

二、计算实际经济时间序列

(一)为什么难以直接计算经济变量的实际值

在做经济时间序列分析时,一般都需要剔除价格因素。但我国的经济变量,除了年度的真实GDP、月度工业总产值(90年不变价)等少数序列外,一般公布的都是名义值,这就需要我们自己去恢复实际变量。

从理论上讲,实际变量就等于名义变量除以价格。但我国在2000年以前一直都没有公布的月度或季度定基比价格指数(注:人民银行从1994年就开始计算定基比的批发价格指数,但并不对外广泛发布。由于无法得到其确切的抽样范围和计算方法,其可用性和统计质量还有待检验。),虽说理论上可以由环比和同比价格指数推得定基比价格指数,但实际操作时会发现它们之间经常是不一致的。

即使从2001年开始公布定基比的消费价格指数,但就本文所讨论的问题来说,其序列太短,并且应用范围有限。任何一种价格指数都有其特定的统计抽样范围,如果使用了不恰当的价格指数,其结果往往具有极大的误导性。

不过统计局在公布名义经济数据时,一般还会同时公布一个同比增长率或是累计增长率(注:从统计角度来说,如果能公布一个基期不断更新的环比增长率将是最好的,这正是美国现在的做法,而中国的统计制度也在逐步向这个方向靠拢)。这样,从理论上只要任意地设定一个初始值,根据同比和累计增长率就可以递推计算出今后所有时期的真实值。不过这种计算方法存在两个问题,首先在计算完一个完整周期(对月度和季度数据来说就是一年)的数据之后,若再同时拥有同比和累计增长率的数据,则方程组就成为过度识别的,由于统计上的误差,极易造成不一致的现象。另外,此类方程的求解对于参数过于敏感,以至在现有公布数据的精度下几乎不可能求出令人满意的、较为精确和稳定的解。

好在多数情况下我们关心的只是经过季节调整的数据,本文下面就将说明只要有了可靠的同比增长率就能得出满意的季调后真实时间序列。

(二)由同比增长率求取季调后实际经济时间序列

我们将通过最简单的移动平均比率法(ratio to moving average)季节调整来说明初始值的变化对于季调后序列的影响。为了简化起见,我们假设一个年度由两个时期组成,其中本年度的同比增长率分别为r[,1]和r[,2],上一年度两个时期的真实值分别为x[,1]和x[,2],但对我们来说是未知的,我们只是简单地假定其为k[,1]x[,1]和k[,2]x[,2],其中k[,1]、k[,2]为未知的正数,这样本年度的真实值分别为k[,1]x[,1]r[,1]和k[,2]x[,2]r[,2]。

我们首先对原序列取对数,然后运用加性的移动平均比率法进行季节调整。求两阶中心化移动平均如下(nan表示无法计算):

由此可以求得季节指数(先求得每一时期实际值与移动平均值之差,然后根据年内的不同时期进行平均):

如果将以上季调后序列的每期都减去一个共同的常数(logk[,1]+logk[,2])/2,就可以得到一个和k[,1]、k[,2]无关的序列,而这正对应于k[,1]=k[,2]=1的情况,因此对于不同的初始序列所得到的季调后序列与真实的季调后序列之间只相差一个纵向平移。事实上,由于对原序列取对数后,末知的比例因子的对数以加法的形式进入不同年度的同一季节数据中,成为一个固定的加性季节因素,因此可以被加性的移动平均比率法所完全剔除。

不过对于乘性的移动平均比率或是其它的一些季调方法,这种明确的等价关系一般将不再成立,并且其影响的解析分析也将非常复杂,因此我们下面将以乘性移动平均比率法为例做一些数值实验。

我们以1997年1月到2002年12月的工业增加值同比增长率为例,每次随机产生12个0到100之间的均匀分布随机数作为1996年1到12月的真实工业增加值,并据此计算出整个样本期间的实际工业增加值,然后通过一个乘性的移动平均比率季节调整程序,得到季调后序列,并将中间月份(1998年7月)的值标准化为100。如此重复100次,得到100个季调后序列,绘于图1。

图1 初始值的变动对于乘性移动平均比率季节调整结果的影响

由图可见,不同初始值所产生的季调后序列之间非常接近。另外我们还可以从统计性质上来看一个由任意两组初始值所产生的季调后序列之间的差别程度,以及它与初始值之间差别的关系。

我们首先定义两个序列{x[,t]}和{y[,t]}之间的距离d(x,y)=max[,t]|x[,t]-y[,t]|,然后我们任意选取两组初始值,并得到其季调后的序列,如此重复一百次,以初始值之间的距离作为横坐标,季调后序列间的距离作为纵坐标,绘制散点图于图2的(a)图,在(b)图中还给出了初始值与基准序列(全为100,也是后文所采用的实际做法)间的距离同季调后序列间距离的关系。

图2显示随着初始序列间距离的增大,季调后序列间的距离也变大,并且方差变大,但在绝对数量上都很小,一般不超过5%(相对于中间月份),特别的与季调后的基准序列的偏离就更小,一般不超过3.5%。计算表明,(a)图中的平均距离为1.65%,标准差为0.67%,最小距离为0.38%,最大距离为4.08%;相应的,(b)图中的平均距离为1.21%,标准差为0.56%,最小距离为0.25%,最大距离为3.27%,应该说这样的误差还是可以接受的。

图2 初始序列间距离与季调后序列间距离的关系(由同比增长率求得)

后文用的调整方法将更为复杂,因此不同初始值的影响程度也将有所不同,但简单的实验表明,其影响都在可接受的范围之类,本文将不再重复给出强壮性检验的结果。

中国的统计制度一般是以累计值为准,例如累计固定资产投资、累计GDP增长率等。虽说在假定某一年度各时期的实际值后也可以根据累计增长率推出以后年度中各时期的实际值,但遗憾的是,和同比增长率不同,由此并不能得出稳定的季调后序列,关于这一点我们同样可以用以上数值实验方法来证实,这里就不再赘述。

三、工作日变化、春节因素与季节调整

(一)所用数据与季节调整程序的说明

本节作季节调整的原始序列都是依据上一节的结论,根据剔除价格因素的同比增长率计算而得。在具体季节调整程序上,本文采用得是由价Victor Gómez和Agustín Maravall所开发的TRAMO/SEATS程序。

欧洲统计署从1994年开始对几种不同的季节调整程序作了深入的研究,最后将注意力集中到了TRAMO/SEATS和X-12 ARIMA上(注:对各种不同季节调整方法的详尽比较见Fischer(1995)。)。TRAMO程序的全称是"Time Series Regression with ARIMA Noise,Missings Observations,and Outliers,"用来估计和预测具有非平稳(ARIMA)误差以及缺失值的回归模型。它能够对原序列进行插值,识别和修正几种不同类型的异常值,并对工作日变化以及复活节等特殊回归因素以及假定为ARIMA过程的误差项的参数进行估计。SEATS的全称是"Signal Extraction in AR-IMA Time Series",基于ARIMA模型来对时间序列中的不可观测成份进行估计。这两个程序往往联合起来使用,先用TRAMO对数据进行预处理,然后用SEATS将时间序列分解为趋势、周期、季节成份以及不规则成份等几个部分。对TRAMO/SEATS的更详尽描述见Maravall(2001),关于基于ARIMA模型的季节调整方法请参考Cleveland and Tiao(1976)、Hill-mer and Tiao(1982)和Bell and Hillmer(1984)。

本文之所以推荐TRAMO/SEATS程序,主要是因为它可以灵活地设定回归变量,这样基本可以解决此前的季节调整程序无法处理中国的一些特定季节因素(如日期不确定的春节或是放长假等)的问题。虽说X-12 ARIMA程序也提供类似的功能,但TRAMO/SEATS在操作上相对简单,并且较少主观判断成份(注:TRAMO/SEATS程序提供了全自动化处理的选项,并且非常强壮,在多数情况下都能得到满意的效果。程序最初是基于DOS系统,采用命令的操作方式,但现在也开发出了一些图形化界面,如欧洲统计署的Demetra,程序作者自己开发的TSW等,另外一些商业统计软件(Eviews 4)中也提供了对TRAMO/SEATS程序的方便的接口,对于普通用户来说大大提高了程序的友好性。)。

(二)调整季度GDP

图3给出了季调前后的真实季度GDP,其中季调前序列就是假定1996年各季度的值为100,而后根据同比增长率计算出以后年份的季度真实GDP。

图3 季调前后的真实季度GDP

这里需要指出的是,1996年和2000年是闰年,其第一季度的工作天数要比其他年份多出一天,如果按天数比例计算,会使得当季的GDP比正常年份高出1.1个百分点(宋国青,2000)。但由于我们的样本数太少(整个样本期闰年只有两年),很难对这种闰年因素作出准确的估计,因此在本文中我们将其忽略。

图4给出了季调后的季度GDP环比增长率。图中显示,1996年3季度以后,GDP的平均增长率明显下降,前后平均值分别为9.31%和7.41%(折年率)。通过对不同数据的反复观察,我们基本可以判断1997年以来中国经济的长期增长率已经下降,如何调整对未来经济增长的预期将显著影响经济政策的制定和分析。

图4 季度真实GDP的环比增长率

2001年以来GDP环比增长率逐季下滑,其中第四季度只有6.08%,仅略高于1999年1季度,为1996年以来的次低值。单从这一数据来看,GDP增长率下滑的趋势可能还未结束,并且2001年经济增长前高后低的情况将对2002年的经济增长预测产生严重影响。如果认为2002年上半年的经济增长相对于2001年下半年不会有太多改善(从目前的诸多数据分析结果来看是合理的),而在下半年经济将有所复苏的话,则2002年全年的经济增长将只有6.3%,而1、2季度的情况会略糟一些(注:这里对季节因素的预测直接采用程序给出的预测值。)。

(三)调整月度工业增加值

图5是用程序的预设参数所得到的季调后月度实际工业增加值,其中1995年二月、1998年一月、1999年二月和2001年的一、二月的结果存在明显的异常。

图5 不带回归变量的季调后月度实际工业增加值

表1中给出了样本期内各年春节所在的月份,其中1995年有点特殊,大年初一恰好在一月的最后一天,而我国春节公假是指初一至初三三天,因此表1中认为95年的春节横跨1、2两个月份。

表1 1994~2002年春节所在月份

对照图5和表1我们可以发现,出现异常点的月份几乎都是春节所在的月份。一个容易想到的原因是由于春节放长假导致工作日减少,从而减少了产出。这里的问题在于前后两年相同月份工作日天数有显著差别的并不仅仅是春节,但其他月份都没有出现显著的异常点。另外,即使春节放假,也并不意味着所有的生产活动都完全停滞,因此统计局根据工作日差别按比例对2001年1月份的工业增加值同比增长率所作的调整是不合适的。(宋国青,2001)

我国从1999年开始“五一”、国庆放长假,于是引发了大量关于“假日经济”的讨论,虽说这主要是指消费的变化,但工作日的变化多少也会对工业生产产生一定的影响,为了从定量上对其作一个估计,同时也为了验证通过工作日变化调整是否能够解释春节期间工业生产的异常变化,我们用每月工作日作为回归变量来重新对工业增加值作一个季节调整。

结果表明,首先,只是做工作日变化的调整并不能消除上述异常点;其次,工作日的增加确实会对产出有一个正向影响,但在数量上很小,工作日增加一天只能使产出增加约0.2个百分点,而即使按照月份长度(30天)的比例计算,也会有3.3个百分点的影响,考虑到生产并不完全停止,宋国青(2001)对2001年1月份的工业增长给出了一个比国家统计局更为保守的估计,但其基础仍是工作日的变化,相比我们这里的结果仍是夸大了。

尽管缺乏有足够说服力的理由(注:可以想到的理由包括春节的特殊性导致其间的停工程度大于一般的节日,但这样便无法解释闰年因素。或者一个解释就是纯粹由春节所导致的统计工作误差所致。),但我们还是猜测工业生产同当月是否包含春节这个事件本身有很大关系,因此我们设定一个0~1回归变量,如果当月包含春节则为1,不包含则为0,唯一的例外在于,正如前文所提及的,1995年的三天春节横跨了1、2两个月份,其中一月份占一天,二月份占2天,因此我们将1995年一月份的回归变量值设为0.33,而二月份的值设为0.67(注:实践表明,如果不这样做的话,1995年1或2月份仍将被程序检测为统计上的异常点。)。如此调整后的结果如图6所示。图中的曲线已经显得相当平滑,并且事实上也确实没有出现统计上显著的异常点,因此我们的调整方法在操作上是可以接受的。出于重要性原则,以及避免自由度的过多损失,我们今后在处理工业增加值时将不考虑工作日的变化,而只是对春节进行调整。

图6 经春节调整后的月度实际工业增加值

由此,我们还可以从数量上估计出三天春节的总影响为5.74%,分摊到每天就是1.9%,因此如果不考虑其它因素,而只是单纯剔除春节的影响后,2001年1月份的实际工业增加值的同比增长率约为8.5%,要低于国家统计局的公布值,但同宋国青(2001)的估计很接近。由此我们还可以大致判断2002年1月份的工业增加值同比增长在15%左右。

(四)调整月度消费品零售额

公布的较完整的消费品零售额同比增长率是名义值,因此我们首先用同比零售价格指数对其进行缩减得到实际消费品零售额的同比增长率,然后再用前文所述方法得到用于季节调整分析的实际消费品零售额序列,这样做的最大好处在于避免了定基比零售价格指数的计算。

图7给出了预设参数下,不带任何回归变量的季调后实际消费品零售额。虽然统计上并未识别出显著的异常点,但从图上可以看出每年的一月份左右仍有不明显的尖角存在,猜测还是春节因素在作怪。

实验表明,简单的以当月是否包含春节来进行调整几乎没什么作用。根据经验,春节前较长一段时间内的购物都会大量增加,其影响可能同时涉及到1、2两个月份。但由于中国春节日期不固定,因此每年它对1、2月份的影响程度都会有所不同,因此我们这里借鉴美国对于复活节因素的调整方法,粗略地假设春节前大量购物的时间为20天,然后计算出每年1月份和2月份所实际包含的春节购物天数,并以此作为回归变量进行季度调整,结果见图8。

从图上看,调整效果还是令人满意的,但1996年12月出现了一个明显的异常,回到原始数据,确实发现1996年12月的数据有点不同寻常的高,其原因尚不可知,但这样一个单一的异常点并不影响我们的调整方法在总体上的有效性。由此我们还可以估计整个春节20天购物对于实际消费品零售额的影响大概有4.2个百分点,然后按比例分摊到1、2月份中去。

我们同样可以进行工作日调整,由于考虑到闲暇和消费是互补品,因此我们选择的回归变量是每月的休息天数,结果表明,休息天数越多,确实消费越多,但数量上也很小,平均每增加一天休息,当月的实际消费增加0.36个百分点,基于和工业增加值同样的理由,我们今后将不考虑对消费序列进行工作日调整。

自从1999年国庆开始放长假后,出现了很多关于“假日经济”的讨论,我们在此程序中可以对其影响大小作出一个数量上的估计。将是否放长假作为一个0-1回归变量,可以估计放长假对消费的影响大约是1个百分点左右(和工作日调整的结果相差不大),由于放长假是近两年才开始的事,其效应还很不稳定,难以得到更好的估计,并且实践上对季调效果的改进不大,因此我们目前的处理中暂不考虑这个因素。另外,“假日经济”主要是带动了旅游消费的增加,但长假过后,往往消费又会回落,因此总体上的影响不会很大,想依靠“假日经济”来拉动消费的增长恐怕是远远不够的。

四、结论

本文首先通过解析计算和计算机模拟指出任意设定一系列初始值并根据同比增长率计算所得到的序列在经过季节调整后将得到几乎重合的唯一序列,从而得到一个真实季调后序列的满意近似,因此如果我们只关心经季节调整后的序列的话,有同比增长率就足够了。

然后本文根据上述方法计算原始实际经济时间序列,采用regARIMA模型,并利用TRAMO/SEATS程序分别对中国的季度GDP、月度工业增加值和社会消费品零售额进行季节调整。结果表明,春节的存在会对月度工业增加值和社会消费品零售额序列产生很大的影响,但其影响的方式却不尽相同。

对于工业增加值来说,似乎受当月是否包含春节这一事件本身影响很大,而和由春节所引致的工作日的变化关系不大。对于社会消费品零售额,春节的影响主要是节前购物的大量增加,并且一般来说,春节的购物高峰集中在节前20天左右,因此有关月份的零售额水平同其包含的春节购物高峰的天数关系很大。根据以上试验结果,通过构造合适的回归变量,我们可以得到较为满意的季节调整效果,解决了以往在处理春节因素影响时的一个难题。

利用以上结果,本文还对工作日变化、“假日经济”等影响因素作了一个定量的估计,结果表明,这些因素对于有关的时间序列都会产生影响,但从数量上来说影响很小,基本可以忽略。

有了一个可以接受的季节调整序列后,我们就可以考察其环比增长率的变化。与同比增长率相比,这将带给我们更多关于近期经济变化的信息,综合起来可以使我们对经济环境的变化有一个更好的理解,同时,对于经济预测也会有所助益。

标签:;  ;  ;  ;  ;  

实体经济时间序列的计算、季节调整及相关经济意义_时间序列论文
下载Doc文档

猜你喜欢