我国股票市场的实证分析,本文主要内容关键词为:实证论文,股票市场论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
从1990年12月,上海证券交易所成立以来,我国股票市场在4 年多的时间里,已经取得了长足的发展。由于我国股票市场是脱胎于计划经济模式,是在短期内人工速成的市场,因此难免会出现这样或那样的问题,如力主做庄,恶炒个股,内幕交易等等许多不规范的运作行为。对这些问题,有必要探讨。本文应用因子分析的方法,对这一时期的我国股票市场进行实证分析,探讨我国股票市场的股价波动与宏观经济状况的关系,寻找我国股市行情变化的规律性。
一、因子分析
因子分析是多元统计分析的一种方法。因子分析的基本目的是用少数几个随机变量去描述许多变量之间的协方差关系。
1.因子模型。设x为p维随机向量,它的均值向量Ex=μ,协方差矩阵Cov(x)=E(x-Ex)(x-Ex)'=Σ=(σ[,ij]),称x为k个因子模型,若x能表为
x=μ+AF+U(1)
其中是p×k阶未知常数阵,称为因子负荷阵;F是k维随机向量,称为公共因子;U为p维随机向量,称为特殊因子或剩余。模型(1 )与回归模型似乎相似,其实有很大的差别。这里的F 不是回归模型中的自变量,它是未知的不可观测的。在因子模型中,唯一已知的就是观测数据矩阵x,这就给参数估计,以及其它问题的讨论带来较多困难。 为讨论方便,通常总是假定
EF=0,Cov(F)=I[,k];
EU=0,Cov(U)=diag(Ψ[,1],…,Ψ[,p]); (2)
Cov(F,U)=0
由此可以推得
Cov(x)=Σ=AA'+Ψ (3)
2.参数估计。首先是因子负荷阵的估计。在因子模型中,因子负荷阵A是重要的参数。估计A有许多方法,这里采用主成份法。但是这样的估计没有实用价值,因为我们的目的是寻求少数几个公共因子来解释协方差结构的因子模型。只有当公共因子数k与p相比较小,并且(3 )式近似相等时,因子模型才有实际意义。因此在处理实际问题时,只取大于1的几个特征根的个数作为因子数就可以了。
到目前为止,确定因子数的统计量有一些,如x[,2]统计量,赤池信息量(AIC)等等,究竟用哪一个,人们还没有形成统一的看法。一般确定k考虑以下几方面:一是因子所能解释的样本方差的比例;二是问题本身的专业知识;三是所得结果的合理性。
第二是因子得分的估计。在因子分析中,人们不仅对因子负荷阵A的参数估计感兴趣,也重视公共因子F的参数估计,因为它可用于模型诊断。所谓因子得分就是对公共因子的参数估计。不过这种估计,不是通常意义下的参数估计,它是对一个不可观测的随机向量的估计。利用加权最小二乘估计,可得F的估计为
3.因子旋转。当用主成份等方法求得的负荷阵A, 其中每个因子的实际意义模糊,不易解释时,可进行因子旋转。基本思想是找一个正交阵P,使得旋转负荷阵A*=AP的结构具有这样的特点: 每个列向量仅在一个或少数几个因子上有较大的负荷,在其余因子上负荷比较小,如此的旋转结构,不仅富有明显的实际意义的解释,而且具有协方差阵,残差阵,特殊方差和共性方差的估计不变的良好性质。
二、我国股票市场的实证分析
根据有效市场理论,股票价格应包含股市的全部信息,对于来自不同影响面的信息,可将它分为三个层次,一是市场公共信息,二是行业信息,三是个别企业信息。因此股票价格可由市场公共信息,行业信息和个别企业信息三部分组成。
进一步假设所有信息都是可度量的,并且对股价的影响是残性的,其关系为
我们希望从(7)式中找出公共因子。为此有必要划分行业指数。这样做可使同行业的各个别企业因子的影响相互抵销,使得行业指数主要包含市场公共信息和行业信息两部分。称市场公共信息的量化为市场公共因子,即因子模型中的公共因子,而行业信息反映因子模型中的残差,这样就把公式(7)化为
I=μ+AF+U (8)
其中I=行业指数,μ=均值,A=因子负荷阵,F=公共因子,U=剩余。显然这与因子模型(1)的形式一致。
实证分析是以上海证券交易所1994年5月以前上市的164只股票为研究对象, 样本区间是从1992年12月到1994年8月。实证分析的具体步骤:
一是根据有关专业知识,将上证上市的164 只股票进行行业分类,共分22类。在研究中,考虑到样本个数和其它因素的限制条件,仅取22类中的18类进行深入研究。
本文股票数据是月度数据,这样可以与以月度数据统计的宏观经济变量一起做相关分析。而股价均以每月最后一天的收盘价为该月股价数据的代表,并取对数变换。实际应用的股价指数是市价总额加权股价指数的收盘率R[,t],定义为
R[,t-1]=(I[,t]-I[,t-1]) (9)
这里I[,t]表示市价总额加权股价指数的第t月值,定义为
二是计算与式(8)相应变量指标的样本协方差阵S[,n],求出S[,n]的特征根和特征向量。在此基础上,初步确定因子数,估计相应的因子负荷和因子得分。由于S[,n]的18个特征根分别为4.739,2.975,2.169,1.950,1.340,1.225,0.820,0.679,0.615,0.527,0.354,0.231,0.1-53,0.090,0.046,0.020,0.012,0.007。其中大于1的特征根有6个,它们的累计方差贡献率为80.2%,因此,初步断定上证股市的股价波动可用6 因子模型来刻划。究竟因子数取多少适宜,还得从模型优化,解的稳定性,计算的经济性等方面考虑。比如选用大于或小于6 的因子数目进行结果分析比较,如果低因子模型具有高因子模型同样的优良性质,当然选用低因子模型为好。
三是模型拟合评判。从逻辑上讲,如果将股票分得足够细,从中取出一部分做成子类,使得子类具有与整体基本相同的产业结构,然后对它们分别做因子分析,若各模型拟合都较好,那末各模型的因子之间应当一一对应高度相关;反之利用这一反馈信息可用来判断模型的优劣。由于本文行业分类只取其中的18类,显然分类分的较粗,类数取的较少,如果去掉其中一类或几类,将会使股市的产业结构发生较大的变化,因此不能从这一角度考察模型的优劣。在此我们采用从时间变化,考察模型变化,来判断模型的优劣。我们分别做因子分析,再对各模型的因子得分进行相关分析,以下约定:A组为研究组,时间为1992.12—1994.8;B组为对照组,时间为1992.11-1994.8;C组为对照组,时间为19-93.1-1994.8。对它们的旋转因子作相关分析,结果表明A组与B组之间,不管对5因子,还是对6因子,因子得分之间的相关系数极高,都保持在0.99的水平上。而A组与C组6因子模型, 因子得分之间的相关系数差异悬殊,大的绝对值为0.95,小的才0.54;5 因子模型因子得分之间的相关系数变化相对稳定,都在0.95以上。因此可以断言,上证股票市场的股价波动5因子模型优于6因子模型。
四是因子解释。因子解释的传统做法就是分析因子负荷阵A 的元素。根据元素的大小以及符号来解释公共因子主要反映何种实际意义,但也有难以分析说不清的时候。以下考察旋转因子负荷阵,从表1 可以看出共性方差18个中有13个超过了0.5,这就表明选用的5因子模型基本上能很好地反映了18类股票的股价指数收益率的变化。
表1旋转因子负荷阵
因子负荷
类别 因子1
因子2因子3 因子4
因子5
共性方差
沪商 0.3060
0.8211
-0.0028 -0.0908 0.1606 0.8018
异地商0.9848
0.03160.0794 0.0518 -0.1122 0.9924
房地产0.0160
0.08720.7104 0.1568 -0.0617 0.5410
综合 0.0230
0.52020.4281 0.6521 -0.0025 0.8796
机械 0.3912 -0.1298
-0.0236 0.7806 -0.0945 0.7887
纺织 0.4716
0.34020.2005 -0.2305
0.0341 0.4327
化纤 0.1682 -0.1629
-0.0966 0.0406
0.6900 0.5418
钢铁 0.4016 -0.36760.2750 -0.5396
0.2658 0.7338
汽车 -0.0307
0.10820.0560 -0.1166
0.3017 0.1204
制笔 0.2743 -0.30560.2943 0.1142 -0.1665 0.2960
橡胶 0.3432
0.80950.0171 0.2196
0.0112 0.8218
化工 0.5010
0.0577
-0.0142 0.2003
0.3512 0.4179
高科技0.1882
0.40780.5953 0.0150 -0.3287 0.6643
电器 0.6193 -0.06190.5270 0.3182
0.2790 0.8442
建材 0.0496 -0.13960.8572 -0.2233
0.1501 0.8291
制药 0.8200
0.24670.0810 0.0905
0.1470 0.7701
出租车
-0.1174
0.82950.0814 0.0276 -0.0909 0.7175
公用事业 0.2551
0.14640.4086 -0.1809
0.3322 0.3965
累计贡献率0.265 0.430 0.550
0.6580.732
负荷阵的第一因子,它的18个负荷因子中,只有两个符号为负,且绝对值很小,可以认为这是反映股票市场的一般情况,可叫做市场因子。
第二因子其中沪商负荷因子是0.8211,出租车负荷因子是0.8295,橡胶负荷因子是0.8095,这三个负荷因子与其它比较明显偏大,占绝对优势。它们的特征都在上海本地,因此可以认为这是反映区域特征的区域因子。
第三因子其中的建材负荷因子是0.8572,房地产负荷因子是0.7104,显然它们是反映基本建设规模特征,是与宏观经济状况直接有关的,故可叫做基建因子,或宏观经济因子。而第四、第五因子特征模糊,难以解释。
五是考察与宏观经济指标的时差相关分析。从各国股市发展的实践来看,宏观经济状况在大部分时间里是制约股市行情的一个主要因素。本文讨论从1992年12月到1994年8月这一时期,在我国是否也是这样? 为此我们先选取能大体代表我国宏观经济趋势且与股市有一定关联的指标,然后用这一指标体系与旋转因子做相关分析。我们选取的指标有一致综合指数,工业生产总值,零售物价指数,货币供应量M1。其中一致综合指数由工业生产总值,消费品零售额,银行工资性现金支出和货币流通量组成。指标数据皆为年度月环比,并做对数变换。
这里值得指出的是宏观经济影响股市行情的传递机制是十分复杂的,也需要一个时间过程,因此,时滞现象,即时差因素不容忽视,必须考虑,在本文研究中,我们以因子为基准,做了前后10个月的时差相关分析。从分析的结果看,第三因子总是具有绝对值最大的相关系数,具体情况:第三因子在先行一致综合指数,货币供应量M1,工业生产总产值7个月时,分别达到最大值0.62、0.64、0.70;在先行零售物价指数9个月时,达到-0.71的最大相关; 而其它因子与各个指标做时差相关分析时,相关系数都偏低,绝大部分都在0.3以下。 又第三因子与有关经济指标的相关系数的绝对值除个别外,都不超过0.7, 因此不能说是强相关,只能说是中等相关。由此分析,再根据按方差贡献大小顺序排列序号的规则,可以看出第三因子作为宏观经济因子对股票市场的价格形成有一定的影响,但这种影响显然不是主要的。
三、结论
从1992年12月到1994年8月这一时期的实证分析, 可以得出如下几点结论:
(1)无论从因子累计方差贡献率的大小考虑, 还是从模型拟合评判结果分析考虑,我们认为我国股票市场采用5因子模型是合适的。
(2)我国宏观经济状况对我国股票市场股价的形成虽有影响, 但还不是影响的主要因素(实际上这一时期的股市扩容对股价形成倒起了很大的作用)。至少在这一时期还不能说“我国股市变化是宏观经济变化的晴雨表”这一论断。
(3)目前我国经济体制许多方面正在发生变化。 在这一特定时期,许多难以度量的结构性因素和其它难以预料的因素,对我国股市的影响将是难以捉摸的,因此对各个因子一一做出明显的解释确实是很困难的。即使是经济体制没有太大变化的美国、日本,要求对股票市场的各个因子都能做出比较圆满的解释,也是很难做到的。因为影响股市的因素太多了,猜测太难了,更何况我国股市发育还不完善,并处于快速发展之中,从这个角度看,用因子模型分析股市变化是一个较好的方法。
1995年5月