股票价格预测:GARCH模型与BP神经网络模型的比较,本文主要内容关键词为:模型论文,神经网络论文,股票价格论文,GARCH论文,BP论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
股票价格对证券投资者来说是极其重要的,但由于影响股票价格波动的因素众多,使得其预测难于实现,确切地说,要对股票价格做出准确预测是不可能的,但我们总试图寻找不同的方法,不同的模型来刻画它。对于股票价格的分析有两种不同的学派,一是基本分析学派,二是技术分析学派。和这两种分析派别观点相对应,股票价格预测的建模思路有两种:①尽可能找出所有影响价格波动的因素(宏观经济指标、公司财务指标等等),建立股票价格和这些影响因素之间的模型。②遵循股票价格技术分析,依据股票价格系统自身规律来建模。
一、建模的方法
(一)随机游走模型
这是在GARCH模型提出之前,描述股票价格最常用的模型。
(二)ARMA簇时间序列模型
这是针对平稳时间序列建模有效手段。
(三)ARMA-GARCH模型
这类模型的建模思路一般为:计算股票价格的差分(或者是收益率),用单位根方法验证其平稳性,通过单位根检验则建立该平稳序列的ARMA簇模型,再检验模型的残差是否具GARCH效应,若有,则用GARCH模型对残差加以刻画,这也是检验股票市场有效性的常用方法。
(四)神经网络模型
把股票价格看成一个非线性系统。在实证中,两种建模思路都有:其一把影响股票价格的因素值作为神经网络的输入,价格作为输出,训练网络,再进行预测。其二依据时间序列建模的思想把股票前几期的价格作为输入,紧接一期的价格作为输出。本文在BP神经网络建模过程中应用的是第二种方法。
在以上的各种模型中,基本上都是针对股票价格指数来做的实证分析。本文选择了清华同方个股数据作为实证数据,从股票价格是非平稳时间序列和非线性系统两个不同的角度分别建立GARCH模型和BP神经网络模型,对两者的结果做了比较分析。这也是首次把GARCH模型和BP神经网络模型运用于同一目标数据,做出预测结果,目的在于尽可能选择恰当的模型来刻画数据,探求其内在的发展趋势,比较两者的预测效果。
二、GARCH模型与神经网络模型
(—)GARCH模型
(二)神经网络模型
随着近年来神经网络研究的迅速发展,人们已经把神经网络推向各个应用领域,而BP(Back-Propagation Network)网络是其中应用最多的。其主要应用方面有:函数的逼近、模式识别、分类、预测、以及数据压缩等,在对非线性系统的处理中体现了其优越性。从前面的论述我们也知道股票价格是一个高度非线性的时间序列,所以本文引入BP网络模型对个股的价格预测做一尝试。
为加快网络收敛速度,η的取值应足够大又不致产生振荡。
三、实证分析
(一)样本数据说明
样本数据为清华同方1999年9月14日至2000年5月17日的收盘价格,共154个数据,其中150个作为训练样本,4个作为测试样本。这些数据介于两个除息日之间,可以避免因除息、除权对股票价格的影响。数据来自中国股票市场交易数据库查询系统(CSMAR2001V.2)为了下面的阐述方便,记该序列为。
(二)GARCH模型的建立和预测
1.模型的建立
F统计量=104.5146(括号中的为t值,下同)。所以拒绝该自回归模型的残差序列没有GARCH效应的原假设。
经过反复试算,我们选定GARCH(1,1)作为估计模型,因为Akaike和Schwarz统计量的值是最小的,计算其残差序列的自相关函数序列(Autocorrelation)和偏相关函数序列(Partial Correlation)及其对应的Q值表明,其残差系列不再具有自相关性。同时接受没有GARCH效应的原假设;拟和优度。各参数的结果说明我们建立的模型是合适的。用最大似然法估计得到得模型为:
从以上的模型可以看出:清华同方当期的股票价格和前一期的股票价格有很强的相关关系(ρ=0.998012,非常接近1)。条件方差的滞后项系数很大(0.86533),说明股票价格的波动具有“长记忆性”,即过去价格的波动与其无限长期价格波动的大小都有联系。前的系数(0.140275)也通过了显著性检验,说明股票价格具有明显的波动聚集性。
2.预测
①内插的预测
根据上面计算结果对训练样本进行预测(内插的预测),得到拟合图,图略。
从拟合上也可以看出前面建立的GARCH(1,1)模型对该股价序列的预测是合适的。预测的标准误差=1.976662(预测的标准误差定义为:残差平方和除以其自由度再开平方根,下同)。
②外推的预测
给出样本植和预测值的对比如表1(表略,见原文,下同)(预测的标准误差为:1.397606)。
(三)BP神经网络模型的建立和预测
1.数据预处理及输入输出模式、参数的确定
为了使网络学习收敛的速度加快,我们对原始数据取了自然对数,所以在其对训练样本的预测中使用的是股票价格序列取了对数以后的值,即。在考虑到网络的复杂程度和样本容量的基础上,反复试算,取定滞后4阶为网络的输入,取当期为输出,即输入输出模式为;这样训练样本个数为150,输入输出模式对个数为147。
经多次试验,确定的网络结构为:4-5-4-1。即出在输入输出层外设置了两个隐含层,神经元个数分别是:5和4;学习率为0.1,误差设置为0.01,经过100次的训练达到预先设置的效果。
2.预测
①同样我们通过拟合图来反映我们的预测效果,预测的标准误差为1.768011预测效果有效。另外可以看出其预测效果较GARCH(1,1)模型有明显改进。
②使用得到的模型对测试样本的预测,结果如表2所示(表略)。
经计算,预测的标准误差为0.862625,预测结果有效。
四、结论和启示
(一)两种方法都说明了不能用简单的随机游走模型来刻画股票价格的波动
同时GARCH(1,1)模型也说明了在我国的股票市场中不但股票指数收益率的波动存在GARCH效应,个股价格的波动也具有明显的GARCH效应。
(二)方法上的启示
为方便比较,将两种模型对股价预测的标准误差其置于同一张表中(见表3(表略))。
从表4的预测结果可以看出:对训练样本的预测误差:BP神经网络模型小于GARCH(1,1),即1.768011<1.976662;对测试样本伪预测误差:BP神经网络模型也小于GARCH(1,1),即0.862625<1.397606。经检验,不论是对训练样本的预测还是对测试样本的预测,BP神经网络模型都显著优于GARCH(1,1)模型。
就本文所得到的比较分析结果而言:对股票价格这样波动频繁的时间序列,从非线性系统的角度建模略胜于从非平稳时间序列的角度建模。对今后类似的时间序列建模在思路和方法上都有所启发。尽管针对本文所选取个股股票价格数据,神经网络模型显示了其强大的泛化能力,使股票价格的预测相对精确,但如果要推广到一般的情形,尚需要进一步验证。另外,本文选择的时间段,没有包含除息、除权,也没有较大的宏观层面因素影响,所以在具体的时间序列中,若出现突然的冲击,不论是利用GARCH模型还是BP神经网络模型来进行预测,都需要做进一步的研究。
标签:股票论文; garch论文; 神经网络模型论文; 预测模型论文; 样本容量论文; 数据建模论文; bp神经网络论文;