基于信息扩散原理运用人工神经网络识别股票级别,本文主要内容关键词为:神经网络论文,原理论文,级别论文,股票论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F830 文献标识码:A
引言
股票评级是股票资信评估的一个重要项目,它可以为投资者提供股票的信息,减少投资者获取信息的成本,为投资者的决策提供重要的依据。股票评级也叫股票等级评估。它通过对与股票有关的因素进行分析和研究,对股票质量进行评价,并以简单的记号或说明展示给社会公众和投资者。
针对股票评级问题,国内外学者进行了广泛深入的研究,其研究主要是从评级指标和评级方法两个方面进行。在评级指标方面,应用较多的是美国标准普尔公司采用每股收益和股利两个指标来评价股票,台湾经济日报对股票的评级采用获利能力、股价波动率、营运能力、股票交易周转率、短期偿债能力五个指标[1]。但这些指标体系并不完全适用于国内的证券市场,因此国内的学者也对股票评级指标进行了研究,如文献[2]提出根据风险下的股票收益,从不同角度建立指标体系来进行股票评级;文献[3]提出利用公司综合分析指标与股票交易测定指标来综合评估股票级别;文献[4]则考虑了上市公司的行业背景以及公司本身的历史经营状况作为其股票评级的重要依据。上述的研究为我国建立自己的股票评级指标体系提供了帮助。
针对股票评级的方法,近几年出现了将人工智能技术引入到股票评级中的潮流,如文献[5]提出利用聚类的方法对股票进行分类评级。而神经网络方法则是应用最多的一种。文献[6]利用神经网络对股票市场的整体趋势进行预测。文献[7]利用神经网络实现对个股的价格变化,投资回报等指标进行预测和评价。文献[8]将模糊技术与神经网络相结合,提出利用模糊神经网络用于股票评级。文献[9]以神经网络为基础构建决策支持系统来进行股票评价和预测,从而提高了神经网络方法应用的系统性。
本文的研究主要是针对股票评级的方法,由于神经网络具有预测精度高的特点,因此本文选择神经网络方法作为股票评级方法。与上述有关神经网络进行股票评级的研究不同的是本文强调了对神经网络训练样本的处理,提出利用因素状态空间上的信息扩散原理对样本股票评级的结果进行优化处理,从而降低神经网络的训练时间。同时可减少训练样本评价中主观因素的影响,从而提高训练样本的精度,进一步提高神经网络评级结果的精确性。
一、因素状态空间上的人工神经网络
人工神经网络(Artificial Neural Networks,ANN)简称神经网络,它是一类模拟生物神经的系统结构,具有较强的自学习能力,可在学习过程中不断完善自己,使经过训练后的网络达到希望的精度要求。本文所介绍的ANN是前馈神经网络,采用的是后向传播(Back Propagation,BP)模型的学习算法,即从输出层向输入层逐层进行权值修正。
在利用ANN进行训练和预测的时候,通常会遇到具有模糊信息的样本,如“可行性”,“满意程度”等概念。当利用传统的ANN,即每一个输入节点对应一个输入变量,每一个输出节点对应一个输出变量,这种结构将难以处理具有模糊信息的样本。
文献[10]提出了构造因素状态ANN,利用因素状态空间上信息扩散原理对ANN的输入输出因素进行优化处理,从而解决模糊信息的问题。下面,我们将简要介绍因素状态神经网络和信息扩散方法的原理。
当输入和输出因素都是可测因素时,其计算与此相类似,本文在此不再介绍。
二、因素状态人工神经网络识别股票级别的步骤
在识别股票级别的研究中,经过初步评级后所得的结果具有模糊信息。前文所介绍的信息扩散原理和因素状态神经网络方法对模糊信息具有较好的处理效果,可以利用该方法进行股票评级。
传统的股票评级方法通常是对股票的历史数据进行考察、分析,以便得到评级结果。这种方法受市场波动的影响较大。利用ANN进行股票评级,将由历史数据所得的评级结果作为ANN的输出,将当期数据(可根据需要选择当年、当月或当日数据)作为ANN的输入。即投资者可根据当期数据判断股票的级别,使对股票的当期市场表现评价与长期趋势趋于一致。利用要本评级方法减少了评级结果中主观因素和市场波动带来的影响,使评级结果具有较好的客观性。
利用因素状态ANN识别股票级别,其具体步骤如下:
(1)选择ANN的训练样本,通过对样本进行初步评级,得到ANN的输入和输出因素。
对每支股票的当期数据作一次评价,得到一个分值型结果,这一结果反应的是每支股票在当期的市场表现。将这个结果作为ANN的输入因素。
对每支股票的长期数据(这里可根据具体的评级要求选用适当的时间段)做一次评价,得到每支股票的级别,将这一结果作为ANN的输出因素。
以上两次评价中的评级方法均可采用传统的评级方法,通过建立指标体系来进行股票评级。但在数据选择的时间段上不同,在最后结果的表示上,当期数据评价的结果被折算为一个10以内的分值,而长期数据的评价结果则以股票级别来表示。
(2)利用信息扩散原理,对(1)中所得的结果即ANN约输入输出因素进行优化处理,将所得的结果用于网络训练,经过训练达到要求的精度后,就可以利用训练好的ANN进行股票评级。
(3)选择需要评级的股票,对这支股票的当前数据按步骤(1)中的方法计算,将所得的分值型结果代入ANN,所得的输出即为该股票的级别。
(4)对股票评级的结果进行分析,得出相应的投资建议。
三、应用实例
利用本方法对股票评级,对样本的选择要考虑股票分析的稳定性,信息扩散过程中信息传递的准确性及神经网络的特性。本文选用沪市的股票进行分析,每支股票都对其1998年~2003年的年报数据进行统计。其中1998~2002年的数据作为长期数据,2003年的年报数据作为当期数据。本文的数据主要来源于中国证券监督委员会网站,中国证券报网站,泰阳证券网站以及其他一些提供年报数据的网站。由于1999年以前的年报较难寻找并且不够完整,全部6年年报齐全的股票共找到183支。由于本文的研究要求样本在一定时间内具有稳定性,因此本文对上述且183支股票进行筛选,首先剔除在1998~2003年出现违规情况的股票,如红光(600083),然后对剩余各支股票的基本财务数据进行时间序列分析,剔除掉波动情况异常显著的股票,最终选用112支股票作为ANN的训练样本。
(1)对样本进行初步评级。
根据中国证券业协会在1994年制定的用于分析和评估我国上市公司状况的指标体系,在兼顾全面性、可比性和可行性三个原则的基础上,并参考现有的实际效果较好的评级方法,在征求了相关专家的意见后,本文选择以下10个指标构成评价指标体系:
主营业务增长(%),净利增长(%),股东权益增长,每股净资产(元),每股未分配利润(元),每股资本公积(元),每股现金流量(元),净资产收益率,每股收益(元),主营业务利润率共10个指标。
首先对股票的当期数据进行计算,得到其分值。这里我们以2003年的数据作为当期数据。这个结果将作为ANN的输入因素,是一个可测的因素。
然后对样本中各支股票的长期数据进行评价。本文选择1998~2002五年的年报数据综合进行评价。评级结果用{a,b,c,d}来表示{优,良,中,劣}四级。将评级结果作为神经网络的输出因素,是一个不可测因素。
经计算后所得的数据如表1(表略,见原文,下同)所示。
(2)利用信息扩散的原理对输入输出因素进行优化处理。
表1中U列的最大值为8.50,最小值为4.30。综合考虑计算的工作量及信息扩散过程中信息传递的准确性,故选取15个点作为输入因素的控制状态点,步长为0.3。则控制状态集为:
同理可求得用于ANN训练的4个样本。
(3)用于学习的ANN具有15个输入节点,4个输出节点。根据经验,选择ANN的隐层数为2,第一个隐层的节点数为7,第二个隐层的节点数为5。将这4个样本对神经网络进行训练。本文采用Matlab 6.1作为编程工具,matlab 6.1中的神经网络工具箱包括多个用于神经网络初始,训练,仿真的函数,利用这些函数和Matlab提供的基本命令可以方便、快捷地进行神经网络的设计,完成复杂的工作[12]。本文所设计的ANN的学习步长为η=0.8,惯量系数。α=0.6,期望误差ε=0.01。经过3071次训练,可使误差小于期望值,从而完成网络的训练。
(4)在完成了网络的训练后,就可以用该ANN来进行股票级别的识别。利用被评价股票的当前指标来求得,将值扩散到ANN的15个控制点上,将所得的分布作为ANN的输入,进行训练后即可求得网络的输出。输出的峰值即为该支股票的级别。
本文在训练样本以外随机选取了五支股票进行评级,分别为1号、2号、…、5号。根据其2003年年报数据,计算其分值分别为6.2,6.9,5.5,4.9,6.7。代入ANN进行训练,得到评级结果分别为:b,b,c,c,b。也即1号、2号、5号股票较优,从评级结果可看出,该结果反应了股票的长期发展趋势,使股票的当期市场表现与长期趋势趋于一致,该评级结果,将为投资者提供了比较客观的决策支持投资建议。
四、结束语
传统的股票评级方法在确定指标体系中各评价因素的权重上带有一定的主观成分,所得的结果难以反映客观实际,并且受市场波动的影响较大,因此其评级结果与实际情况有一定的偏差。
本方法是在传统评级方法的基础上,利用信息扩散原理对传统评级方法的结果进行优化处理,将处理后的结果作为ANN训练样本的输入输出因素。经过训练后的ANN就可以对股票进行实时评级。通过本方法得到的股票评级结果能更好的反应客观实际,因此具有较好的投资指导意义。
本方法使对股票的当期市场表现评价与长期趋势趋于一致,减少了市场波动带来的影响,但对于异常数据及有效的市场变化则反应不足,这个问题将是今后进一步研究的方向。
标签:股票论文; 人工神经网络论文; bp神经网络算法论文;