基于分形插值与机器学习模型的股指分析和预测*
朱 婷, 马 洁, 王宏勇
(南京财经大学 应用数学学院,江苏 南京 210023)
摘 要: 股票市场预测一直是金融市场分析中的热点和难点,一些传统的预测模型很难对股票市场做出有效的预测;针对这一问题,将分形插值方法与机器学习算法相结合,提出了分形插值与SVM以及分形插值与BP神经网络两种混合模型;所提的混合模型利用机器学习算法首先计算出分形插值所需要的插值点,然后建立分形插值外推模型对所需其他值进行预测;实证结果发现两个混合模型的预测效果均比单独使用分形插值模型预测效果更佳, 预测精度更高;因此分形插值方法与机器学习算法相结合所得到的混合模型,能较好地预测诸如股票市场指数等非平稳金融时间序列。
关键词: 分形插值;SVM;BP神经网络;股指序列;预测
0 引 言
股票市场是金融市场的重要组成部分,股票价格的波动一直是市场监管部门和投资者关注的焦点。揭示股票市场的波动特征,预测市场的变化趋势是金融市场分析中的重要课题。然而,许多研究已表明,股票市场是一个复杂的非线性动态系统,一些传统的预测方法很难对其做出有效的预测。
Mandelbrot[1]发现股票价格序列不服从正态分布,呈现出尖峰胖尾的特征,因此提出用分形理论来研究股票市场的收益问题。此后,分形理论与方法被广泛用来分析和预测股票市场[2-5]。作为分形分析方法的一个重要内容,分形插值法[6]已成为拟合与逼近非平稳数据和非光滑曲线的有力工具。越来越多的学者尝试运用分形插值理论模型预测金融和经济数据。如王宏勇等[7]基于分形插值模型和R/S分析法研究上证综指日收盘数据的变化规律和结构特征,预测股指短期的变化趋势。Zhai[8]将分形插值法与分形自相似理论相结合预测电力负荷数据, 结果显示这种预测方法具有精度高、插值点少和便于应用的优势。然而,值得指出的是,在利用分形插值法预测数据时,分形插值迭代函数系的纵向尺度因子对数据拟合与预测的效果具有决定性影响,因此,如何确定纵向尺度因子的值是建立分形插值预测模型的关键之一。此外,在利用分形插值模型进行预测时,常常需要根据经验估计,预先给出最后一个预测值,然后再利用插值法对其他点进行预测,但由于受到经验估计值的影响,预测值的精准性难以保证。近年来,支持向量机 (SVM) 和BP神经网络等机器学习算法越来越多地被应用于解决各类预测问题特别是股票市场的预测[9-14]。但股票市场数据常常表现出非平稳性、非高斯性和非整数维等特征,使得神经网络模型在学习模式上有一定的局限性。另外,SVM模型的预测精度容易受到预测数据规模的影响,当预测的数据量大时,SVM将需要较大的运算时间,承受误差累积的风险。因此,一些学者综合利用多种预测方法的优点,形成混合预测模型,以提高预测效能[15-16]。
教师指导学生阅读教科书42页“对遗传物质的早期推测”相关内容,并展示“染色体、蛋白质和DNA”示意图,带领学生一起分析20世纪20年代对生物大分子蛋白质、DNA的研究现状:当时人们已经知道蛋白质分子结构特点使其具有信息性,而对DNA分子结构尚未清晰了解,从而提出假说——蛋白质是遗传物质。
尝试将分形插值方法与机器学习方法相结合,形成分形插值与机器学习的混合模型,用于分析和预测中国股票市场。主要思想是利用机器学习算法首先预测出分形插值模型所需要的插值点,取代之前通过经验估计给出的插值点,减小了预测误差,然后建立分形插值外推模型对其他值进行预测。最后,分别利用分形插值模型、分形插值与SVM混合模型、分形插值与BP神经网络混合模型对深证成分股指日收盘数据进行预测,并将3种方法得出的预测结果进行对比分析。结果表明,两种混合模型的预测效果均比单独使用分形插值模型预测的效果更好,预测精度更高。
2 预测模型
2.1 分形插值模型
给定区间I =[a ,b ]及其一个划分Δ :a =x 0<x 1<…<x N =b ,{y 0,y 1,…,y N }为一组实数。分形插值法使用分形插值函数作为拟合或插值数据的工具,其本质就是构造一个迭代函数系,使其吸引子就是分形插值函数的图像,且该图像穿过给定的数据集。对于仿射变换:
(1)
若|a i |<1且|d i |<1,则存在某个度量,使得ω i 在此度量下是压缩映射。 若上述仿射变换满足端点条件:
i =1,2,…,N ,
(2)
由式(1)、式(2)可得:
(3)
其中自由变量d i 满足条件|d i |<1,称d i 为纵向尺度因子。根据分形插值理论,若且插值点不共线,则分形插值函数图像的分形维数D 满足方程当给定且纵向尺度因子d i 确定时,可由方程组(3)求得相应的系数a i ,e i ,c i ,g i ,从而一个仿射迭代函数系被确定。 在仿射迭代函数系中,纵向尺度因子d i 对分形插值函数的形态有着决定性的影响, 因此合理地确定d i 的值是建立仿射分形插值模型的关键。采用文献[17]中提出的计算d i 的新方法,确定d i 的值。
3.传统的电力系统处理技术,具有准确率不高,设备的工作效率相对较低,数据库无法实现设备的自动监控等很多不足,电力自动化系统在电力工程中的应用,使得传统设备运行下的很多电力系统问题都得以解决。并在软件的开发与封装方面也具有深远影响。对软件工程带来了巨大的变革。该技术在对象技术和主动功能的支持方面占据着绝对的优势。主动对象数据库技术被广泛应用干电力系统的自动化监控方面。有望实现电力系统自动监视与控制的更加复杂的功能以及对监控系统中触发子和对象的函数功能的进一步研究。
其中
从表3可见,由分形插值与SVM混合模型预测出2017-12-29的日收盘数据明显比经验估计值更接近于真实值,在此基础上使用分形插值法得出的其他预测值的精度也有所提高。
d jmax=max (Q j-1 ,Y l ,Y l+1 ,…,Y l+n ,Q j )
d jmin=min (Q j -1,Y l ,Y l+1 ,…,Y l+n ,Q j )
则纵向尺度因子d j ,j =1,2,…,k ,的值计算如下:
莫莉抬脚又要踢的时候,克里斯蒂娜哀号了一声:“住手!”她伸出一只手,“住手!我……”然后咳了几声,“我投降。"
(4)
从表1可见,日收盘数据的偏度和峰度分别为0.926和4.1479,不满足正态分布条件下偏度和峰度分别为0和3的标准,J-B检验统计量也远远大于1%显著性水平下的临界值,因此,拒绝了正态分布的原假设。为了检验深证成指日收盘价序列是否具有分形特征,对这段时间内的日收盘数据进行R/S分析。图3为深证成指的R/S分析结果,其Hurst指数为H =0.672 98,因为该Hurst指数大于随机游走状态下的Hurst指数值0.5,所以可知深证成指的日收盘数据时间序列是一个具有长程相关性的分形时间序列,故可用分形分析的方法对其进行预测。
2.2 分形插值与SVM混合预测模型
SVM学习模型[18]的基本思想是在样本空间中,基于训练集寻找一个超平面将不同类别的样本数据分开。 设训练样本集为:{(x i ,y i ),i =1,2,…,l },x i ∈R d ,y i ∈{-1,1},则回归模型为f (x )=ω Tx +b ,其中ω 和b 是模型的参数,该模型对应的优化问题为
(5)
对(5)式的每条约束加上拉格朗日乘子α i ≥0,则问题的拉格朗日函数可写为
由图9看到,最大应力主要集中在安装孔附近,其值为20.6 MPa,小于材料的许用应力.因此当板厚选择10 mm时,满足强度要求.
在教学《葡萄沟》时,我抓住题目问学生:葡萄沟是个怎样的地方呢?通过初读课文,学生一下子就找到葡萄沟真是个好地方。以此为突破口,再去读读找找,从哪些地方看出葡萄沟是个好地方?根据这一条主线来研读,深入体会葡萄沟盛产葡萄的美好:葡萄树枝叶茂密,葡萄五光十色,葡萄干颜色鲜,味道甜。更重要的是体会到葡萄沟的人们热情好客。有几个学生演起了维吾尔族人民热情招待客人的情景,把课堂推向了高潮。
(6)
其中α =(α 1,α 2,…,α l ).令L (ω ,b ,a )对ω 和b 的偏导为零, 并通过计算消去ω 和b ,可将二次规划问题转换为对偶问题:
其中C 为惩罚参数。 在求解上述非线性问题时涉及计算φ (x i )Tφ (x j ),这是样本x i 与x j 映射到特征空间之后的内积。 由于特征空间的维数可能很高甚至是无穷维,因此将内积替换为核函数K ,即φ (x i )Tφ (x j )=K (x i ,x j )。 则得最优超平面决策函数:
求解此对偶问题可得最优超平面决策函数:
(7)
然而在实际研究中,原始样本可能并不是线性可分的,需要通过非线性映射φ 将样本数据x i 映射到高维特征空间中,转化为线性可分,然后再使用线性回归。 这样,上述内容可扩展到非线性情况:
事业单位财务管理活动在开展中必然会面临一定风险。修订过的预算法实施后,事业单位财务在管理上进行了一定程度的调整,财务管理内外部环境同时出现变化,很容易增加事业单位财务管理风险系数。财务风险本身具有不可被完全消除的特性,很多事业单位在发展中并没有关注财务风险防控事宜,埋下了很多财务风险隐患。即使财务管理中相关风险的防控十分重要,但事业单位之前对财务管理风险防控不够重视,预算法实施后,再进行财务风险防控与应对的难度不断增加。例如事业单位财务管理活动在开展上要具有一定的连续性和系统性,但为了更好迎合预算法的相关要求,必然要在财务管理形式与内容上进行调整。
(8)
在预测模型中,惩罚参数C 和核函数K 的取值会直接影响预测模型的精度,选择高斯核函数并在LIBSVM仿真平台上实现SVM算法。
在知识经济时代,知识型员工与普通员工的价值贡献差异很大,对回报的渴望也相差很大。物质待遇虽是低层次需求,但它已是一个人社会声望的标志,也是一个人所属于什么类型阶层的区分标准,因此物质水平的高低已经变成了一种成就层次上的满足。与其他员工相比,知识型员工考虑的更多的是个人职业规划的发展所带来的成就感和价值感,并需要通过合理公平的报酬体现出来。
下面建立分形插值与SVM的混合预测模型。 假设已知样本数据{(X i ,Y i ),i =0,1,…,m },所选插值点为{(P j ,Q j ),j =0,1,…,k },k <m ,且已算出d j (j =1,2,…,k )。 现需要预测未来几日数据{(X i ,Y i ),i =m +1,m +2,…,m +r }。
为了利用SVM算法预测下一个插值点(P 61,Q 61)(2017-12-29的收盘数据),适当增加训练样本数以提高预测精度。 从2003-01-02—2017-12-29,每隔3 d选取一个数据,最终得到1 215个数据,以最后1 d(2017-12-29)的日收盘数据作为预测数据。 利用Matlab和LIBSVM进行参数寻优与建模,核函数与惩罚参数的取值范围均为[2-4,24]。
2.3 分形插值与BP神经网络混合预测模型
BP神经网络是一种按误差反向传播训练的多层前馈网络,算法的基本思想是利用梯度搜索技术,使网络的实际输出值和期望输出值的误差均方差达到最小。BP神经网络包括三大部分:输入层、隐含层和输出层,其中隐含层可以由多层神经元共同组成。图1展示了BP神经网络不同层各节点之间的关系。
图1 3层BP网络结构图
Fig.1 Structure of three-layer BP network
在BP神经网络算法里,信号前向传播过程中隐含层第i 个神经元的输出为
其中,为输入层第i 个神经元到隐含层第j 个神经元的权值,x i 为输入层第i 个输入值,b 1j 为隐含层第j 个神经元的偏置。
(一)在实际工作需要中寻找课题,即提出问题、发现问题。爱因斯坦说:“提出一个问题,往往比解决一个问题更重要。”提出问题是开展研究的基础,从教育教学中遇到的疑难点寻找,如教师在教学情境中教师与学生、学生与学生等冲突与对立问题,教师关注学生的发展,需要做到关注全体发展与关注个体发展的结合等很多疑难问题,经常都会遇到,并且没有解决问题的现成模式可借鉴。因此,要求教师在日常教学中要有较强的问题意识,积累经验,在行动研究过程中,逐渐找到有用的对策,捕捉主要问题,选定课题。
输出层第l 个神经元的输出为
其中为隐含层第j 个神经元到输出层第l 个神经元的权值,b 2l 为输出层第l 个神经元的偏置。
如果在输出层不能得到期望的输出,则转入反向传播。将误差信号沿原来的连接通路返回,通过修改各神经元的权值和阈值,使得误差信号最小。
下面将分形插值与BP神经网络相结合,构建一个混合预测模型。 假设已知样本数据{(X i ,Y i ),i =0,1,…,m },所选插值点为{(P j ,Q j ),j =0,1,…,k },k <m ,且已算出d j (j =1,2,…,k ),现需要预测未来几日数据{(X i ,Y i ),i =m +1,m +2,…,m +r }。
所谓分形插值与BP神经网络混合模型,即先利用上述BP神经网络算法求出下一个插值点(P k +1,Q k +1),并使用式(4)算出纵向尺度因子d k +1,然后再利用(P k +1,Q k +1)和d k +1构建一个新的迭代函数系进行分形插值。 最后根据分形插值模型得到相邻插值点(P k ,Q k )与(P K +1,Q k +1)之间所有的数据{(X i ,Y i ),i =m +1,m +2,…,m +l },且(P k +1,Q k +1)=(X m +l ,Y m +l ),l r 。 按此步骤继续,直至得出所有需要预测的数据{(X i ,Y i ),i =m +1,m +2,…,m +r }。
3 深证成指序列的分析与预测
选取深证成指2007-01-04—2018-03-07共2 718个日收盘数据作为分析对象(数据来源于Wind资讯)。图2是深证成指在这段时间内日收盘指数的原始数据图。
图2 深证成指日收盘指数的原始数据图
Fig.2 The original data of the Shenzhen stock exchange index
从图2可看出,深证成指日收盘指数在样本区间内波动较大。为了分析深证成指日收盘指数的波动特征,下面对其进行正态性检验,结果如表1所示:
表1 深证成指日收盘指数基本统计量描述
Table 1 Description of the basic statistics of the Shenzhen stock exchange index
在利用分形插值模型对股指时间序列进行分析和预测时,先按照上面的方法从序列中选取插值点,再由式(4)计算纵向尺度因子,最后根据式(1)-式(3)便可建立一个生成分形插值模型的仿射迭代函数系。
图3 深证成指的R/S分析结果
Fig.3 The R/S analysis results of the Shenzhen stock exchange index
下面选取深证成指2017-01-03—2017-12-29日共244个日收盘数据作为分形插值研究对象,对所有数据进行间隔为3的等距分割,选出插值点,共得到61个插值点。选取前60个插值点作为训练样本,最后一个插值点以及该插值区间内的3个点作为预测数据。根据式(4)计算纵向尺度因子,建立分形插值模型对前240个日收盘数据进行插值拟合。图4给出了分形插值的拟合结果。
图4 深证成指2017-01-03—2017-12-25的分形插值拟合图
Fig.4 Fractal interpolation fittings from January 3, 2017 to December 25, 2017
从图4可看出,分形插值对深证成指日收盘数据的拟合精度较高,表明模型能较好地描述深证成指日收盘数据的变化趋势。
接下来,分别采用分形插值模型、分形插值与SVM混合模型和分形插值与BP神经网络混合模型预测最后4 d(2017-12-26—2017-12-29)的日收盘数据,并比较这3种方法的预测效果。
3.1 分形插值模型的预测结果
利用分形插值的外推功能对最后4个交易日的日收盘数据进行预测。 将前60个插值样本点记为{(P i ,Q i ),i =1,2,…,60}, 样本点集的分形插值迭代函数系可以应用式(1)-式(4)确定。 将定义在[P 1,P 60]上的分形插值函数f (x )的定义域推广到[P 1,P 61]上,以预测f (x )在[P 60,P 61]上的值。 设Q 61对应于时间P 61时的股价,它的值可根据股票价格的拟周期性以及统计自相似性预先给出一个经验估计。 因此,在区域[P 60,P 61]R 上定义一个仿射变换
ω 61(x ,y )=(L 61(x ),F 61(x ,y ))
使得
对于数据{(X i ,Y i ),i =0,1,…,m },从中等距选取插值点{(P j ,Q j ),j =0,1,…,k },k <m 。假设相邻两个插值点(P j -1,Q j -1)与(P j ,Q j )之间的数据集为
这里d 61的值可根据式(4)求出,将ω 61与之前的ω i ,i =1,2,…,60,联合在一起,构成一个新的迭代函数系{R 2;ω i ,i =1,2,…,61},运用确定性算法得到的分形插值曲线,便可用来预测时间段上其他时刻的股指。 表2列出了原始数据与分形插值预测模型的输出结果。
由于股价数据波动大,以及经验估计不可避免的误差,从表2可看出,用分形插值模型得到的预测值与真实值之间存在一定的误差。
表2 原始数据与分形插值预测数据的比较
Table 2 Comparison of original data and fractal interpolation prediction data
3.2 分形插值与SVM混合模型的预测结果
所谓分形插值与SVM混合模型, 即先利用上述SVM算法求出下一个插值点(P k +1,Q k +1),并按照式(4)算出纵向尺度因子d k +1,然后再利用(P k +1,Q k +1)和d k +1构建一个新的迭代函数系进行分形插值,这样就能在很大程度上减小了以往经验估计下一个插值点所产生的误差。 最后,通过分形插值模型得到两个相邻插值点(P k ,Q k )与(P K +1,Q k +1)之间所有数据{(X i ,Y i ),i =m +1,m +2,…,m +l }的值, 且(P k +1,Q k +1)=(X m +l ,Y m +l ),l ≤r 。 按此步骤继续,直至得出所有需要预测的数据{(X i ,Y i ),i =m +1,m +2,…,m +r }。
通过SVM模型预测得到2017-12-29的日收盘数据为1 104 6.16,再根据式(4)计算出插值区间2017-12-26—2017-12-29的纵向尺度因子d 61,在此基础上再利用分形插值模型就可以预测出2017-12-26—2017-12-29期间的日收盘数据。 表3列出了原始数据与预测数据的比较结果。
表3 原始数据和分形插值与SVM混合模型预测数据的比较
Table 3 Comparison of the original data and the prediction data of fractal interpolation with SVM hybrid model
这些数据点之间的高度差记为:d j0 =Y l -Q j -1,d j1 =Y l+1 -Y l ,…,d j,n +1=Q j -Y l+n .记:
3. 3分形插值与 BP神经网络混合模型的预测结果
类似于分形插值与SVM的预测过程,为了利用BP神经网络算法预测下一插值点(P 61,Q 61)(2017-12-29的日收盘数据),对2003-01-02—2017-12-29每隔3 d选取一个数据。最终得到1 215个数据,以最后1 d(2017-12-29)的日收盘数据作为预测数据。 利用Matlab进行参数寻优与建模,图5给出了最终拟合优度结果R =0.975 94。 BP神经网络算法训练样本的回归拟合结果由图6给出。 从图6中可以看出,模型参数寻优结果良好,具有较好的拟合效果。
中国海油海外勘探布局特点:一是集中在海域,以海域勘探为主;二是以美国墨西哥湾、南美圭亚那、巴西为核心勘探区域,同时注重非洲尼日利亚及塞内加尔等周边的勘探;三是紧密关注勘探热点,圭亚那这一炙手可热的热点区域是中国海油并购尼克森能源所获得的意外惊喜,在巴西成功进入桑托斯盆地Libra深水项目、获取592区块100%权益,进入ACF Oeste区块则是中国海油力图抓住巴西深水潜力机会的表现,进入塞内加尔,是其对勘探热点感兴趣的一个标注;四是主要在政治稳定、投资环境良好国家开展业务,中东、北非等动荡地区资产明显单薄。
图5 深证成指2017-01-03—2017-12-29插值拟合优度
Fig.5 Interpolation goodness from January 3, 2017 to December 29, 2017
图6 BP算法训练样本预测拟合
Fig.6 Fitting of BP algorithm training sample prediction
通过运用BP神经网络模型预测得到2017-12-29的日收盘数据为11 042.08,再根据式(4)计算出插值区间2017-12-26—2017-12-29的纵向尺度因子d 61,由此建立分形插值模型,就可预测出2017-12-26—2017-12-29的日收盘数据。表4列出了原始数据与预测数据的比较结果。
表4 原始数据和分形插值与BP神经网络混合模型预测数据的比较
Table 4 Comparison of the original data and the forecast data of fractal interpolation with BP neural network hybrid model
从表4可见,BP神经网络通过训练一部分样本达到一定的优度,再进行预测,就可得到较为理想的预测效果。
目前,网上购书已经成为流行趋势,纸质书电子书一应俱全。在这种形势下,我们可以从国内的各个较有影响力的网上购书平台找寻有说服力的参考数据。比如京东网上书店的原版外文图书销售排行榜。我们可以通过这个排行榜观察读者的阅读喜好,补充馆藏外文资源。
图7更直观地展示了上述3种模型的预测效果。从图7可看出,将分形插值与SVM或者BP神经网络相结合的混合模型的预测结果要明显优于直接使用分形插值模型的预测结果。采用3种常用的度量误差,分别是均方根相对误差(RMSRE)、均方根误差(RMSE)和均值绝对误差(MAE)来度量这些模型的预测误差大小。这些误差的定义如下:
其中,y i 是原始数据,是预测数据,N 是数据个数。 表5给出了3种模型的预测误差的结果比较。 如表5所示,两种混合模型的预测精度均高于单独使用分形插值模型的预测精度。
图7 3种预测方法输出结果与原始数据的比较
Fig.7 Comparison of the output of the three prediction methods and the original data
表5 3种预测模型的误差比较
Table 5 Error comparison of three prediction models
4 结 语
为了预测股票市场指数,首先建立了分形插值模型,然后将分形插值法分别与SVM算法和BP神经网络算法相结合,形成了混合预测模型,最后将3种预测模型分别应用于深证成指日收盘数据的分析和预测。在实证分析中,通过对样本数据进行正态性检验,发现日收盘数据序列不是正态分布的序列,而是具有长程相关关系的分形时间序列,因而具有可预测性。利用分形插值模型对深证成指2017-01-03—2017-12-25期间的日收盘数据进行分形插值拟合,获得了良好的拟合效果。在此基础上,分别运用3种预测模型对深证成指2017-12-26—2017-12-29期间的日收盘数据进行预测,并比较预测效果。结果发现,两个混合模型的预测效果比单独使用分形插值模型预测效果更佳,预测精度更高。结果表明,分形插值方法与机器学习算法相结合所得到的混合模型,能较好地预测诸如股票市场指数等非平稳金融时间序列。
“东西”最初用来表示方位,是因为一开始人类社会处于比较落后的状态,接触到的是自然界中最简单的事物,太阳从东边升起,在西边落下。后来社会发展一些了,人们开始计算了某个范围的距离,于是“东西”就用来表示一段距离。再后来社会再发展,出现了繁华的“东京”和“西京”,人们常去两个地方买货物。从语言的经济原则来看,人们在选取词语时都有求简心理,所以人们不说“去东京买”或“去西京买”,而说“买东”和“买西”,再后来直接说“买东西”,于是衍生出了“东西”新的义项,那就是“货物”。
参考文献( References):
[1] MANDELBROT B B.New Methods in Statistical Economics [J].Journal of Political Economy, 1963, 71(5): 421—440
[2] YUAN Y, ZHUANG X T, JIN X.Measuring Multifractality of Stock Market Price Fluctuation Using Multifractal Detrented Fluctuation Analysis [J].Physica A, 2009, 388: 2189—2197
[3] WANG HY, WANG TT.Multifractal Analysis of The Chinese Stock, Bond and Fund Markets, Physica A, 2018, 512: 280—292
[4] 张晶, 王宏勇.股指时间序列的分形分析及预测[J].南京财经大学学报, 2013(5): 75—80
ZHANG J, WANG H Y.Fractal Analysis and Prediction of Stock Index Time Series[J].Journal of Nanjing University of Finance and Economics, 2013(5): 75—80(in Chinese)
[5] 王明涛.基于R/S法分析中国股票市场的非线性特征[J].预测, 2002, 21(3): 42—45
WANG M T.Analysis of Nonlinear Characteristics of Chinese Stock Market Based on R/S Method [J].Prediction, 2002, 21(3): 42—45(in Chinese)
[6] BARNSLEY M F.Fractal Functions and Interpolation [J].Constructive Approximation, 1986(2):303—329
[7] 王宏勇, 张青格.股指时间序列的分形插值模型与R/S分析[J].统计与信息论坛, 2011, 26(8): 23—27
WANG H Y, ZHANG Q G.Fractal Interpolation Model and R/S Analysis of Stock Index Time Series[J].Journal of Statistics and Information, 2011, 26(8): 23—27(in Chinese)
[8] ZHAI M Y.A New Method for Short-term Load Forecasting Based on Fractal International and Wave Analysis [J].Electric Power & Energy Systems, 2015, 69(1): 241—245
[9] INCE H, TRAFALIS T B.Short Term Forecasting with Support Vector Machines and Application to Stock Price Prediction [J].International Journal of General Systems, 2008, 37(6): 677—687
[10]KIM K.Financial Time Series Forecasting Using Support Vector Machines [J].Neurocomputing, 2003,55(7): 307—319
[11]赛英, 张凤廷, 张涛.基于支持向量机的中国股指期货回归预测研究[J].中国管理科学, 2013(3): 35—39
SAI Y, ZHANG F T, ZHANG T.Research on Regression Prediction of China's Stock Index Futures Based on Support Vector Machine[J].CMS, 2013(3): 35—39(in Chinese)
[12]孙晨, 李阳, 李晓戈.基于布谷鸟算法优化BP神经网络模型的股价预测[J].计算机应用与软件, 2016, 33(2): 276—279
SUN C, LI Y, LI X G.Stock Price Prediction Based on Cuckoo Algorithm Optimized BP Neural Network Model[J].Journal of Computer Applications and Software, 2016, 33(2): 276—279(in Chinese)
[13]黄卿, 谢合亮.机器学习方法在股指期货预测中的应用研究——基于BP神经网络、SVM和XGBoost的比较分析[J].数学的实践与认识, 2018, 48(8): 297—307
HUANG Q, XIE H L.Application Research of Machine Learning Method in Stock Index Futures Forecast:Based on Comparative Analysis of BP Neural Network, SVM and XGBoost[J].Mathematics in Practice and Theory, 2018, 48(8): 297 —307(in Chinese)
[14]BISOI R, DASH P K.A Hybrid Evolutionary Dynamic Neural Network for Stock Market Trend Analysis and Prediction Using Unscented Kalman Filter [J].Applied Soft Computing, 2014, 19(2): 41—56
[15]KARA Y, BOYACIOGLU M A, BAYKAN O K.Predicting Direction of Stock Price Index Movement Using Artificial Neural Networks and Support Vector Machines: the Sample of the Istanbul Stock Exchange [J].Expert Systems with Applications, 2011, 38(11): 5311—5319
[16]黎红, 王宏勇.基于改进的分形插值与SVM的股指预测模型[J].吉首大学学报(自然科学版), 2018, 39(3): 14—19
LI H, WANG H Y.Improved Fractal Interpolation and SVM Stock Index Prediction Model[J].Journal of Jishou University(Natural Science Edition), 2018, 39(3): 14—19(in Chinese)
[17]周志华.机器学习[M].北京: 清华大学出版社, 2016
ZHOU Z H.Machine Learning [M].Beijing: Tsinghua University Press, 2016(in Chinese)
Analysis and Forecast of Stock Indexes Based on Fractal Interpolation and Machine Learning Models
ZHU Ting ,MA Jie ,WANG Hong -yong
(School of Applied Mathematics, Nanjing University of Finance and Economics, Jiangsu Nanjing 210023, China)
Abstract :Stock market forecast is always a hot and difficult point in financial market analysis.Some traditional forecast models are difficult to predict the stock market effectively.In order to solve this problem, two hybrid models of fractal interpolation and SVM, as well as fractal interpolation and BP neural network are proposed by combining fractal interpolation method with machine learning algorithm.The proposed hybrid models firstly use machine learning algorithm to calculate the interpolation points needed for fractal interpolation, and then build a fractal interpolation extrapolation model to predict other values.The empirical results show that the prediction effect of the two hybrid models is better than that of the fractal interpolation model alone, and the prediction accuracy is higher.Therefore, the hybrid model obtained by the combination of fractal interpolation method and machine learning algorithm can better predict non-stationary financial time series such as stock market index.
Key words :fractal interpolation; SVM; BP neural network; stock index series; prediction
中图分类号: F224. 9, F830. 9
文献标志码: A
文章编号: 1672-058X( 2019) 06-0057-08
doi: 10.16055/j.issn.1672-058X.2019.0006.010
收稿日期: 2019-02-19;修回日期: 2019-03-05.
* 基金项目: 教育部人文社科规划基金项目(12YJAZH020);江苏省研究生科研与实践创新计划项目(KYCX19_1632).
作者简介: 朱婷(1995— ),女,江苏靖江人,硕士研究生,从事分形理论与金融应用研究.
责任编辑: 田 静
引用本文 / Cite this paper:
朱婷,马洁,王宏勇.基于分形插值与机器学习模型的股指分析和预测[J].重庆工商大学学报(自然科学版),2019,36(6):57—64
今年京城及周边京津冀经济带国家重点基建项目多,到了4季度木材市场需求不减,尤其对俄产原木依赖一直很大。此间从俄罗斯进口的樟子松、落叶松,以及白松等等针叶材,销售状况与前期相比丝毫没有弱化迹象,每周销售的数量与过去的两个月水平相当,市场景气值仍似以往。
ZHU T, MA J, WANG H Y.Analysis and Forecast of Stock Indexes Based on Fractal Interpolation and Machine Learning Models[J].Journal of Chongqing Technology and Business University (Natural Science Edition),2019,36(6):57—64
社交媒体日渐普及,电子商务蓬勃发展,粉丝不仅可以建立起互通有无的社交网络,还积极参与各种商业文化的生产,粉丝进入媒介市场的壁垒被打破。