金融时间序列预测模型——基于离散小波分解与支持向量回归的研究,本文主要内容关键词为:向量论文,序列论文,分解论文,小波论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F224.0 文献标识码:A
前言
股价预测模型可以分成两大类别,一类是以统计理论为基础的传统预测模型,另一类是人工智能 (artificial intelligence,AI)方法。传统预测模型大多数都是基于概率与统计学基础,要求数据性质符合平稳、线性等假设。但实际上大多数金融或经济时间序列都是非线性且非平稳的数据,违背传统时间序列模型的假设,因此传统模型的应用存在限制(Lee和Chen,2002; Lee et al.,2003)。随着计算技术的发展,以人工智能为基础的预测方法,因为其没有传统统计模型的假设限制,属于非线性的预测模式,而逐渐得到人们的重视。在这些人工智能预测方法中,以统计学习理论为基础、运用结构风险最小化原理的支持向量机(SVM),由于具有全域最佳解及考虑结构风险等特性,越来越受到重视。Vapnik (1997)将SVM的观念推广到分类问题领域,提出了支持向量回归(support vector regression,SVR)模型,目前该方法已广泛用于各种预测问题中。由于金融时间序列预测问题的复杂性,以及支持向量回归在建构预测模式中的优异表现,本研究将使用SVR建构金融时间序列预测模型。
Lee et al.(2003)的研究发现,非现货交易时段如果有重大信息产生,法人机构或拥有特殊信息的交易者(informed traders)往往提前在指数期货市场中进行避险或投机的指数期货交易,此时许多现货收盘后的信息会提前在当日现货收盘后及次日开盘前的期货交易中率先反应出来,因此指数期货的价格是现货指数的良好预测变量。但是,尽管指数期货的价格已包含许多现货价格的信息,如果直接使用,仍可能忽略隐含在内的其它有用信息。为处理这一问题,本研究在股价指数预测议题中,导入离散小波分析(discrete、wavelet decomposing,DWD)对数据进行预处理,再以处理后的数据为输入变量,建立 SVR预测模型,以此提高SVR的预测绩效。
一、研究方法
(一)小波理论与小波分解
1.小波转换与多尺度解析能力
小波转换是利用小波理论中两个不同的函数来分解数据,即父波函数(father wavelet)(φ(t))与母波函数(mother wavelet)(ψ(t))。母波是小波转换最基本的元素,满足母波成立两个条件的任意函数都可以是母波函数。第一个条件称为“认可函数”。任一函数g(t)需要属于空间且
小波转换理论在实际运用中主要着重在其多尺度解析分析能力,即将原始信号以小波转换分成不同尺度(scale)近似值与细部值的能力。对一个原始函数f(t),小波转换的多尺度解析将原函数的整个函数空间分解为多个细部空间及一个近似空间,每个子空间中均存在一小段f(t),这些小段(投影量)提供了对于f(t)细部越来越细微的描述。因此对于一个信号,小波转换通常透过滤波器将它分解为高频与低频部份,进而完成MRA分析。多数时候低频部分最重要,是信号的骨干或基本架构,用以鉴别不同信号;而高频部分则为信号加入一些变化。因此小波转换通常谈到“近似”与“细部”两个名词,“近似”就是通过低频滤波器部份的信号,“细部”就是通过高频滤波器部份的信号。
2.离散小波分解(discrete wavelet decomposition,DWD)与重构
DWD利用小波函数的概念,将原本的函数或讯号分解成许多相关且不损失原始信息的小段,这些分解后的小段是有尺度变化且会随时间衰减的小波,小波重构(wavelet recon-struction)则是将这些分解得到的小段再结合在一起,还原事物原来面貌的过程,小波分解与重构过程如图1所示。
图1 小波分解与重构过程
(二)支持向量回归(support vector regression,SVR)
支持向量机(support vector machine,SVM)是一种机器学习系统,其目的是为了使分类问题不同类的边际之间的距离最大(Vapnik et al.,1997)。
SVR的主要概念与SVM相同,是将一个非线性问题转换成线性问题,不同的是SVR以回归模型表示,SVR模型如下式(Vapnik et al.,1997)所示:
f(x)=(ω·φ(x))+b(4)
其中ω为权重向量,b为偏差(bias),而φ(x)为一核心函数(kernel function)用以解决上述非线性问题,其方法为将非线性的输入数据以非线性的函数转换到高维特征空间中成为线性模式。
传统回归模型的最小二乘法,实际是以平方误差为损失函数对样本数据进行经验风险(empirical risk)最小化求得的。Vapnik et al.(1997)则使用了一个称为ε-insensitivity当作SVR的损失函数,如下式所示:
其中ε参数用来定义ε-insensitivity区域,当预测值落在管状区域内时损失为零,预测值落在区域外时,其损失相当于预测值跟区域边界的差,以宽松变量(slack variables)ζ及ζ*来表示预测值与实际值的不同方向之差:
其中,i=1,…,n为训练样本数;为经验风险;为结构风险,用来预防发生过度学习及缺乏样本外应用普遍性的问题;C为修正系数,用来表示实验风险与结构风险间的平衡,C值越大表示越重视实验风险;反之则表示越重视结构风险。在选定适当的修正系数(C)、管状区域宽度(ε),及满足Mercer' s condition的核心函数(K)后,即可通过拉格朗日函数求得最优解,因此核心函数 (K)、修正系数(C)及管状区域宽度(ε)是SVR模型中最重要的三个参数。
关于核心函数(K),Hsu et al.(2003)及Cherkassky和Ma(2004)认为,放射型函数(Radial basis function)已能解决大部分问题,因此本研究使用RBF做为核心函数。Cherkassky和Ma(2004)指出,—修正系数(C)要能反应训练数据目标值的全距(Range);文献研究表明,管状区域宽度(ε)应与预测值与实际值之差成正比(Vapnik,1999)。
研究表明,在人工智能模型建构过程中,不同的数据可导致不同的最佳参数组合,试误法是最常用以搜寻最佳参数组合的方法之一。本研究结合Cherkassky and Ma(2004)及Hsu et al.(2003)对参数设定的建议,先利用Cherkassky and Ma(2004)方法估计训练数据,以求得SVR参数的建议组合(即C与ε的建议值),之后再在此建议组合中做指数搜寻,以能产生最小均方误差的参数组合为最佳组合。这种方法即可防止仅有单一参数组合建议值的风险,又可降低试误法试误次数过多的缺点。
(三)两阶段模型——结合小波框架与SVR预测模型的构建
本研究提出结合小波框架与支持向量回归的两阶段预测模型,首先利用小波框架为预处理工具,将预测变量分解成数个子序列,第二步再利用子序列数据作为输入变量建构SVR预测模型,所提预测模型的架构图如图2所示。
图2 结合DWF与SVR预测模型
二、数据与模型评价标准
为验证本研究所提出的两阶段模型的预测能力,将以Nikkei 225开盘价格为目标进行预测,并将结果与单纯使用SVR模型及随机漫步方法的预测结果进行比较,以验证其有效性。
Nikkei 225开盘价数据里,采用1999年10月4日至2004年2月17日共5年1000个交易日的数据,将1999年10月4日至2002年10月3目共700笔数据(占全部样本70%)设定为训练数据,另保留 2002年10月4日至2004年2月17日共300笔数据(占全部样本30%)作为测试样本。图3为其走势图。
图3 Nikkei 225开盘价走势图
预测变量选择上,由于期货市场反映市场信息的速度较现货为快,并且前日现货市场收盘后的信息会在次日期货交易市场非现货交易时提前反应,因此本研究选择新加坡衍生商品交易所(Singapore Exchange Derivatives Trading Limited,SGX-DT)的Nikkei 225指数期货开盘价为预测变量。
本研究采用6个指标作为预测绩效的评估标准,这6个指标分别是,均方根误差(root mean squared error,RMSE)、平均绝对离差(mean absolute difference,MAD)、平均绝对百分比误差(mean absolute percentage error,MAPE)、方向对称性(directional symmetry,DS)、上涨趋势正确率(correct up-trend, CP)及下跌趋势正确率(correct down-trend,CD),各指标计算公式如表1所示。这6个指标中,RMSE与MAD是用来衡量预测值与实际值的误差大小;MAPE是用来衡量预测值与实际值的相对误差: RMSE、MAD及MAPE的值越小表明预测值与实际值越接近。DS、CP及CD则是用来衡量预测值的方向与实际方向的正确率,其中DS衡量的是整体的预测正确率,而CP与CD则是分别用来评估上涨及下跌时的预测正确率。
表1 绩效衡量指标及其公式
注:T代表实际值,A代表预测值,N代表资料笔数。
三、实证结果与分析
表2 各基底函数在不同阶层数下测试样本的RMSE值
表2是各基底在最佳参数组合的预测结果,由表中可知除了基底Db3外,本研究所提结合模式的预测值误差指针RMSE、MAD及MAPE值均低于随机漫步模式及单纯SVR模式,并且在预测正确率指标(DS、CD及CP)上以Db1为最好,比随机漫步模型和SVR模型都高,代表在预测误差上结合DWD与 SVR模型能提升SVR的预测绩效;在方向正确率上则以Db1基底最好,Db5基底次之,并且利用Db5基底的结合模型在测试样本中预测值误差指针RMSE最好,是38.9707。而MAD及MAPE则是以Db6基底的结合模型最好。整体而言,在预测误差上,以使用Db6基底函数的结合模式最好,在预测准确率上则以使用Db1基底函数的结合模式为最佳。
表3是各基底在最佳参数组合下的预测绩效。从中可见,在基底Db1及Db2下,结合模型的预测值误差指针RMSE、MAD及MAPE均低于随机漫步模型和单纯的SVR模型,预测正确率指标(DS、CD及CP)上都比随机漫步模型和SVR模型高,可见无论从预测误差或是准确率方面看,所提结合DWF与SVR的两阶段模型,提升SVR的预测绩效。除此之外,从表3还可以发现,使用Db1基底函数的结合模型,其RMSE、MAD及MAPE值均低于利用其它基底函数的结合模型的值,其方向正确率指标DS及CP也是最高,因此使用Db1基底函数且阶层数为4的结合模型,是所有结合模型中的最佳模型。
表3 各预测模型的绩效
四、结论与建议
本研究提出一个结合小波分解(DWD)与支持向量回归(SVR)的两阶段金融时间序列预测模式,先通过小波分解对数据进行预处理以凸显预测变量内含的信息,再使用SVR预测工具构建二阶段预测模型。为了验证所提方法的有效性,以Nikkei 225开盘价作为实证资料,结果显示,无论是从预测误差角度或从预测准确率角度衡量,两阶段结合模型的预测绩效都比单纯使用SVR模型以及随机漫步模型要好。在结合模型中,过多或过少的分解层数都无法得到好的结果,在预测准确度方面以使用Db1基底函数、阶层数为4的模型结果最佳。
整体而言,本研究的贡献在于,采用非现货交易时段的Nikkei 225指数期货开盘价为预测变量,提高了预测准确率;利用DWD小波转换时,使用重构后的子序列为预测变量,不同于传统小波转换使用分解后的子序列作为预测变量;结合小波转换与支持向量回归,建构新的预测模型,有别于过去的类神经网络等预测工具的研究;考虑不同的小波基底函数与不同的阶层数。
上述所使用的Db系列基底函数属于正交小波基底函数(orthogonal wavelet basis),由于不同的小波基底函数有不同的特性,未来研究可以考虑不同的基底函数,如双正交(biorthogonal)基底函数等来进行小波框架的计算;此外,还利用DWD小波转换可以合成的特性,将解析出的细部系数以某种过滤 (filter)准则去除噪声后,合成所有子序列当作输入变量,以建立预测模型。