基于局部均值分解的高频金融数据波动率估计
秦喜文1,冯阳洋1,董小刚1,2,李巧玲1,周红梅1,郭佳静1
(1.长春工业大学数学与统计学院,长春130012;2.吉林大学数学学院,长春130012)
摘要: 为解决高频数据在风险评估中存在的非线性问题,提出了利用局部均值分解方法实现高频数据波动率估计。首先,采用高频模拟数据验证估计方法的可行性;其次,将沪深300指数不同频率收盘价作为研究对象,利用局部均值分解方法估计波动率,计算相对误差统计量。实验结果表明,利用局部均值分解方法可以有效实现高频数据波动率估计和解决高频数据中的非线性问题,随着抽样频率的增加,估计精度逐渐提高。该方法为高频数据波动率非参数估计提供了新的研究思路。
关键词: 高频金融数据;波动率估计;对数收益率;局部均值分解
0 引 言
波动率在金融风险度量等方面的应用十分广泛,且金融高频数据对捕捉股市微观结构噪声有着十分重要的作用。寻找合适的模型进行金融高频数据波动率预测,有利于金融市场的风险管理和制定合理的投资决策。波动率模型主要有3类:1)基于低频日收益数据建模的传统波动率模型;2)基于期权定价模型的隐含波动率;3)基于高频数据的已实现波动测度。由于传统波动率模型已难以适用于以高频数据为背景的建模和预测,为此Andersen等[1]提出了实际波动率(RV:Realized Volatility)作为积分波动率的一个估计,从而使实际波动率在国外金融期货市场研究领域掀起了高频金融数据波动率研究的热潮[2-3]。Gkillas等[4]等研究了印度市场股市已实现波动性和序列相关性的性质,结果表明印度股市的波动性与发达国家的波动性和相关特征具有相似性;Arneric等[5]利用波动率估计方法对欧洲7个新兴市场的有效性进行了研究,并得出了有效的结论。罗嘉雯等[6]构建了具有时变参数和动态方差的贝叶斯异质自回归潜在因子模型,从而提高预测精度,甘小艇等[7]构造了非线性动态规划方程,以解决非确定波动率的期权定价问题。
基于RV及其修正模型的研究基础和深刻的理论背景,秦喜文等[8-9]利用极大重叠离散小波模型对沪深300股指的波动率进行估计,并借助经验模态分解方法研究我国股票市场的分形特征,并在金融高频数据中取得了新的突破;基于高频数据非平稳非线性的特点,希尔伯特-黄变换被多次应用于金融时间序列分析建模领域中[10-11]。由于希尔伯特-黄变换存在过包络、欠包络和模态混叠等缺陷,Jonathan[12]提出具有自适应特点的局部均值分解(LMD:Local Mean Decomposition)算法,并将该方法应用于脑电信号的分析研究中,基于金融高频数据和脑电图信号相同的特性,可以将金融市场的股票收益率看成一系列输入信号。笔者将信息工程领域的LMD方法引入波动率研究中,可以为解决金融高频数据中存在的微观结构噪声和提取数据中的重要特征信息提供参考。
1 研究方法
1.1 局部均值分解
局部均值分解是一种自适应非平稳信号处理算法。对于任意振动信号x(t),局部均值分解算法将x(t)分解为
其中SPFP(t)是一组具有物理意义的SPF分量,uk(t)为一单调趋势函数,并且每个SPF分量都是纯调频信号和包络信号的乘积,局部均值分解步骤如下[13]。
1)筛选出原始信号x(t)的所有局部极值点ni,计算相邻极值点ni和ni+1的平均值mi和包络估计值ai,其中
假设某金融交易在第t个交易日内的第i个观测时间段的收盘价是Pt,i,则日内收益率可表示为[14]
由股价方程可知,股票价格的变化服从对数正态分布。通过该模型可以生成一组正态随机数,从而对股票价格进行模拟运算。
4)用h11(t)除以包络估计函数a11(t)以实现对h11(t)的解调,即
其中t为采样天数,t=1,2,…,125,di为不同抽样频率下每个交易日获得的样本个数。图3为沪深300股指每分钟收盘价。
重复以上过程,直到s1n(t)为纯调频函数,即
6)将分量SPF1(t)从x(t)=中剔除,获得新信号u1(t)并重复以上步骤,直到uk(t)为一个单调函数。最终原始信号x(t)被分解为k个SPF分量与一个趋势函数
5)得到瞬时幅值函数a1(t)和第1个分量SPF1(t)
2.2.2 定量限 据添加回收率试验,在上述色谱条件下咪鲜胺及其代谢物在丝瓜中的最低检出浓度为0.02 mg/kg。
1.2 已实现波动率
2)利用滑动平均法对mi和ai进行平滑处理,得局部均值函数m11(t)和包络估计函数a11(t)。
若金融原生资产在第t个交易日内可获得m个收盘价格,且对数收益率可表示为{rt,1,rt,2,…,rt,m},则已实现波动率被定义为日内收益率的平方和
1.3 波动率估计
图1是股票价格的动态模拟图。该股票价格模拟序列与真实股票价格波动序列类似,均有明显的尖峰现象,且波动剧烈,是一个显著非平稳的时间序列。SPF分量是将瞬时幅值和纯调频信号相乘得到的结果,利用SPF分量可以获得原始信号完整的时频分布信息,用LMD算法对股票价格模拟序列进行分解,分解生成5个SPF分量和1个趋势项,根据式(10)计算得到股票价格波动率,并计算与已实现波动率之间的相对误差。
从图8中可以观察到,老化使材料试样的电阻升高,同时也使试样的波形更加清晰,可见老化提高了材料对正弦信号激振力的敏感度。换言之,材料老化处理后,其准确检测受力的能力得到了提升。本文采取固定滑块的方式,也就是利用摩擦力固定,因此在激振力作用下,滑块的摩擦会产生高频信号干扰。通过低通滤波排除装夹摩擦产生的高频干扰信号,滤波前后复合材料时域波形图的对比见图 9。由于实验需要获取完整的信号进行研究,因此实验过程中未采用任何滤波手段。通过图9可以发现,低通滤波器将摩擦产生的信号过滤,使731 Hz的信号清晰地展现出来。
2 利用局部均值分解方法实现高频数据波动率估计
2.1 模拟分析
下面利用模拟分析验证局部均值分解算法在高频数据波动率估计中的可行性。通过分析历史股票数据的统计规律可知,股票价格S的波动过程可以被称之为几何布朗运动,这是一个被广泛应用于描述股票价格行为的股价方程[15]
其中常数μ、σ分别为股票预期收益率和波动率,t为时间,z为标准布朗运动,d z=ε d t且ε服从标准正态分布。该模型的离散形式为
由伊藤引理,令G=ln S,则d G=dln S=(μ-σ2/2)d t+σd z,由此可获得μ和σ的估计值
3)剔除原始信号x(t)中的局部均值函数m11(t),即
利用股价方程对股票价格进行动态模拟试验,生成30 124个采样间隔为1 min的高频数据,共获得125 d的日内收益率,随后利用LMD算法对股票收益率进行分解,由式(10)求得波动率估计值并与实际波动率进行比较。
北平协和医院,1921年9月8日-1922年2月16日,1922年7月11日-1923年9月8日,1926年7月1日-1927年2月28日。
考察金融资产在某个交易日内的波动率。利用局部均值分解算法对第t个交易日内的m个对数收益率进行分解,分解后的k个SPF分量由幅值函数a(t)和纯调频函数s(t)构成,若对SPF分量进行希尔伯特变换,从SPF分量中解调的幅值可反映信息的波动程度。则第t个交易日的已实现波动率可表示为幅值函数的平方和
图2为股票价格模拟数据经LMD分解后计算得到的波动率与实际波动率之间的相对误差直方图,误差集中范围为2%~6%,且最大误差未超过11%,说明在进行模拟实验中,基于LMD的波动率估计方法在处理股票交易高频数据的波动率时显著有效。
结合式(5)OFDI出口效应的回归结果和式(7)OFDI进口效应的回归结果,我们可以发现浙江省对外直接投资总体上是出口互补型和进口替代型的.OFDI每变化一个单位,浙江省对样本国的出口就增加0.10%单位,浙江省对样本国的进口就减少0.004%单位,出口增加的幅度大于进口减少的幅度,表明浙江省对外直接投资与出口是互补关系,与进口是替代关系,出口互补效应大于进口替代效应.因此,我们得到的主要结论是:从总体上来说浙江省对外直接投资是贸易互补型的.
图1 股票价格动态模拟
Fig.1 Dynamic simulation of stock price
图2 相对误差直方图
Fig.2 Relative error histogram
2.2 实证分析
笔者使用的实证研究数据是沪深300股指期权的抽样间隔为1 min、5 min、15 min及30 min的高频交易数据,选取区间为2018年6月7日-2018年12月7日,共125个交易日,数据来源于同花顺数据库。沪深300股指期货每个交易日共有4 h连续竞价时间,且交易时间为上午9:15~11:30,下午13:00~15:15,最后交易日时间为上午9:15~11:30,下午13:00~15:00,所以除最后交易日外,沪深300股指期货的开盘时间比股票市场提早15 min,而收盘时间比股票市场晚15 min,这一特性不仅有利于期货市场充分反映股票市场交易信息,而且便于期货投资者利用股指期货管理市场风险。每个交易日以1 min、5 min、15 min、30 min为数据抽样频率,并获得其收盘价,其中1 min的最终样本共有30 125个沪深300股指高频收益率。价格序列记为Pt,di,日收益率rt,di可利用两个相邻的收盘价计算
图3 沪深300股指每分钟收盘价
Fig.3 Closing price per minute of shanghai and shenzhen 300 stock index
谈了几次曹操后,陈留开始追易非了,可易非却不敢接受。倒不是陈留家条件多么好,只是他们在完全不同的环境里长大的。他是小城里的独生子,父母都是丝绸厂里的工人,父亲原是副厂长,工厂倒闭后,他调去了街道办事处,现在是公务员。母亲去了学校,几年前办了内退,现在主要在家打牌、养花、跳跳舞。他能理解易非心里的那块隐痛吗?他不能,就像他看见易非每天省吃俭用辛苦攒钱很不理解一样,他会问:工资月月有,存钱干嘛?问得易非哑口无言。
沪深300股指的时序图表现出强烈的日历效应,有着明显的波动聚集和严重的尖峰现象。沪深指数在对股票市场波动率的研究中,其交易活动活跃且分股代表性好,可以反映金融市场中投资收益情况,对投资者建立投资决策起着至关重要的作用。
对不同抽样频率的沪深300股指期权收益率进行LMD分解,股票价格收益率被分解成多个SPF分量和1个趋势项,每个SPF分量都包含有由包络信号和纯调频信号相乘所得的非负瞬时频率,SPF分量从高频率到低频率依次排列,通过SPF分量可以提取股票价格的能量分布特征。抽样间隔为1 min的沪深300股指期权收益率的各S PF分量如图4所示,其趋势项代表了沪深300股指期权在该时间段的主要走势。
3.印尼苏北先达卫理学校高三学生郑婷云在青年园地之《美好的回忆》——“参加中国南安2008年夏令营活动回忆录”中写道,她在这次夏令营的活动里,已经学到了许多中华传统文化、历史知识。她已下定决心,高中毕业后,一定要到中国深造。虽然2008年的夏令营活动结束了,但是那段美丽的回忆却永远深藏在营员们每个人的心里……(《印尼国际日报》)
图4 沪深300股指每分钟对数收益率的LMD结果
Fig.4 LMD Result of logarithmic return rate per minute of Shanghai and Shenzhen 300 stock index
已实现波动率可以真实反映金融交易市场的波动规律,是一种典型的金融高频数据波动率估计方法。为了反映通过LMD方法进行分解后计算所得的沪深300股指期权收益率的波动率与实际波动率之间的差异程度,笔者将两种情况下波动率的走势进行对比后发现,基于新方法求得的波动率与实际波动率之间的走势相同,且有重叠部分,说明笔者提出的新方法估计精度高,效果较好,可以全面反映外部信息对金融市场的影响。
④Viktor Mayer- Schonberger,Kenneth Cukier,Big Data:A Revolution That Will Transform How We Live,Work,and Think,Houghton Mifflin Harcourt,2013,p.10.
由图6可知,在不同抽样频率下,基于LMD方法所求的波动率与实际波动率的相对误差有着显著的差异。特别地,对于1 min采样间隔,其相对误差都控制在14%以内,相较于5 min、15 min、30 min采样间隔,1 min采样间隔的相对误差最小。抽样间隔为1 min时,大部分样本的相对误差都控制在5%以内,而抽样间隔为5 min的估计结果次之,大部分样本的相对误差都集中在10%以内,利用LMD方法计算的波动率与实际波动率之间的相对误差随着抽样间隔的增大而增大,并且由直方图的尾端可知,越来越大的极端值导致估计误差变大,说明基于LMD的波动率估计对较高频金融数据做波动率估计的精度更高。
图5 沪深300股指每分钟波动率对比
Fig.5 Comparison of the volatility of Shanghai and Shenzhen 300 StockIndex per minute
图6 不同抽样频率的相对误差直方图
Fig.6 Relative error histogram of different sampling frequencies
表1 不同抽样频率的相对误差
Tab.1 Relative errors of different sampling frequencies
相对误差序列的描述性统计分析显示,利用LMD得到的相对误差的各均值、方差、偏度和峰度,1 min抽样间隔的统计结果都是最小的,且均随着抽样时间间隔的增大而增大,特别地,当抽样间隔为30 min时,相对误差的各均值、方差、偏度和峰度均成倍数增加。由此可知基于LMD的波动率估计方法在处理采样频率更高更频繁的金融数据时效果更好,尤其是对抽样间隔为1 min和5 min的数据,其相对误差均值分别为4.24%和6.64%。1 min抽样间隔的峰度绝对值最小,随着抽样间隔的增大,相对误差的尖峰现象变得越来越明显,由偏度均大于零可知,其相对误差均为右偏。
3 结 语
实际波动率作为一种具有丰富内涵的金融高频数据波动率度量工具,在没有复杂的经济计量模型下可以更直接地研究波动率的性质。研究学者在对波动率进行预测时往往没有考虑高频数据的非线性特征,LMD可以自适应地将非平稳非线性时序数据分解成多个具有一定物理意义的单模态信号,在物理工程领域得到了广泛的应用。笔者通过选取不同抽样间隔的沪深300股指期权的收盘价数据,利用LMD实现对不同抽样频率的波动率估计,结果表明,波动率估计精度随着抽样频率的增加逐渐提高,且能解决股票数据的非线性问题。将LMD方法引入金融高频数据波动率非参数估计中,不仅为波动率的估计提供了新的思路,还可以将LMD算法推广到其他高频数据分析领域。
本次研究中,不良反应组患者输血后凝血功能指标均较无不良反应组患者低,组间有明显差异存在;两组患者的血常规指标比对,差异不明显。其可说明为异位妊娠大出血患者开展输血治疗的过程中,不良反应的出现可改变患者的凝血功能,为此在输血治疗前后,医务人员需要加强对患者凝血功能监测的力度,及时掌握患者的身体状况,通过及时有效的干预降低并发症发生率。
参考文献:
[1]ANDERSEN T G,BOLLERSLEV T.Answering the Skeptics:Yes,Standard Volatility Models Do Provide Accurate Forecasts[J].International Economic Review,1998,39(4):885-905.
[2]CORSI F,MITTNIK S,PIGORSCH C,et al.The Volatility of Realized Volatility[J].Econometric Reviews,2008,27(1/3):46-78.
[3]CHRISTOFFERSEN P,FEUNOU B,JACOBS K,et al.The Economic Value of Realized Volatility:Using High-Frequency Returns for Option Valuation[J].Journal of Financial and Quantitative Analysis,2014,49(3):663.
[4]GKILLASK,VORTELINOSD I,SAHA S.The Properties of Realized Volatility and Realized Correlation:Evidence From the Indian Stock Market[J].Physica A:Statistical Mechanics and Its Applications,2017,492:343-359.
[5]ARNERIC J,MATKOVIC'M,SORIC'P.Comparison of Range-Based Volatility Estimators Against Integrated Volatility in European Emerging Markets[J].Finance Research Letters,2019,28:118-124.
[6]罗嘉雯,陈浪南.基于贝叶斯因子模型金融高频波动率预测研究[J].管理科学学报,2017,20(8):13-26.LUO Jiawen,CHEN Langnan.High-Frequency Volatility Forecast of Financial Futures Based on Bayesian Factor Model[J].Journal of Management Sciences in China,2017,20(8):13-26.
[7]甘小艇,徐登国,赵仁庆.非确定波动率下期权定价模型的有限体积法[J].吉林大学学报:理学版,2019,57(4):1-9.GAN Xiaoting,XU Dengguo,ZHAO Renqing.Finite Volume Method for Option Pricing Model with Uncertain Volatility[J].Journal of Jilin University:Science Edition,2019,57(4):1-9.
[8]秦喜文,刘文博,董小刚,等.基于极大重叠离散小波变换的金融高频数据波动率估计[J].吉林大学学报:理学版,2014,52(6):1222-1226.QIN Xiwen,LIU Wenbo,DONG Xiaogang,et al.Volatility Estimation of Financial High Frequency Data Based on Maximum Overlapping Discrete Wavelet Transform[J].Journal of Jilin University:Science Edition,2014,52(6):1222-1226.
[9]秦喜文,周明眉,董小刚,等.基于EMD的中国股票市场分形特征研究 [J].吉林大学学报:信息科学版,2016,34(3):449-454.QIN Xiwen,ZHOU Mingmei,DONG Xiaogang,et al.Research on Fractal Characteristics of Chinese Stock Market Based on EMD[J].Journal of Jilin University:Information Science Edition,2016,34(3):449-454.
[10]HUANG N E,WU M L,QU W.Applications of Hilbert-Huang Transform to Non-Stationary Financial Time Series Analysis[J].Applied Stochastic Models in Business&Industry,2010,19(3):245-268.
[11]孙宇.基于Hilbert-Huang Transform的上证指数波动特征及影响因素分析 [D].广州:广东外语外贸大学金融学院,2016.SUN Yu.Analyzing the Volatility Characteristics and Influence Factors of Shanghai Stock Index Based on Hilbert-Huang Transform[D].Guangzhou:School of Finance,Guangdong University of Foreign Studies,2016.
[12]JONATHAN SSMITH.The Local Mean Decomposition and Its Application to EEG Perception Data[J].Journal of the Royal Society Interface,2005,2(5):443-454.
[13]任达千,杨世锡,吴昭同,等.基于LMD的信号瞬时频率求取方法及实验 [J].浙江大学学报:工学版,2009,43(3):523-528.REN Daqian,YANG Shixi,WU Zhaotong,et al.Instantaneous Frequency Extraction Method and Experiment Based on LMD[J].Journal of Zhejiang University:Engineering Science,2009,43(3):523-528.
[14]西村友作.基于高频数据的中国股市波动率研究[M].北京:对外经济贸易大学出版社,2014.XICUN Youzuo.Research on Volatility of Chinese Stock Market Based on High Frequency Data[M].Beijing:University of International Business and Economics,2014.
[15]张峻华,戴伦,刘文浩.股票价格行为关于几何布朗运动的模拟 基于中国上证综指的实证研究[J].财经界,2014(19):31-33.ZHANG Junhua,DAI Lun,LIU Wenhao.Simulations of Stock Price Behavior on Geometric Brownian Motion:An Empirical Study Based on China's Shanghai Composite Index[J].Money China,2014(19):31-33.
Volatility Estimation of High Frequency Financial Data Based on Local Mean Decomposition
QIN Xiwen1,FENG Yangyang1,DONG Xiaogang1,2,LI Qiaoling1,ZHOU Hongmei1,GUO Jiajing1
(1.School of Mathematics and Statistics,Changchun University of Technology,Changchun 130012,China;2.College of Mathematics,Jilin University,Changchun 130012,China)
Abstract: In order to solve the problem of nonlinearity in high frequency data,the LMD(Local Mean Decomposition)method is proposed to estimate the volatility of high frequency data.Firstly,high-frequency simulation data are used to verify the feasibility of the estimation method.Secondly,taking the closing price of Shanghai and Shenzhen 300 index at different frequencies as the research object,the volatility is estimated by LMD method,and the relative error statistics are calculated.The results show that the LMD method can effectively estimate the volatility of high-frequency data and solve the nonlinear problems in high frequency data.With the increase of sample frequency,the estimation accuracy gradually improves.The method of LMD provides a new idea for non-parametric estimation of volatility in high frequency data.
Key words: high frequency financial data; volatility estimation; logarithmic return rate; local mean decomposition(LMD)
中图分类号: TP202;F830.91
文献标识码: A
文章编号: 1671-5896(2019)06-0596-07
收稿日期: 2019-06-27
基金项目: 国家自然科学基金资助项目(11301036;11226335);吉林省教育厅科研基金资助项目(JJKH20170540KJ)
作者简介: 秦喜文(1979— ),男,吉林梅河口人,长春工业大学教授,博士生导师,主要从事数据分析与统计建模研究,(Tel)86-13504332781(E-mail)qinxiwen@ccut.edu.cn;
通讯作者: 董小刚(1961— ),男,长春人,长春工业大学教授,博士生导师,主要从事高频时间序列研究,(Tel)86-431-85716482(E-mail)dongxiaogang@ccut.edu.cn。
(责任编辑:张洁)
标签:高频金融数据论文; 波动率估计论文; 对数收益率论文; 局部均值分解论文; 长春工业大学数学与统计学院论文; 吉林大学数学学院论文;