缺失数据情形下期望收益率和波动率估计的潜变量MCMC抽样方法论文

缺失数据情形下期望收益率和波动率估计的 潜变量 MCMC抽样方法

孙玉东,王 欢

(贵州民族大学 商学院,贵阳 550025)

摘要: 在缺失数据情形下,采用贝叶斯方法研究了Black-Schole模型的参数估计问题.首先,对Black-Schole模型下的风险资产序列进行分析并建立了贝叶斯模型.其次,采用潜变量Gibbs抽样方法获取期望收益率和波动率的估计值.最后,以2018年8月3日的沪深300指数为仿真对象,在无信息先验下进行了实证分析.

关键词: Black-Schole模型;波动率;期望收益率;潜变量Gibbs抽样;贝叶斯后验

在金融实践中,受市场开盘制度的影响许多金融数据存在缺失现象.考察2018年7月2日至2018年8月10日的沪深300指数每日的开盘价,如图1所示,由于周末不开盘的缘故,出现了数据缺失现象,然而这并不是孤立的,国内上交所和深交所各种股票和指数均在周末和节假日闭盘.

受场外市场金融活动的影响,文献[1-2]已经证实仅采用营业时间获取的金融数据进行估计会低估波动率.这提示必须采用缺失值的替补方案进行插值.首先,关于插值最常用的便是均值替代法,由于均值替代法对方差无影响,在进行金融市场波动率估值时同样会低估波动率[3-5],因为这种方法没有考虑插值的不确定性,或者说插值引起的方差增量.其次,采用聚类分析法[6-7],用层次聚类模型预测缺失变量的类型,再以该类型的均值插补,该方法也没有考量递补数值对方差的影响.再次是关联规则法[8-9],关联规则法是聚类分析法的改进,利用关联规则量化各个数据子集,并利用这种关联规则填补缺失数据.最后一种是多重插补方法[10],多重插补的思想来源于贝叶斯估计,认为待插补的值是随机的,先估计出待插补的值,组合不同的噪声形成多组可选插补值集合,之后选取最合适的插补值.

(2)区域地壳稳定性。该区属于地震活动高发区域,勘查区地震动峰值加速度为0.2 g。按照地震动峰值加速度分区与地震基本烈度对照表,确定勘查区属Ⅷ度地震烈度区,地壳稳定性划分属于区域地壳次不稳定区;该区域属于地震活动高发区。

衡量图1所示HS300指数的常用模型是Black-Scholes模型.目前有关Black-Scholes模型参数估计的研究还比较少见.针对高频数据,考虑到时间间隔不固定的问题,文献[1]研究了参数的阔值估计.肖庆宪等在文献[11]中研究了Black-Scholes模型的参数估计问题,给出了期望收益率和波动率的一个无偏估计,并讨论了估计量的性质.文献[12]从期权价格变化的波动率微笑问题出发,对传统的Black-Scholes期权定价模型进行了改进,通过模拟交叉比对,选出相对较优的参数估计方法,并给出合理解释.

遗憾的是,在文献[3-10]进行缺失值插补时,并未考量对Black-Scholes模型的影响,并且相关文献仍限制于经典统计理论下的点估计或者区间估计,有关贝叶斯估计的相关结果还未见文献.

图 1 2018年 7月 2日至 8月 10日的沪深 300指数轨迹
Fig.1 The orbit of the HS 300 index from July 2 to August 10,2018

贝叶斯后验估计方法克服了经典估计理论仅融合样本信息的缺点,可以将期望收益率和波动率的先验信息融入估计结果.丁辉等[13]利用贝叶斯估计方法对误差修正机制转换模型的参数进行了估计.文献[14]也将贝叶斯估计应用到图象处理方面,并提出一种利用后验均值准则推导维纳滤波表达式的方法.本文采用贝叶斯中的潜变量Gibbs抽样方法,在缺失数据情形下,研究了Black-Scholes模型参数估计问题.

1缺失数据下参数估计的潜变量 Gibbs抽样方法

风险资产价格遵循如下Black-Scholes模型时的参数估计:

dS (t )=μS (t )dt +σS (t )dw (t ),

(1)

假设获取了数据x 1,x 2,…,x m ,其余n -m 个观察值x m+1 ,x m+2 ,…,x n 缺失.注意数据服从正态分布N (μ ,σ 2),则似然函数L (μ ,σ 2)为:

(4)在不同掺砂率混合物中,掺砂率越高其单位质量膨润土中所含NaCl的质量越高;又因为掺砂率30%和50%两种混合物试样的强度是由膨润土起主要作用,同时NaCl浓度越高,膨润土试样强度越大.因此,在一定浓度的盐溶液饱和条件下,不同掺砂率混合物试样的掺砂率越高,其强度及内摩擦角越大.

假定Black-Scholes模型已经在时间区间[0,T ]上获取了观测值S (t 0),S (t 1),…,S (t n ),其中T =n ·Δt ,t i =iΔt ,i =0,1,…,n ,容易得到:

lnS (t i )-lnS (t i-1 )=μΔt +σ (w (t i )-w (t i-1 )).

为了方便论述,定义:

并假设x 1,x 2,…,x n 为X (t 1),X (t 2),…,X (t n )的观测值.

其中μ 表示期望收益率,σ 为风险资产的波动率,w (t )为标准Brown运动.由于它可以恰当的描述风险资产价格路径,Black-Scholes模型及其改进模型常常被用于研究期权定价问题[1-3].

注意插补的目的并不是预测单个缺失值,而是预测缺失数据所服从的分布,通过数据的插补,一方面填补了缺失数据的空白,使得原来的缺失数据集成为一个完整数据集,用于克服统计的不便,并且减少因为数据缺失造成的估计偏差,从而若观察到了其余n -m 个值Z =(z m+1 ,z m+2 ,…,z n ),显然:

1.明确规定建设目标。根据经济发展水平和人口数量的差异,在充分利用现有村级办公用房、办公设施的基础上,确定不同的建设标准。加强示范型、标准型便民服务中心创建,到2012年全市502个村级便民服务中心全面完成提档升级,其中三分之二的村(社区)建成示范型便民服务中心,其余达到标准型便民服务中心要求。

数学模型是对现实问题进行数学抽象,用数学语言表达问题,用数学方法构建模型解决问题的素养.数学建模过程主要包括:在实际情境中从数学的视角发现问题、提出问题,分析问题、建立模型,确定参数、计算求解,检验结果、改进模型,最终解决实际问题[5].下面以理科20题为例,分析高考中数学建模素养的考查情况.

z k iid~N (μ ,σ 2),k =m +1,m +2,…,n ,

其中z i ≥a (i =m +1,m +2,…,n ),则全数据似然为:

3)从Y |(μ (t+1) ,x )~χ 2(n +4)抽取y 并令

其中:

弱电网下远端严重电压跌落时逆变器并网失稳机理分析//袁辉,辛焕海,王康,汪震,徐路遥,谢欢//(22):38

这里φ (x )和Φ (x )分别表示标准正态分布N (0,1)的密度函数和累积分布函数.给定μ 的先验分布π (μ ),便可以构造一个在条件分布π (μ |x ,z )和f (z |x ,μ )之间进行迭代抽样的Gibbs样本,它收敛到(μ ,z )的后验分布π (μ ,z |x ).选择杰弗里斯无信息先验容易得到期望收益率μ 和波动率σ 2的联合后验分布:

(2)

从而令则:

令:

注意式(2)可以化为:

在发现染病羊或者疑似染病羊的第一时间,需要将其与羊群进行隔离处理,同时对于羊群活动的所有场地以及使用器具都要进行细致的消毒。消毒过程中可以使用10%石灰乳或3%来苏尔或复合酚,比例控制在1:300-1:200。对于羊群的排泄物要进行堆积发酵处理。对于染病死亡的羊需要进行无害化处理,最大程度减少传染的可能。

于给药后7 d采用改良Garcia法[19]对大鼠进行神经功能学评分,包括自主运动(0~3分)、鼠笼攀援(1~3分)、前肢对称性(0~3分)、活动对称性(0~3分)、触摸触须反应(1~3分)、触摸双侧躯干反应(1~3分)等6项,总分为18分,分数越低表明神经功能损伤越严重。

π (μ ,σ 2|x )=π (μ |σ 2,x )π (σ 2|x ).

注意从而μ |x ,z 的条件后验分布为正态分布,即有:

其中表示x 1,x 2,…,x m 的均值,表示z m+1 ,z m+2 ,…,z n 的均值,而z |x ,θ 的条件后验分布为下列截断正态分布的乘积:

当μ 和z 给定时,σ 2的条件后验分布为:

其中m x 是混合数据x 1,x 2,…,x m ,z m+1 ,z m+2 ,…,z n 的均值,

十、神矮LS—1苹果其他品种及砧木种子 太平洋嘎拉、五代红星、昌红、烟富(1~6号)、南阳富士、高桩短富;Jm7号、八棱海棠、杜梨、山毛桃、山杏等种子。

上式右边是自由度为(n +4)的卡方分布χ 2(n +4)的核,这表明:

因此,该删失数据模型的Gibbs抽样的步骤为:

Step 1 给定初始值μ (0)

Step 2 对于t ,产生样本的做法是:

“Bin”这个词原指酒窖里存储葡萄酒的隔间或者格子,常以不同的序号来标记不同的隔间,因此,澳大利亚很多酒庄都喜欢用“Bin”+序号来为自己的酒款命名。后来,由于易记又顺口,隔间的序号慢慢成为葡萄酒的代号。1959年,Bin 28成为Penfolds Bin系列葡萄酒第一个以此命名的葡萄酒。自此以后,Bin组合层出,为消费者所记住和熟知,成了Penfolds旗下最为知名的受欢迎的一个系列。其中,价格由低到高,最受欢迎的王牌产品有:

1)对于每一个i ,从中抽取

2)重新计算之后,从中抽取μ (t+1) ;

那么显然有:

它满足:

Step 3 对于t +1,回到Step 2;

Step 4 获取期望收益率序列(μ (1)(2),…,μ (m) )和平方波动率序列之后,用下面的均值作为参数的估计(年收益率、年波动率)

图 2 HS300指数对数差分数据的 QQ散点图
Fig.2 The QQ scatter plot of logarithmic difference data of HS300 index

图 5后验密度拟合
Fig.5 The posterior density fitting

2 仿真分析

继续考察沪深300指数,获取对数差分数据之后,先进行正态性检验,KS的P 值为0.481 2,取值远大于0.05;QQ散点图如图2所示,表明离散点紧密地围绕在直线的周围,这说明沪深300指数的对数差分数据源自正态分布.

接下来进行对数差分数据的相关性检验,采用Pearson相关性检验的P 值如图3,可以看出P 值均大于0.05,说明在十阶以内不存在相关性.因此可以认定图1所示的HS300指数的轨迹数据遵循Black-Scholes模型.

现在采用潜变量Gibbs抽样方法进行参数提取,由图1容易知道m =24,n -m =16,选择杰弗里斯无信息先验,同时选择期望收益率μ 和波动率σ 的初始迭代值:

μ (0)=0.1,σ (0)=0.1.

在Gibbs抽样运算中,首先对每个参数进行2 500次的预迭代保证Markov平稳.由图4可以看出Gibbs抽样获取的Markov链趋于平稳,这说明Gibbs抽样估计的结果收敛.

图 3 HS300指数对数差分数据的相关性 图 4潜变量 Gibbs多层迭代轨迹

在进一步的运算过程中舍去前2 500次的预迭代轨迹,再进行2 500次的迭代.图5给出了期望收益率μ 和波动率σ 的后验分布拟合结果.最后根据Markov链的轨迹值计算期望收益率μ 和波动率σ 的贝叶斯估计:

579 Diagnosis and surgical treatment of anomalous origin of the left coronary artery from the pulmonary artery

接下来考察潜变量Gibbs抽样的模拟精度.在模型(1)中设定μ =0.05,σ =0.3,S 0=100,模拟风险资产价格路径.设定m =100,n -m =10,分别采用文献[1,12]中的点估计方法和本文提供的潜变量Gibbs抽样方法进行估计,连续估计8次的结果如表1所示.可以看出对于期望收益率潜变量Gibbs抽样方法精度高的模拟次数占5次;对于波动率,潜变量Gibbs抽样方法精度高的模拟次数占6次.模拟次数由8次提高至10 000次,发现82.66%的次数比重认为潜变量Gibbs抽样方法认为期望收益率的模拟精度得到改善,另外有85.81%的次数比重认为波动率的模拟精度得到改善.这说明对采用删失数据,并利用潜变量Gibbs抽样方法有效提高了模拟精度.

表 1模拟路径的参数点估计和潜变量 Gibbs抽样估计结果
Tab.1 The parameter point estimation and potential variable Gibbs sampling estimation of simulated path

注:括号中数值为标准化误差.

3 结论

在缺失数据情形下研究了Black-Schole序列的期望收益率μ 和波动率σ 的贝叶斯估计问题.在后验分布密度的基础上,采用潜变量Gibbs抽样技术获取了期望收益率和波动率的多层抽样序列.利用平稳序列的遍历性,用序列的均值作为期望收益率和波动率的估计值.模拟结果表明:在缺失数据情形下,采用潜变量Gibbs抽样技术获取的模拟结果精度显著提高.

随着跨文化交流日益频繁,翻译研究正逐步走向深入,翻译的地位与作用越来越重要,对于人类文明的进步,各民族各区域间的政治、经济、文化交流具有难以估量的作用。随着这种“文化转向”的日益推进,译者作为翻译的实施者,其主体地位的进一步彰显迎来了新的“春天”。鉴于此种情况,译者的地位和作用更应该得到人们的认定和重视。笔者认为,在文学翻译中,译者是居主体地位,起主体作用。

本文论述的期望收益率μ 和波动率σ 的估计方法,刨除了缺失值对结果的影响,同时本文提供的方案可以融入先验信息对结果的影响,从而可以获得更加合理的估计值.

参考文献:

[1] 张波,余超,毕涛.高频金融数据建模:理论、方法与应用[M].北京:清华大学出版社,2015.

[2] 西村友作.基于高频数据的中国股市波动率研究[M].北京:对外经济贸易大学出版社,2014.

[3] 帅平,李晓松,周晓华,等.缺失数据统计处理方法的研究进展[J].中国卫生统计,2013,30(1):135-139.

[4] 庞新生.缺失数据插补处理方法的比较研究[J].统计与决策,2012,28(24):18-22.

[5] 杨军,赵宇,丁文兴.抽样调查中缺失数据的插补方法[J].数理统计与管理,2008,27(5):821-832.

[6] 武森,冯小东,单志广.基于不完备数据聚类的缺失数据填补方法[J].计算机学报,2012,35(8):1726-1738.

[7] 张赤,丰洪才,金凯,等.基于聚类分析的缺失数据最近邻填补算法[J].计算机应用与软件,2014,21(5):282-284.

[8] 于力超,金勇进,王俊.缺失数据插补方法探讨:基于最近邻插补法和关联规则法[J].统计与信息论坛,2015,30(1):35-40.

[9] 方匡南,谢邦昌.基于聚类关联规则的缺失数据处理研究[J].统计研究,2011,28(2):87-92.

[10] 孟杰,李春林.基于随机森林模型的分类数据缺失值插补[J].统计与信息论坛,2015,29(9):86-90.

[11] 肖庆宪,张建海.Black-Scholes模型的参数估计[J].河南师范大学学报(自然科学版),2001,29 (1):16-19.

[12] 刘颖,江一鸣.带不对称跳的期权定价扩散模型的参数估计[J].南开大学学报(自然科学版),2017,50(6):66-73.

[13] 丁辉,王咪咪.误差修正机制转换模型的贝叶斯估计[J].长春大学学报,2014,24(6):754-758.

[14] 侯建华,熊承义,游政红.信号估计中的贝叶斯方法及应用[J].西南民族大学学报(自然科学版),2006,32(3):591-594.

Latent Variable MCMC Sampling Method for Estimates of Yield and Volatility in Case of Missing Data

SUN Yudong,WANG Huan

(School of Business,Guizhou Minzu University,Guiyang 550025,China)

Abstract : In this paper,the Bayesian method is used to study the parameter estimation problem of Black-Schole model in case of missing data.Firstly,the Bayesian model is established to analyze the risk asset sequence under the Black-Schole model.Secondly,the latent variable Gibbs sampling method is used to obtain the estimates of yield and volatility.Finally,the HS 300 Index on August 3,2018 is used as the simulation object,and the Bayesian estimates of yield and volatility is analyzed with non-informative prior.

Keywords :Black-Scholes model;volatility;yield;latent variable Gibbs sampling;Bayesian posterior

收稿日期: 2019-06-22.

基金项目: 贵州省科学技术基金项目(黔科合J字[2015]2076);贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]168).

第一作者简介: 孙玉东(1983- ),男,博士,副教授,主要从事随机分析、数理金融等的研究.

文章编号: 1008-8423( 2019) 03-0277-05

DOI: 10.13501/ j.cnki.42-1569/ n.2019.09.009

中图分类号: F830.91; O212.8

文献标志码: A

责任编辑:黄孝忠

标签:;  ;  ;  ;  ;  ;  

缺失数据情形下期望收益率和波动率估计的潜变量MCMC抽样方法论文
下载Doc文档

猜你喜欢