误差修正模型的高频数据统计套利策略研究-基于期货铜的应用论文

误差修正模型的高频数据统计套利策略研究
——基于期货铜的应用

彭 闯

(南京邮电大学,南京210023)

摘要: 本文主要介绍了统计套利的基本含义和基于协整的交易策略,之后选取了国内期货市场中具有代表性的沪铜1907和沪铜1908的的5分钟的高频交易数据来进行实证研究,其中包括相关系数检验、平稳性检验及协整检验等方法,最后根据检验的结果建立了误差修正模型并制定了套利策略,并依据建立的套利策略对历史数据进行了回测,根据回测结果对套利策略及模型的有效性给与了评估。

关键词: 统计套利;协整检验;误差修正模型;高频数据

一、研究背景

国内对于股指期货的统计套利大多停留在日间数据,而对于分钟数据等高频数据的研究较少,而高频数据具有交易次数多,换手频率快等特点。相比于人为的投资操作,计算机的自动化操作具有风险小、套利机会多等特点。基于此背景,本文选取了上海期货市场沪铜期货1907与沪铜1908的5分钟数据,希望再期货合约的高频交易中使用协整检验和误差修正模型,获得协整检验、误差修正模型在高频数据的自动交易策略。

二、模型及交易策略介绍

(一)建模步骤及模型介绍

1.相关性检验。进行协整统计套利的投资标的物之间必须是有相互关系,要先进行相关性分析,这里选用pearson简单相关系数。

胫骨平台时对人体活动膝盖震荡进行缓解的关节面,能够保护膝关节软骨,因为该部位的解剖位置比较特殊,在车祸、外力冲击和跌落时容易出现关节内骨折。现代交通运输也和建筑业发展快速,因此临床中的胫骨平台骨折几率也在增加,为了进行分型和治疗,罗从风等[6]将胫骨平台分为外、内、后侧三柱。如果是复杂胫骨平台粉碎性骨折合并三柱损伤患者,临床中双切口双钢板治疗难度较大,无法实现较好的复位效果,所以,需要解决这一问题。

设X,Y是两个变量,则

其中ρxy 为 x,y 的相关系数,cov(x ,y )为两者的协方差,σx ,σy 为 x和 y的方差,μX ,μY 为 x,y的均值。

2.平稳性检验。在进行时间序列建模时必须要求数据的时间序列数据平稳,必须先进行平稳性检验,单位根检验是判断时间序列平稳的重要方法,本文采用ADF检验,ADF检验为判断时间序列是否存在单位根的重要统计方法之一,如果序列平稳则不存在单位根,反之存在单位根。

白阳企图解释:“你听我说,刚开始的确是这样,但是后来……”话说到一半他忽然醒悟了过来,像是不认识似的重新打量着何冰,慢慢地道,“你找人查我?是从什么时候开始的?”

设时间序列的p阶滞后项回归方程为

原假设H0:=0,存在一个单位根,对公式1进行OLS回归可得估计量及相应的t统计量,t统计量又被称为ADF统计量,如果的ADF值小于其ADF统计量的临界值,则拒绝原假设,证明原时间序列存在单位根。

3.单整。如果时间序列X t平稳,则称X t为零阶单整,记为X t-I (0),如时间序列前d-1阶差分不平稳,第t阶差分为平稳序列,则称X t为t阶单整,记为X t-I (t )。

第一步:设阀值:0<φ1<φ2<φ3

协整检验钟最常见的方法便是EG两步法,假设存在两个变量X 1t和X 2t,需要确定两个变量是否具有协整关系简要步骤可以表示为:

基本划分标准为:

参照组行髋关节置换的老年糖尿病患者并发症发生率37.50%高于实验组的6.25%,差异有统计学意义(P<0.05),见表 3。

第二步:估计长期均衡关系。假设两个变量X 1t、X 2t都为1阶单整序列,则建立回归方程:

X 1t01X 2tt 估计长期均衡关系。估计的残差为εt =X 1t01X 2t

第三步:检验序列是否平稳,是偏离长期均衡关系的利差估计值,如果这些利差估计值是平稳的则称X 1t,X 2t是(1,1)阶协整。

5.误差修正模型。如果两个变量是协整的,那么两个变量之间必然存在长期均衡关系,但由于市场波动及信息不对称等因素长期均衡中往往存在着短期偏差,这两个变量短期偏离的不均衡现象可以用误差修正模型描述。误差修正模型的常用方法有E-G两步法和直接估计法:

其中E-G两步法有:

第一步:根据协整检验的结果得到{X t}和{Y t}的协整方程:

则其残差序列为:

脚有时可当成“探雷器”使用。若有危险,难保不下意识地用脚作试探状。比如我们有时遇到前途未明之事,就会用脚先试探试探,结果脚就充当了一次人体的“探雷器”。生活中,某些人就是典型的“脚”色,遇到好事,便争破头皮往上抢,那种丑态,就是一个典型的“丑脚”。遇到好事,激动地不但忍不住要伸手去,连脚丫子都蠢蠢欲伸,别说拒绝啦!

第二步:设{X t}和{Y t}的短期不均衡关系为:

将(2)得到的εt -1替代(3)中的ecmt- 1,得到误差修正方程

之后根据 OLS估计求出 β 1、β 2的值,β 1其中被称为误差修正系数。直接估计法:

4.听力播放。巩固前面没有听清楚、听懂的单词,在此基础上进一步纠正,以便更好的理解所听材料内容。对于新课文的单词,要尽力记住读音。

早期,温州报业集团、《经济观察报》、《环球时报》、《南方都市报》等多家报业机构都曾采用过数字报付费阅读,但结果不如人意。而于2010年正式推出电子版收费阅读服务的《人民日报》,也从2017年1月1日起停止收费。

通过以△yt为因变量,△xt,y t- 1,x t- 1为自变量直接建立回归方程构建误差修正模型。

(二)交易策略分析

根据“场景理论”重新审视城市文化空间的规划及布局,会发现有许多改进之处。但是,这涉及到城市交通、房屋规划、城市步道布置等诸多问题,因此不能简单的一概而论。但是结合中国语境,利用场景发展的一些关键要素,可以为未来文化创意产业以及城市的转型升级提供一些思路。

对期货进行统计套利的前提是这两种期货商品拥有较强的相关性,本文先选取沪铜1907与沪铜1908都为铜期货的两个不同的品种,本文希望先通过两种数据的折现图和散点图的分布去探究下两者的相关程度,由于高频数据的数据量较大,故选取了前200个点进行描述性分析。沪铜1907与1908的折线图与散点分布图分别如图1、图2所示。

第一步:确定两个变量的单整阶数是否一致;

4.协整。如果两个时间序列{X t}和{Y t}是两个不平稳的时间序列,但两个时间序列是同阶单整的,即:X t-I (t ),Y t-I (t ),并且这两个序列的线性组合β 1X t2Y t是 t-j阶单整的,记为 β 1X t2Y t-I (k-j),则称{X t}和{Y t}为(k,j)阶协整。

第二步:设立区间,其中(μ -φ1σ ,μ +φ1σ )为无套利区间(-∞,μ -φ3σ )及(μ +φ3σ ,+∞)为止损区间,在这两个区间中不持有头寸。μ ±φ2σ 为建仓点。

妊娠母猪主要表现为没有任何临床症状,突发流产,产下死胎、僵尸胎、木乃伊胎。妊娠母猪流产后,胎衣长时间不下,恶露不排,从阴道中持续排出灰色浑浊分泌物。症状消失后,妊娠母猪发情不正常,不能正常配种受孕。仔猪发病后,体温迅速升高到41 ℃,呼吸极度困难,精神状态变差,两只耳朵向后伸直,对外界刺激十分敏感,遇到声音刺激后,表现出兴奋和鸣叫。有的患病猪出现严重腹泻、呕吐症状,呕吐和腹泻物呈现黄色,从口中分泌出大量泡沫状唾液。患病猪行走无力,眼结膜发炎潮红,叫声嘶哑,共济失调,头部歪向一侧,在圈舍内作转圈运动,最终倒地死亡[2]。

第三步:设立交易步骤,当样本价差序列向上突破μ +φ2σ ,或者从止损区域(μ +φ3σ ,+∞)向下击穿μ +φ3σ 做多价差,带spread价差序列回归至μ +φ1σ 时获利止盈离场或者spread扩大至μ +φ3σ 时止损离场。当样本价差序列spread向下突破μ -φ2σ ,或者从止损区域(-∞,μ -φ3σ )向上突破μ +φ3σ 做多价差,待spread价差序列回归至μ -φ1σ 时获利止盈离场,或者spread扩大至μ -φ3σ 时止损离场。

其中φ1、φ2、φ3是以历史最大化收益为原则求出的。

三、实证分析

本文选取了从2018年5月1号到2019年5月1号沪铜1907和沪铜1908的一年的5分钟交易数据,其中包括交易时间、交易量、买卖价格等变量。并以交易价格作为时间序列进行分析,共计19547个样本。本文抽取了所有样本数据的前70%的数据进行建模,并用后30%的数据进行回测。

核心企业的地位重要,存在没有及时回款的情况,产生应收账款。下游经销商需要大量存货,需要付出预付款,导致存货成本。上下游企业的信用较低,难以获得相应的贷款,阻碍了发展。降低成本、信用传递、背书分享,在这样的背景下产生了供应链金融。

图1 沪铜1907与沪铜1908-5分钟散点图

图2 沪铜1907与沪铜1908的5分钟折线图

从两者的散点图和折现图可以看出两种期货商品之间存在一定的均衡关系,接着对两种期货商品进行相关性分析:

根据误差修正模型可以得出交易时两个期货商品的对冲比例。计算出两种投资标的物价差的时间序列记为spread ,根据时间序列算出spread 的均值μ 和σ 标准差,根据价差序列的分布,确定无套利区间、套利区间和止损区间来指导交易。这三个区间用均值加方差的波动来进行划分。

表1 相关性分析表

从相关分析的表中也可以看出两种期货商品的相关系数达到了0.92,具有高度正相关。

二是拓宽发展通道。搭建管理、技术、技能岗位等发展通道。开展管理岗位后备人才选拔,通过组织考察、笔试、竞职演讲等程序,建立后备人才库,拓宽职工晋升通道。系统制定管理岗位后备人才培养计划,编制后备人才培养手册,建立定向培养目标,合理安排培训课程,实行动态跟踪监督并进行阶段考核评估。组织后备人才进行挂职轮岗锻炼、参与标准化站区建设等专项工作,组织后备人才挂职学习成果研讨会,不断提高工作能力和水平;采取竞争上岗、组织选拔、公开招聘等方式,开展初、中、高级专业技术职务选聘;对收费、清障、电工等生产岗位技能等级进行初、中、高级鉴定,实施技能等级与职工薪酬挂钩;

接着对原序列做平稳性检验,并找出两种商品的单整系数。具体的ADF检验结果如表2所示

表2 ADF检验表

从表中可以看出两者的ADF统计量分别为-2.22和-2.23,均大于1%、5%、10%的临界值,在进行一阶差分以后,两者的ADF统计量分别变为-19.53和-19.55小于1%的临界值,说明沪铜1907与沪铜1908均为一阶单整序列。接下来采用E-G两步法进行协整检验,先建立回归方程,回归方程结果如表3所示:

表3 回归方程系数表

由表得出的回归方程为cu1807=443.9+0.988cu 1808,接着对回归方程的残差进行单位根检验,具体结果如表4所示:

表4 协整检验表

通过协整检验可以知道沪铜1907与沪铜1908具有协整关系。接着用直接估计法建立两者的误差修正模型,其中以沪铜1907为因变量,具体结果如表5所示:

表5 误差修正模型系数表

得出的误差修正模型为:

其中error.ecm为误差修正项,表明在两种期货商品的长期协整关系中,当沪铜1907偏离均衡值时下一期的波动值不仅和cu.1908的变动值有关还和两者的误差修正项有关,其修正的速度为-0.53,基于此得出的协整向量位(1,-0.988),表明进行修正时两种产品的对冲比例为1:0.98,表明在进行统计套利时做多一手沪铜1907时也要做空0.98手沪铜1908,同理做空一手沪铜1907,也要做多0.988手沪铜1908。

从而可以建立两个期货品种的样本内对冲价差时间序列spreadt=cu. 1907-0.988cu. 1908。

根据样本内的价差序列,得出样本内价差时间序列的均值为0.105,方差为1.33×10-7,根据样本内价差的均值和方差,按照上面所写的投资策略制定无套利、套利和止损区间。抽取了历史数据的后三个月六千样本作为测试数据,用r语言自己编写回测函数,以历史数据的收益最大化为约束条件求出三个区间的阈值φ1=0.4、φ2=1.5、φ3=3.3,每次交易的交易费用按10元计算,初始资金以沪铜1907与沪铜1908的一手的资金总和计算,前500个数据的价差走势图及回测总体累计收益数分别如图3与图4所示。

图3 沪铜价差走势图及开仓、减仓、止损线

图4 累计收益图

可以看出基于误差修正模型得出的套利策略在前3000时套机机会较多,随着时间的推移大约在4000期以后套利的机会开始逐渐降低。最后根据模型得出的收益数按照全年240个交易日,得出年化收益率、最大回撤、最长持仓时间等模型回测指标,具体结果见回测结果汇总表。

表5 模型回测结果汇总表

根据回测结果汇总表可以看出基于误差修正模型得出的套利策略在测试数据中得到了29.67%的年收益率,期间共套利360次。

为了弄清楚蒸汽本身的安全风险,英国伯明翰大学研究人员设计了一种可以模拟电子烟蒸汽的装置,并可以产生蒸汽冷凝液。随后,研究人员从八名健康的非吸烟人士肺部提取了肺泡巨噬细胞,并将这些细胞分别暴露在普通电子烟液体、有尼古丁和没有尼古丁的人工蒸汽冷凝液中。

四、结论与建议

通过本文的实践证明,在期货市场上运用误差修正模型去进行统计套利是可行的,并且相比于股票市场中日交易数据,统计套利更适用于基于高频交易数据去实现程序化、自动化交易,但是也可以看出高频数据也具有交易次数频繁,波动剧烈等特点,并且期货市场上需要的入市资金过高,更适用于大额资金的投资者。

参考文献:

[1] Engle R F,Granger C W J.Cointegration and error correction:reprensenation,estimation and testing [J].Econometvica,1987(2).

[2] Burgess A N,Refense A N.1996a.Modelling non-linear cointegration in intenational equity index futrues[C].NeturalNetworks in FinancialEngineering.World Scientific,Singapore,1996:50-63.

[3] 仇中群.基于协整的股指期货套利研究[D].合肥:中国科学技术大学,2009.

[4] 蔡志成.基于协整分析的统计套利策略研究[D].杭州:杭州电子科技大学,2014.

[5]赵 华.时间序列数据分析——R软件应用[M].北京:清华大学出版社,2016.

中图分类号: F820

文献标识码: A

文章编号: 1005-913X(2019)09-0051-03

收稿日期: 2019-05-15

作者简介: 彭 闯(1994-),男,西安人,硕士研究生,研究方向:应用统计。

[责任编辑:谭志远]

标签:;  ;  ;  ;  ;  

误差修正模型的高频数据统计套利策略研究-基于期货铜的应用论文
下载Doc文档

猜你喜欢