非参数模型均值函数结构变点的Bootstrap检测,本文主要内容关键词为:函数论文,模型论文,均值论文,参数论文,结构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
0 引言
自1955年Page提出变点问题[1]以来,变点的检测问题受到广泛的关注,并成为统计学研究的热点之一。产品质量的变化、股市的异常波动、气候的变化等系统的波动问题均可抽象为变点问题,这使得变点检测在质量控制、金融[2]、气候[3]、医学[4]等领域都有实际的应用背景,因此变点检测的研究不仅具有重要的理论意义,也具有重要的实际意义。
线性回归模型是一种结构简单的刻画变量之间关系的有力工具,因而线性回归模型回归系数变点的检测问题得到了大量的研究。由文献[5]构造的CUSUM统计量是检验线性回归模型回归系数变点的重要工具.在实际工作中有着广泛的应用。文献[6]和文献[7]分别利用回归残量和最小二乘残量构造CUSUM统计量对线性模型回归系数的结构变点进行检验,并指出当回归系数向量的跃度与回归向量的均值正交时,CUSUM统计量是无效的;文献[8]对CUSUM统计量进行改进,有效的改进了这一检验问题.
但随着科学技术和工程应用的发展,许多系统所展示出来的复杂行为不能被传统的时间序列模型准确描述。尤其是在对所研究的系统没有充分的认识时,若采用线性模型对这些时间序列描述,往往达不到准确预报和有效控制的目的。一定的条件下,不必拘泥于某单一结构的非参数模型具有可以有效逼近任何复杂结构形式的优势,计算工具的不断更新和发展加速了非参数模型相关的研究与应用范围。文献[9]研究了固定设计下非参数回归模型均值函数结构变点的检验问题,文献[10]构造CUSUM型统计量对随机设计下的非参数回归模型均值函数的结构变点进行检验,并指出当均值函数跃度的长期均值为零时残量CUSUM统计量无效,文献[10]通过加权来解决这一问题,但并没有给出最优权函数的选取原则,当加权后均值函数跃度的长期均值为零时,对应加权的CUSUM型统计量依然无效。本文考虑了均值函数跃度长期均值为零时,非参数回归模型均值函数结构变点的检测问题,提出新的不依赖于均值函数跃度长期均值的一致的检测方法,模拟结果表明本文方法明显优于已有方法。
本文第一部分介绍非参数回归模型均值函数结构变点问题和变点检测所需的假设条件,第二部分提出变点检测方法并证明检验和估计的一致性,第三部分通过模拟计算并与已有方法对比,说明本文方法的有效性。
1 模型与假设
考虑如下模型
其中F为(0,1)的闭子区间。
残量CUSUM统计量利用均值函数跃度的均值信息对变点进行检验,故当均值函数跃度的长期均值为零时残量CUSUM统计量是无效的,然而任何一个非零随机变量的一阶绝对矩恒不为零,故本文给出如下基于均值函数的核估计的检验统计量:
注1 A1-A3弱于文献[10]中的假设条件,A4-A6为核估计的一般假设,A1-A6均为非参数函数核估计一致性的充分条件。
注2 由A4可以看出,本文只要求条件方差函数有界,而对其是否随时间变化不做要求。
2 主要结果
本节研究变点估计和检验统计量的渐近性质,并构造有限样本下的Bootstrap检验,对非参数模型均值函数的结构变点进行检测。
为证明方便,做以下记号:
当样本量为n时,记
2.1 渐近性质
本节研究统计量在上述条件下的渐近性质,证明了备择假设下变点分位数估计的一致性。
定理1 在原假设和假设A1-A6成立的条件下
由A1-A5及强混合过程的不变准则[11]得
由中心极限定理[12]得
由假设条件A1,A3,A4,A6得
2.2 Bootstrap检验
基于极限理论的检验在有限样本下的检验势往往比较差,非参数检验尤其如此,由以上定理可以看出统计量收敛于退化分布,对应水平下的临界值无法确定,为了有效地确定在一定检验水平下的拒绝域和提高在有限样本下检验的效果,本文依据定理1-3构造Bootstrap检验,并证明检验的一致性。
步骤1
注3 由推论1可以看出这种检验方法只受均值函数变化量的长期平均一阶绝对矩影响,而与其长期均值无关,而随机变量的非零泛函(Δ(x))的一阶绝对矩恒不为零,故由推论1和推论2得这种检验方法可以很好的解决基于残量的CUSUM统计量在均值函数的变化量的期望很小时检验效果很差的问题,又避免了权函数的选取问题。
注4 由推论1和推论2可知本文给出的Bootstrap检验是一致的。
3 模拟结果与对比分析
本节利用Monte Carlo实验研究本文的Bootstrap检验和变点分位数估计量的有限样本性质。
为说明本文方法的有效性,设计如下实验,数据生成过程为
注5 检验和估计时取.核估计所使用的窗宽为h0通过CV准则[13]选取。
3.1 检验功效
对模型1和模型2分别取α=0.5,1,2,0,=0.25,0.5,0.75,h=(γ=4,6,8,10),对每种情况的数据生成过程分别取样本量100和200分别重复1000次实验,并基于Bootstrap检验记录拒绝原假设的次数,表1给出了在5%名义水平下的经验值,即拒绝原假设(不存在均值函数结构变点)的频率。
由于模型2的均值函数跃度的长期均值为零,不加权的残量CUSUM统计量对其检验效果很差,文献[10]对其做了加权处理,取权函数为sin(x)+cos(x),并与不加权的结果进行对比,为说明其方法对核估计窗宽选取的稳健性,文献[10]给出了多个窗宽h=(γ=5,6,7)下的模拟结果,为进行对比,表2给出其加权后模拟结果。
由表1中结果可以看出:原假设成立的条件下本文方法能够正确地判断模拟数据不存在均值函数结构变点;在备择假设下,本文的方法具有良好的功效,当均值函数跃度相同时,样本量的增加使得经验势函数的增加,当样本量不变时,均值函数跃度变大导致经验势函数的增加,变点越靠近中间位置,经验势函数越大。
表1和表2中的结果表明:本文方法受均值函数跃度的长期均值的影响较小,在均值函数的跃度为常函数时本文给出的方法与文献[10]中的不加权的CUSUM方法效果相当,当均值函数变化量期望为零时,本文的方法明显的优于其方法,有效地改进了均值函数的变化量期望为零时非参数回归模型均值函数结构变点的检验。
3.2 变点位置的估计
为研究样本量、变点分位数、均值函数跃度的长期平均一阶绝对矩和长期均值对变点分位数估计的影响,对模型1和模型2分别取=0.25,0.5,0.75,均值函数跃度的一阶绝对矩,对每种情况的数据生成过程分别取样本量100和200分别重复200次实验,对变点分位数进行估计,表3给出了变点分位数估计值的样本均值和标准差(括号内的为标准差)。
由表3中结果可以看出:变点分位数的估计值偏左;样本量越大、跃度的一阶绝对矩越大,变点分位数估计越准确;跃度的长期均值对变点分位数的估计影响不大。
4 结束语
本文研究了一类非参数回归模型均值函数结构变点的检测问题,从模拟计算结果可以看出本文的方法可以有效地检测到非参数回归模型均值函数的结构变点,有效地改进了非参数模型均值函数的结构变点的检测。本文的统计量也可以推广为其他形式;由变点分位数的估计的模拟结果可以看出,分位数的收敛速度和样本量、跃度一阶绝对矩的平方成正比,可以预见若适当加强限制条件,本文估计量的收敛速度为经典的。