部分线性变系数模型的一种新的轮廓(Profile)最小二乘估计,本文主要内容关键词为:线性论文,系数论文,轮廓论文,小二论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
0 引言 近年来随着计算机技术的不断进步,非参数估计的方法受到了越来越多的重视,然而由于多维非参数模型存在着“维数灾难”(curse of dimension)的问题,统计学家们从模型结构方面着手提出一系列的半参数模型,如可加模型、部分线性模型、变系数模型以及部分线性变系数模型等等[1-5];在这其中,部分线性变系数模型以其良好的适应性和稳健性受到了越来越多的关注[6-13]。所谓部分线性变系数模型(partial linear varying coeficient models) 由于其很强的灵活性,部分线性变系数模型(1)获得了广泛的关注(参见文献[6],[14—17]等),学者们针对模型中的参数部分和非参部分提出了很多的估计方法。Ahmad等[6]提出了广义级数的方法估计模型中感兴趣的参数;Xia,Zhang[15]利用局部线性的方式给出了另一个有效估计方法;Zhang和Lee等[16]提出了基于局部多项式的方法研究了该模型;Zhou,You[18]将小波估计的方法应用到了模型中非参数部分的估计;还有诸如文献[19—21]等等。特别地,Fan和Huang[14]对部分线性变系数模型提出了轮廓(profile)最小二乘估计方法,所得估计量具有很好的渐近性质[17,20-21],并且可以从理论上证明这种轮廓最小二乘估计的方法是一种半参有效的方法[22]。 区别于一般的轮廓(profile)最小二乘估计方法中第一步选取参数部分作为已知量,本文考虑首先将非参部分视为已知量,再分步给出模型中固定系数和变系数的估计量;最后再从大样本的角度,证明所得估计量具有良好的渐近性质。 1 模型估计 为了叙述方便,我们首先引入一些符号,将模型表示成矩形形式 Y=Xβ+M+ε (6) 当将变系数α(·)视为已知量时,模型(5)可以写成如下的矩阵形式 Y-M=Xβ+ε (7) 运用最小二乘法,可以得到β的估计量 将(8)带入模型(6)得到非参数模型 对于变系数函数α(·),我们将采用局部线性光滑的方法进行局部加权最小二乘估计。假设是一个给定的点,u是其领域内的任意一点,根据Taylor公式可知 于是目标函数(10),可以写成 最小化目标函数(11),并结合(8)可以得到模型(6)估计为 显然,本文所得的估计量(12)是不同于文献[14—15,17]中所得的轮廓(profile)最小二乘估计量。接下来,我们讨论估计量(12)的渐近性质。 2 估计量的渐近性质 (A1)随机变量u具有有界支撑Ω,其密度函数f(·)在其支撑上满足Lipschitz连续,且不为0。 (A5)函数K(·)为对称密度函数,具有紧支撑。 接下来,我们分别给出(12)中估计量的渐近性质。 3 实例分析 我们将运用艾滋病研究中的CD4数据[25]进行建模分析。一般来说,当人体感染艾滋病毒后,病毒会不断的攻击人体的免疫系统,导致病人的抵抗力减弱,可能发生多种机会性感染或肿瘤;而CD4细胞是人体免疫系统中的一种重要的免疫细胞,也是艾滋病病毒主要攻击对象,所以其检测结果对艾滋病治疗效果的判断和对患者免疫功能的判断有重要作用。本文所研究的这组数据来自于1984~1991年跟踪调查了218个感染HIV的男同性恋的患病情况,实验中要求患者每隔半年检查一次CD4细胞数,然而由于实验者的流失以及部分患者测量时间间隔的不规律,使得测量数据形成了非均衡纵向数据。 经过计算,我们得到了运用传统轮廓法和本文方法的最优带宽h分别为2.36和2.773,并且变系数函数的估计如图1。图中上方为运用传统的轮廓最小二乘估计方法而得变系数函数的估计量,下方为运用本文的估计方法而得。从中我们可以看出:两种估计方法所得的变系数函数的估计量的变化趋势基本一致,但是在固定系数的估计量(如表1)。 两种方法产生了很大的差异:相比于传统方法,本文的方法将数值小的回归系数估计的更小,而数值大的回归系数估计的更大,形成一种放大效应。这主要是因为估计量(12)中固定系数的协变量的权重得到了提高,在估计的过程中就会将重要重要协变量的估计强化,而将非重要的协变量弱化,这一点与Zhao和Xue[27]变量选择的结果是一致的,因此本文所述方法具有更好好的模型适应性。计算模型估计的拟合优度(goodness-of-fit) 得到传统轮廓方法和本文方法的结果分别为0.499645和0.491315,显然两者模型估计的拟合度相当,尽管本文方法略逊于传统的方法,但其估计量良好的渐进性质和模型适应性(在同等模型拟合度下,还能结合协变量的特点自适应调节面定系数的估计值)。 4 定理证明 为了证明需要我们另外给出引理 该引理为[14]中的结果,具体的证明可以运用[24]中的结论。 接下来的证明过程中记 引理2假设条件(A1—A6)成立,则有 定理1的证明由(12)得 为了证明定理1,现在只要证明以下结论即可 对于(i),首先由于 而根据引理1可得 类似的运用引理1,可以将(19)表示成 将(17)带入可得 对于(ii),由于系数函数α(·)在某一点的邻域内可以近似的展开为 根据引理2的结论可以得到 综上完成了定理1的证明。部分线性变系数模型的轮廓(剖面)最小二乘估计_线性模型论文
部分线性变系数模型的轮廓(剖面)最小二乘估计_线性模型论文
下载Doc文档