郭朝会[1]2016年在《线性模型与单指标模型的若干研究》文中进行了进一步梳理稳健估计和变量选择是统计建模中非常重要的两个方面。变量选择意味着我们需要寻找真正影响响应变量的那些协变量,从而降低模型复杂度和提高预测精度。同时,我们希望所提估计方法是稳健的特别是当数据存在较多异常值时,从而使得变量选择结果不会受到较大的影响。另一方面,纵向数据在生物医学、经济学、社会学等领域有着广泛的应用,目前已成为统计学研究的热点问题之一。本文基于线性模型、广义线性模型、单指标模型和单指标系数模型研究了稳健估计、变量选择和纵向数据分析。在第二章中,针对参数个数随样本量发散的线性模型,本章基于SCAD惩罚函数和秩回归提出了一种稳健的变量选择方法,该方法能够有效地克服响应变量中异常值或厚尾误差分布的影响。在一些正则条件下,证明了所提估计具有相合性和Oracle性质。进一步,为了克服现有方法的计算困难,本章提出了能够快速求解惩罚秩回归估计的贪婪坐标下降算法。为了处理p(29)n的情形,本章基于距离相关的独立筛选方法提出了两步估计,同时证明了两步估计具有Oracle性质。最后通过数值模拟验证了本章所提方法的稳健性和有效性。在第叁章中,针对上一章所考虑的线性模型不能处理离散响应变量,本章将研究纵向广义线性模型的稳健估计与变量选择。具体地,我们结合指数得分函数和权函数构造了稳健且有效的估计方程,该估计方程能够同时克服响应变量和协变量中异常值的影响。为了避免解凸优化问题,本章构建了稳健且有效的光滑阈广义估计方程同时实现参数估计与变量选择。在一些正则条件下,证明了所提估计具有相合性和Oracle性质。进一步,通过影响函数证明了所提估计是稳健的。最后,运用数值模拟以及实例分析验证了所提估计的有限样本性质。在第四章中,我们研究了纵向单指标模型的估计问题。首先,通过忽略重复测量的组内相关性获得指标系数向量和非参连接函数的初始估计。其次,为了避免广义估计方程中工作相关系数矩阵的估计,本章基于修正的Choleksy分解将协方差矩阵分解为自回归系数和更新方差,然后通过回归建模的方式获得它们的估计。再次,利用剖面加权最小二乘方法构建了指标系数向量和非参连接函数更有效的两步估计。在一些正则条件下,证明了所提估计的相合性和渐近正态性。最后,数值模拟和实例分析验证了所提方法的优越性。在第五章中,针对单指标系数模型,结合局部线性近似和众数回归提出了稳健且有效的估计方法。在一些正则条件下,建立了所提估计的相合性和渐近正态性。进一步,讨论了最优的理论窗宽以及给出了实际问题中选择窗宽的办法,并从理论上证明了所提估计方法不会损失估计的效率。最后,数值模拟验证了所提估计的稳健性和有效性。在第六章中,我们研究了纵向单指标系数模型的估计问题。由于第五章中非参连接函数的估计涉及“欠光滑”窗宽,从而给实际应用中的窗宽选取带来了挑战。因此,本章提出了中心化的广义估计方程来克服这一问题。为了提高统计推断的效率,本章利用修正的Cholesky分解获得协方差矩阵的估计,进而对指标系数向量构建更有效的中心化广义估计方程。然后利用加权最小二乘获得非参连接函数更有效的估计。在一些正则条件下,建立了所提估计的大样本性质。最后,通过数值模拟和实例分析验证了所提方法的有效性和实用性。
潘雄[2]2005年在《半参数模型的估计理论及其应用》文中认为半参数模型是二十世纪八十年代发展起来的一种重要的统计模型,它引入了表示模型误差或其它系统误差的非参数分量,从而使这种模型既含有参数分量,又含有非参数分量,兼顾了参数模型和非参数模型的优点,较单纯的参数模型或非参数模型有更大的适应性,并具有更强的解释能力。 在许多实际问题中,我们遇到的系数是非随机设计点列,即固定设计点列的情况。因而本论文主要研究在固定设计情况下,半参数模型中参数分量和非参数分量的估计量的构造、估计结果的大样本性质及其应用。 将参数模型和非参数模型估计理论中的参数估计扩展到半参数模型,初步建立半参数模型最小二乘估计理论是本文所做的主要工作。将测量数据处理中影响观测值的因素分为两个部分:一部分为线性部分,另一部分为某种干扰因素,它同观测量的关系是完全未知的,没有理由将其归入误差项,可以将其看成半参数模型中的非参数分量,即用非参数分量表达参数模型表达不完善的部分。因此,半参数模型可以克服参数模型在表达客观模型方面的局限性。一方面使数学模型与客观实际更接近,另一方面能从误差中分离出系统误差和偶然误差,提供更丰富的解算结果。从而,半参数模型可以概括和描述众多实际问题,更接近于真实,因而引起了广泛的重视,研究日益成熟,本文的研究具有理论意义和实用价值。 本论文将结合数学界的理论研究工作与测绘界的实际需要,系统地研究半参数模型的各种估计方法(补偿最小二乘法、两步估计法、二阶段估计法、小波估计法、迭代法等)及其在测量数据处理中的应用,具体地说,主要研究了如下内容: 在第二章,基于最小二乘极值问题的求解,提出了补偿最小二乘准则。在该准则下,得到了正规化矩阵正定、半正定情况下模型中参数分量、非参数分量的估计值及其观测值的改正值的表达式。较为系统地讨论了平滑因子及正规化矩阵的选取方法。利用补偿最小二乘原理构造加权补偿平方和,得到了半参数模型中正规化矩阵正定时参数和非参数的估计量。从偶然误差的统计特征出发,详细讨论了这种平差方法得到的参数估计值的有偏性、误差大小等统计性质,并对半参数平差与最小二乘法的参数估计值进行了比较。理论分析表明,通过选取合适的平滑因子,半参数平差方法优于最小二乘法。另外从数理统计的角度对平滑因子的选取进行了分析,得到了平滑因子的取值范围。在均方误差准则下,对半参数模型和参数模型的估计的准确度进行了比较,给出了参数分量为O的T统计检验的实用统计量的构造公式和检验方法。这对于上述估计方法的应用有实际意义。 采用模拟数据对补偿最小二乘法进行了算例验证,与忽略系统误差采用参数模型在最小二乘准则下的估计结果进行了比较,证明采用半参数模型,可以估计出系
严国义[3]2013年在《纵向数据与生存数据的半参数联合模型研究》文中进行了进一步梳理在临床医学研究中经常要对一个反应变量作纵向观测,同时又对另一感兴趣的事件发生的时间作记录。一个典型的例子就是在爱滋病的研究中既有CD4+和HIV病毒数量的纵向测量,也有爱滋病发作时间和病人死亡时间记录。在科学研究和临床试验中,我们往往对纵向观测量与事件发生的时间(比如病人死亡时间)之间的关系感兴趣,这种研究需要纵向数据和生存数据两方面的理论,有一定的复杂性,既有一定的理论意义又有实际应用价值。本文主要分为以下四个部分:第一章,我们介绍了本文研究工作的实际背景与解决相应问题的实际意义,概述了前人的研究方法和已有的成果,并综述了本文的主要工作。第二章,我们对纵向数据半参数回归模型采用拟高斯估计的方法,是对重复测量数据分析方法的一个推广。通常的一个广泛接受的经典方法是基于广义线性模型和拟似然估计的“广义估计方程”,但是该方法有某些理论上的缺陷。我们建议的方法是通过极大化一个工作似然函数从而避免了上述理论缺陷。在理论上,我们证明了所得估计的相合性和渐近正态性。第叁章,我们研究了生存数据具有加速危险因子的加乘危险模型。本模型包含很多常见的生存分析的模型作为其特例,比如比例危险模型、加法模型、加乘危险模型和加速危险模型等。此模型与Chen和Wang(2000)[12]的区别在于本模型中的协变量被划分为叁类,除了加速危险因子、乘性危险因子外还含有加性危险因子,从而回归模型中的回归参数相应分为反映协变量作用的加速危险的效应、乘法效应和加法效应,这样在评价协变量对反应变量的效用时能给出更好的解释。在适当的正则条件下证明了所得估计的相合性和渐近正态性;对累积基准危险率函数给出了Breslow-型估计,并给出了其弱收敛性的证明。我们建立的模型对生存数据的建模分析提供了一种新的选择。第四章研究了纵向数据与生存数据的半参数联合模型。假定纵向数据满足半参数混合效应模型,假定生存数据服从含有随机效应的比例危险模型。感兴趣的问题首先是纵向数据过程的刻画,同时也感兴趣生存时间与其他协变量之间的关系。该模型是现有很多模型的推广,对给定数据下的模型选择提供了新的方法。我们用B-样条方法将非参数项的估计转化为参数估计问题,用蒙特卡洛EM算法给出了参数的极大似然估计,并用bootstrap方法得到参数估计的标准差的估计。基于一个临床试验的实际例子说明了本模型的应用。最后,介绍了有待进一步研究的问题.
李佳[4]2013年在《正相协序列下矩完全收敛及半参数回归模型估计的大样本性质》文中指出本文讨论了正相协下矩完全收敛以及半参数回归模型中估计量的大样本性质.主要运用了Markov不等式、Cauchy schwartz不等式和慢变化函数h(x)的性质建立了正相协随机变量序列生成的平均移动过程的矩完全收敛性及其精确渐近性.此外,在一定的协方差结构的限制条件下,利用正相协随机变量序列的相关性质和矩不等式对正相协误差下的半参数回归模型中估计量的r阶矩相合性、强相合性以及弱收敛速度进行了研究,得出了相应的结论.本文内容共分为六章.第一章是序言,主要介绍了概率极限理论和半参数回归模型的研究背景及本文的研究依据、意义与内容.第二章是预备知识,介绍了正相协随机变量序列的基本概念及性质、完全收敛性的概念、半参数回归模型中估计量的相合性等相关知识,以及常用不等式(如:Cr不等式、Chebychev不等式、Markov不等式、Cauchy schwartz不等式).第叁章讨论了正相协随机变量序列生成的平均移动过程的矩完全收敛及其精确渐近性.第四章讨论了正相协误差序列下半参数回归模型估计的大样本性质,如:r阶矩相合性、强相合性及弱收敛速度.第五章附记部分主要是对本文所得结论与其它相关文献中的结果进行比较和分析.第六章是总结与展望,该部分叙述了本文的主要研究成果、不足之处以及未来还可以继续研究的内容.
张先波[5]2006年在《污染数据的统计分析》文中研究表明在实际工作中经常会遇到一些污染数据,说的是在寿命试验中,元件寿命分布函数可能为两个分布函数的混合,考虑一列非负独立同分布的随机变量,具有不同的分布函数。取a为大于0小于1的一个常数,试验所观测到的元件寿命数据以概率1-a来自第一个分布,以概率a来自第二个分布,称a为污染系数,也称污染比率。本文主要工作有以下两个方面:一、给出了一类在已知时刻受到污染的一串数据的回归模型:针对参数无完全信息下,构造了其模型参数和污染比率a的估计量,并证明了其相合性和渐近正态性。二、在第二个的方差为第一个方差的l的平方倍的情形下,证明了模型的参数矩估计不存在,并相应的给出了其他的几种估计量,证明了其相合性和渐近正态性;本文工作的意义在于:一、扩展了第一类污染数据模型,郑祖康等提出的模型(I)为本文n=0时的特例;二、指出了在污染源和真实数据的二阶原点矩相关的假设下,无法用矩方法对污染数据线性回归模型的参数进行估计。
施露芳[6]2006年在《带污染数据的回归模型参数估计》文中认为污染数据是生物统计和金融统计中常见的一类数据,它也是一类不完全数据.由于试验设计、设备误差、条件限制以及观测者主观因素等原因,我们得到的是不完全数据.不完全数据并不是完全不能利用的数据,虽然有时可以再做一次数据的统计工作,但大多数时候是不可重复、费时太长或是代价太高的.而且,在固定的污染源未查明或被消除的情况下,只可能得到被污染的数据.因此,关于污染数据的统计分析已发展成为统计推断一个重要专题.本文重点研究了带污染数据的回归模型参数估计问题.第一章简要介绍了选题的背景,包括“回归”的特点、发展,污染数据的产生背景以及国内外研究状况.第二章介绍了截断情形下带污染数据的模型参数估计,包括截断模型下的污染系数的估计,有两种方法:一种是基于截断数据的均值估计的想法,得到了污染系数的估计,且估计具有渐近正态性,另一种是利用研究截断数据回归分析的想法来做,同样得到了具有良好性质的估计;接着使用矩估计法得到了截断的污染数据的参数估计;最后利用最小二乘法及矩估计方法得到了截断情形下污染数据半参数回归模型的参数估计.第叁章介绍了污染数据线性回归模型的估计问题.首先介绍了一些基础知识,然后重点介绍了我所做的工作:讨论简单回归模型中响应变量受到另一随机变量序列污染时,模型参数和污染系数的估计方法.利用贝叶斯统计原理,给出了污染系数的后验置信区间及模型参数估计.由于引入先验信息,增加了被估参数的信息,它对于提高估计的性能是有益的.在实际中,有广泛的应用价值.第四章介绍了污染数据半参数回归模型的估计方法.首先利用矩方法给出了两种污染方式下污染参数及污染系数的估计.然后介绍了我所做的另一工作:利用(线性)小波估计方法,给出了未知待估参数β,未知函数g (? )以及污染参数υ的估计,并证明了它们的弱相合性.小波方法用于回归模型,在对待估函数要求较低的情况下,得到了比较优良的性质.第五章是总结和展望.
赵培信[7]2010年在《半参数变系数部分线性模型的统计推断》文中指出半参数变系数部分线性模型既含有参数分量,又含有非参数分量.因此,该模型不但保留了参数模型易于解释的优点,而且还有着较广的适应性.线性模型、部分线性模型以及变系数模型都是该模型的特殊情形.目前,半参数变系数部分线性模型已被广泛应用到生物医学以及计量经济学等领域.另外,在实际应用中常常遇到纵向数据、缺失数据以及测量误差数据等复杂数据.关于复杂数据处理方法的研究已成为现代统计分析的热点课题之一.因此,研究复杂数据下的半参数变系数部分线性模型的统计推断有着一定的理论意义和实用价值.本论文主要在纵向数据、测量误差数据以及缺失数据等复杂数据下,研究了半参数变系数部分线性模型的统计推断问题.首先,把经验似然方法应用到复杂数据下半参数变系数部分线性模型的估计问题中,推广了经验似然方法的应用领域.其次,利用经验似然方法研究了半参数变系数部分线性模型的检验问题,改进了已有的模型检验方法.最后,结合惩罚估计方法,研究了复杂数据下半参数变系数部分线性模型的变量选择问题.提出了关于模型中参数分量以及非参数分量的变量选择方法,改进并推广了已有的结果.具体地讲,论文的研究内容有以下几个方面:对独立数据下的半参数变系数部分线性模型,主要考虑了模型的检验问题以及变量选择问题.首先,基于profile经验似然方法研究了模型的检验问题.分别构造了参数分量以及非参数分量的经验对数似然比检验统计量.与已有的经验似然检验方法不同的是,我们所构造的经验对数似然比检验统计量渐近服从标准卡方分布.进而得到了一定置信水平的拒绝域,改进了已有的模型检验方法.模拟研究表明所提出的检验方法对备择假设是相当敏感的.其次,利用基函数逼近以及惩罚最小二乘方法,我们对模型的变量选择问题提出了一个变量选择方法.该变量选择方法可以同时对模型中的参数分量以及非参数分量进行变量选择,改进了已有的两阶段变量选择过程.考虑到正则估计的优良性质依赖于调整参数的选择,我们还从模型选择相合性的角度出发,改进了已有的调整参数的选择方法.模拟研究表明我们的变量选择方法具有较好的有限样本性质.对纵向数据下的半参数变系数部分线性模型,我们提出了一个group经验似然推断方法.该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数带来的困难.并且对纵向数据下的半参数变系数部分线性EV模型,通过巧妙地构造偏差校正的辅助随机向量,提出一个校正的经验似然推断方法.另外,利用残差调整的方法,给出了一个关于模型中非参数分量的残差调整经验对数似然比函数.理论研究发现,在没有欠光滑的条件下,关于参数分量以及非参数分量的经验对数似然比函数均渐近服从标准卡方分布,进而构造了参数分量的置信域以及非参数分量的逐点置信区间.并且在估计过程中,仍可以通过数据驱动方法选择最优带宽,改进了已有的经验似然推断方法.最后通过数据模拟以及一个实例分析研究了所提出方法的有限样本性质.对响应变量随机缺失下的半参数变系数部分线性模型,首先,利用经验似然方法,考虑了模型中参数分量的估计问题.结合逆边际概率加权方法并通过巧妙地构造基于借补值的辅助随机向量,提出了一个基于借补值的经验似然统计推断方法.与已有的借补经验似然推断方法不同的是,我们所构造的借补经验对数似然比函数仍然渐近服从标准卡方分布,进而给出了参数分量的置信域.其次,我们考虑了模型的变量选择问题.结合惩罚借补估计方程,提出了一个变量选择方法.从理论上证明了所提出的变量选择方法可以相合地识别出真实模型,并且对回归系数的正则估计达到了最优收敛速度.模拟研究表明所提出的基于借补值的经验似然推断方法以及变量选择方法具有较好的有限样本性质.对半参数变系数部分线性EV模型,我们主要在参数分量以及非参数量均含有测量误差的情况下,考虑了模型的变量选择问题.利用偏差校正以及惩罚最小二乘方法,提出了一个偏差校正的变量选择方法.该变量选择方法允许模型的参数分量以及非参数分量均含有测量误差,改进并推广了已有的变量选择方法.并且对非参数分量,我们还提出了一个新的偏差校正方法.通过选择适当的调整参数,证明了所提出的变量选择方法可以相合地识别出真实模型,并且所得的正则估计具有oracle性质.模拟研究表明我们的变量选择方法是可行的.对协变量调整线性回归模型,我们提出了一个校正的经验似然推断方法.证明了所构造的校正经验对数似然比函数渐近服从标准卡方分布,进而给出了回归系数的置信区间.该区间估计方法不需要给出扰动函数以及任何渐近方差的相合估计,改进了已有的统计推断方法.另外,通过数据模拟以及一个实例分析研究了所提出方法的有限样本性质.
彭智庆[8]2014年在《NOD序列下半参数回归模型和非参数回归模型估计相合性的研究》文中提出关于对NOD序列理论的研究,特别是讨论研究一些重要的不等式,在最近几年里得到了充分的发展,例如Rosenthal型不等式,Bernstein不等式,NOD的矩不等式,部分和概率不等式等,这些重要的理论的发展促使NOD序列在统计领域得到了较好的发展。然而在统计领域的一个十分热门话题是对估计量相合性的研究,其在近几十年中也得到了很快的发展,但就NOD这个序列而言,在这个方面的结果还是相对较少的.因此本文将致力于研究NOD序列下半参数回归模型和非参数回归模型估计的相合性问题,获得了较好的结果.本硕士论文分为叁章:第一章是序言部分,主要介绍了问题的来源与价值以及半参数回归模型和非参数回归模型及其发展,相关的概念,一些可涉及到的不等式和引理。第二章主要研究了半参数回归模型yi=xiβ+g(ti)+σiεi,i=1,2,…,n,我们在综合了加权估计的方法和最小二乘法下,定义了未知参数β和未知函数g的最小二乘估计与加权最小二乘估计的估计量。采用截尾的方法并且利用NOD序列的矩不等式以及权函数的约束和其他条件证明了p(p>1)阶矩相合性,推广了矩的范围.第叁章考虑了非参数回归模型yni=g(xni)+εni,i=1,2,…,n,定义了未知函数9的估计量9n.我们研究了0<p<1和p>1情形下的完全收敛性以及在较弱的条件下证明了它的弱相合性,得到了较好的结果,由于独立序列和NA序列是特殊的NOD序列,所以我们得到的结果推广了非参数回归模型在误差为独立序列和NA情形下相应的结果。
陈天衡[9]2014年在《相依数据下EV回归模型中估计量的统计性质》文中进行了进一步梳理回归分析是使用极其广泛的数据分析方法之一.在实际应用中,它是理论与实际联系十分密切的统计方法,是处理和分析数据、研究数据之间的关系的重要工具.然而在实际问题中,数据的收集通常也是带有误差的,如果忽略了这些误差,那么得到的结果就会有偏差,用测量误差模型来处理实际问题就显得比较符合实际.测量误差回归模型,即EV回归模型,是指在模型中协变量具有测量误差的回归模型.本论文的主要内容是基于误差为鞅差序列或负相协序列对EV回归模型中估计量的渐近性质进行系统的研究.全文分为五章:第一章是绪论,主要介绍了研究的背景和意义,鞅差误差序列和负相协误差序列及EV回归模型的概念,归纳了国内外的学者对EV回归模型的推广第二章研究了误差为鞅差序列下的线性EV回归模型.利用最小二乘估计方法对模型中的估计量p和θ进行估计,并且在一定的条件下证明了估计量的强相合性和均方相合性.第叁章同样在误差为鞅差序列下的线性EV回归模型.为了改进一般的最小二乘法对未知参数估计时得到有偏估计影响,我们通过修正最小二乘法给出了未知参数的估计量,这使估计量更加精确,并在适当的条件下,证明了估计量渐近正态性.进一步,我们获得误差方差的估计及其渐近正态性.并且我们利用蒙特卡洛方法对上述估计量进行数值模拟分析,结果表明修正的最小二乘估计法优于普通的最小二乘法.第四章我们研究了负相协序列下的半参数EV回归模型.通过最小二乘法和权函数的方法给出了模型中的未知参数和未知函数的估计,证明了估计量在一定的假设条件下具有强相合性.第五章对全文的研究结果做了归纳总结,并介绍了论文的一下步计划和展望.
王成勇[10]2008年在《国内半参数回归模型研究进展》文中研究表明对半参数回归模型的研究是近年来统计研究的热点之一,它结合线性回归模型和非参数回归模型,吸收了各自的优点,因此不论是在理论研究上还是实际应用中都具有重要意义.文章总结了国内学者对半参数回归模型研究的贡献,理清了对该模型的理论研究演进的方向和脉络.
参考文献:
[1]. 线性模型与单指标模型的若干研究[D]. 郭朝会. 重庆大学. 2016
[2]. 半参数模型的估计理论及其应用[D]. 潘雄. 武汉大学. 2005
[3]. 纵向数据与生存数据的半参数联合模型研究[D]. 严国义. 武汉大学. 2013
[4]. 正相协序列下矩完全收敛及半参数回归模型估计的大样本性质[D]. 李佳. 南昌大学. 2013
[5]. 污染数据的统计分析[D]. 张先波. 华中科技大学. 2006
[6]. 带污染数据的回归模型参数估计[D]. 施露芳. 华中科技大学. 2006
[7]. 半参数变系数部分线性模型的统计推断[D]. 赵培信. 北京工业大学. 2010
[8]. NOD序列下半参数回归模型和非参数回归模型估计相合性的研究[D]. 彭智庆. 安徽大学. 2014
[9]. 相依数据下EV回归模型中估计量的统计性质[D]. 陈天衡. 安徽工程大学. 2014
[10]. 国内半参数回归模型研究进展[J]. 王成勇. 襄樊学院学报. 2008