一本了解统计学发展前沿的好书——范剑青、H.L.Koul合编《统计学进展》简介,本文主要内容关键词为:统计学论文,一本论文,好书论文,进展论文,简介论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
为庆祝当代美国著名统计学家Peter John Bickel教授65岁生日(Bickel教授是国际统计学大奖COPSS奖的首位获得者),范剑青①、H.LKoul两人合编了Frontiers in Statistics(“统计学进展”)这本文集,2006年该文集由英国帝国学院出版社出版。本书的撰稿人不乏国际统计学界的翘楚,所著文章大都视野开阔,启发思考,反映了学科的前沿发展,例如,半参数与非参数模型中的信息界能否达到,缺失数据模型②如何减少估计损失,基于某些标记经验过程及剩余经验过程、且适应渐近任意分布的检验能否建立在鞅变换之上,纵向数据分析中的协方差矩阵能否有效地做出估计,等等,均在讨论之列(一些问题已获得肯定答案),而它们都是既具有深刻理论意义,又具有实际应用价值的专题,在当代统计学研究中占有非常重要的地位。顺便指出,文集中的全部文章不仅被国际知名学者评论过,而且其中的绝大多数还在普林斯顿大学2006年5月18-20日举行的“统计学进展”研讨会上作过交流,因而非常值得我们关注。
一、Frontiers in Statistics各章标题一览
这本文集共有7部分22章。除第1章外(该章主要介绍Bickel教授的学术贡献),其余21章分别为:第1部分的2、3、4、5章涉及半参数模型;第2部分的6、7、8、9章涉及非参数方法;第3部分的10、11、12章涉及统计学习过程与自助法;第4部分的13、14章涉及纵向数据分析;第5部分的15、16章涉及统计学在科学技术中的应用;第6部分的17、18章涉及金融计量经济学;第7部分的19、20、21、22章涉及参数方法与统计推断。
各章标题如下:
第1章 沿着Bickel开辟的道路前进
第1部分 半参数模型
第2章 自1993年以来半参数模型进展回顾
第3章 时间序列的有效估计量
第4章 论单指数模型的估计效率
第5章 基于交叉核实的估计函数
第2部分 非参数方法
第6章 基于参数选择的功效调整
第7章 非参数非典型估计
第8章 小波在统计学中的应用:若干回顾
第9章 鞅变换下的模型诊断:简要回顾
第3部分 统计学习过程与自助法
第10章 辅助算法在多元时间序列中的应用
第11章 自助法回顾
第12章 一种离散非格点分布的推广
第4部分 纵向数据分析
第13章 纵向数据之非参数、半参数方法回顾
第14章 关于一个协变量纵向反应轨迹的回归
第5部分 统计学在科学技术中的应用
第15章 统计物理与统计计算:一种重要联系
第16章 网络X线照相术:回顾与最新发展
第6部分 金融计量经济学
第17章 关于扩散性的似然推断:概述
第18章 生产效率的非参数估计
第7部分 参数方法与统计推断
第19章 混合分布(Mixing Distribution)牛顿算法估计的收敛性及一致性
第20章 混合模型(Mixed Models)回顾
第21章 多元分析中位置估计量、散布性估计量之稳健性
第22章 关于估计损失的估计
此外,本文集附有大量的参考文献,各章末所附参考文献篇数如下:
第2章153篇;第3章48篇;第4章20篇;第5章32篇;第6章41篇;第7章15篇;第8章66篇;第9章65篇;第10章35篇;第11章93篇;第12章10篇;第13章79篇;第14章38篇;第15章22篇;第16章32篇;第17章57篇;第18章27篇;第19章12篇;第20章106篇;第21章91篇;第22章2篇。
如果读者已经具备数理统计、时间序列分析及多元统计分析基础知识,可以考虑如下的阅读顺序,即先依次阅读本文集的第一、第二部分,再阅读第三部分或第七部分,最后阅读第四、第五、第六部分。当然,读者也可以根据自己的兴趣和需要从文集的任何部分或章节读起。
可以说,该文集内容非常丰富,信息量巨大,开卷有益,值得重视。
二、各章主要内容简介③
论及Frontiers in Statistics就不能不提到一本书,即Bickel,Klaasen,Ritov及Wellner等4人于1993年发表的单卷本专著Efficient and adaptive estimation in semiparametric models(“半参数模型的有效性及适应性估计”,以下简称BKRW),这本书问世以后引起统计学界的广泛重视,后续的研究层出不穷,可以认为是当代统计学发展的一件大事。一个熟知的事实是,在正规的参数模型中,信息界是可以达到的,意即存在能够达到这些信息界的估计量。人们曾经猜想这结论对半参数模型也成立。BKRW走得很远,它试图全面讨论半参数模型,包括信息界估计、欧氏参数及非欧氏参数的有效估计等等,并且得到一批很有意思的结果。但也应指出,BKRW于1993年发表时处理的只是i.i.d.数据,未触及非i.i.d.数据。第2章“自1993年以来半参数模型进展回顾”正是对这种发展的一个综述。本章包括缺失数据模型,似然理论的检验,半参数混合模型理论,经验方法下的收敛速率,贝叶斯理论与方法,模型选择,经验似然,风险函数中有不可观测随机因素(关于生存数据分析),半参数回归模型,从i.i.d.数据向非i.i.d.数据的扩展,半参数及非参数模型信息界估计的其他可选方法等方面。例如,关于缺失数据模型,它告诉我们主要的进展是Robins,Rotnitzky和Zhao(1995)系统做出的、对具有缺失协变量半参数回归模型信息界的估计;而其他有关的信息界估计,则介绍了CAR(Coarsening At Random)及MAR(Missing At Random④)。由此可见,本章对于我们消化BKRW进而了解半参数模型最近15年的发展,具有重要意义。
第3章是“时间序列的有效估计量”,它首先对半参数时间序列有效估计的一种简单类型,即具有独立新息一阶非线性自回归作了介绍,进而介绍了自回归参数、新息分布、条件期望、平稳分布、高阶转移密度等内容,关心的重点是此类模型中的渐近有效估计量。
第4章“论单指数模型的估计效率”回顾了具有一个未知连接函数的广义线性模型,即所谓“单指数模型”(Single-index model)的研究进展。“单指数模型”是半参数模型的一种,它在计量经济学和统计学中都有重要应用,其建模要点在于允许高维(事实上是无限维)参数(称为连接函数)具有灵活性且未知(光滑性假设除外),但侧重点仍是对有限维协变量X及反应变量Y之间的线性关系参数做出估计。
第5章是“基于交叉核实的估计函数”,主要讨论若干基于交叉核实⑤、用于选择估计函数从而对感兴趣的参数进行估计的方法,并在很一般的条件下,得到了反映随机变量(它可产生相应的i.i.d.观测数据)分布特征的参数之渐近相合预报量。
第6章是“基于参数选择的功效调整”。通过极大化极限检验功效(原假设为μ(x)≡E(Y|X=x)=常数,以局部非参数Pitman效率为备择假设),本章提出局部线性回归带宽的选择方法,并且证明,功效最优带宽当样本量趋于无穷时趋于0的充要条件是,作为备择假设的Pitman效率序列,其以为中心的区间长度(在此区间上)当n→∞时非恒常收敛于0。
第7章是“非参数非典型估计”。利用原始的核密度估计,本章引进一个新的、具有泛函性质的、关于非典型指标的非参数估计量,这一估计量能够克服径直使用插入法(plugged in)将核密度估计量插入泛函而导致的偏误。
第8章是“小波在统计学中的应用:若干回顾”,它回顾了小波统计学方法过去15年来在回归函数估计、变点检测与估计、逆统计学问题的解以及随机过程自相似等领域中的进展。
第9章是“鞅变换下的模型诊断:简要回顾”。统计学的一个经典问题就是模型诊断,而关于回归参数的拟合不足(lack-of-fit)检验,关于给定回归模型误差分布的拟合优度(goodness-of-fit)检验,都在文献中得到了广泛的研究。本章指出,非参数方法能在拟合不足检验中发挥重要作用。本章回顾了渐近适应任意分布(distribution-free)的检验,这些检验是针对基于某些标记经验过程(marked empirical processes)及剩余经验过程(residual empirical processes)而做出的。本章认为,这些检验均可建立在关于这些过程的鞅变换之上。
第10章是“辅助算法在多元时间序列中的应用”,而辅助算法(boosting)与自助法(bootstrap)都和非参数方法有密切联系,例如关于非参数分类及回归的一个有效方法即为辅助算法。本章回顾辅助算法近年来的发展并提出一种新的关于多元线性时间序列的自助法。
第11章“自助法回顾”,对近年来关于独立过程、几类相依过程包括马尔科夫过程、长距相依时间序列及空间过程的自助法发展作了综述。自助法的一个重要理论证明工具是渐近展开(asymptotic expansions),当基础分布(underlying distributions)为绝对连续或纯格点分布(pure lattice distribution)时,这种证明并不难理解。
第12章“一种离散非格点分布的推广”,研究离散非格点分布并对本领域内若干具有挑战性的课题进行了探讨。
第13章是“纵向数据之非参数、半参数方法回顾”。纵向数据及函数性数据(functional data)分析在过去的20年里取得了长足发展,文献大量涌现,本章对这此作了回顾并对纵向数据分析中的协方差矩阵估计作了深入讨论。本章由范剑青及宾夕法尼亚大学的Runze Li合作完成。
第14章是“关于一个协变量纵向反应轨迹的回归”。它回顾了函数回归模型及存在稀疏纵向数据时(借助条件期望算法的)主成分分析两方面的进展。
第15章是“统计物理与统计计算:一种重要联系”。通过详细考察著名的、关于伊辛模型⑥的Swendsen-Wang算法,以及由Huber推进的完全抽样法(perfect sampling implementation),本章表明统计物理与统计计算可以相互促进,相得益彰;同时指出了统计物理与统计计算领域近年来取得的若干重要进展及其存在的问题。
第16章是“网络X线照相术:回顾与最新发展”,它对网络X线照相术中有关的统计学问题、尤其是活动X线照相术进行综述,并以因特网通话为例作了说明。
第17章是“关于扩散性的似然推断:概述”,它给出基于离散样本数据扩散过程的似然推断的一个回顾,这在金融计量经济学中具有重要意义。本章还详细讨论了转移密度及其应用。
第18章是“生产效率的非参数估计”,本章回顾了若干很有前途的、关于生产(效率)分析的非参数边界估计的最新理论发展。
第19章是“混合分布牛顿算法估计的收敛性及一致性”。当代统计学问题借用了众多传统统计学的观念,本章展示的关于混合分布牛顿算法估计的收敛性及一致性,就是这方面研究的最新发展。
第20章是“混合模型(Mixed Models)回顾”,本章在对线性、广义线性及非线性混合效果模型做出概述的基础上,对这些领域近年来取得的进展及面临的挑战作了阐述。本章还特别分辨了“mixed model”与“mixture model”的不同,指出它们虽然有联系但却存在重大区别。一个“mixture model”通常是利用条件分布进行定义,而一个“mixed model”却总是含有随机效应。
第21章是“多元分析中位置估计量、散布性估计量之稳健性”。众所周知,若基础数据服从正态分布,则可对抽样得到的样本均值向量及样本协方差矩阵做出最优估计(即最有效估计),然而这种估计对具有离群值和厚尾的数据却呈现出极端的敏感性。本章讨论关于这些传统估计量的各种稳健估计,以及它们在多元统计中的应用。本章对了解多元统计分析的最新进展很有帮助,对更加灵活地运用多元分析方法解决实际问题带来了方便。
第22章是“关于估计损失的估计”,提出了一种很有新意的方法来估计关于估计的损失,其关键点在于引入关于密度p(·)及q(·)的Kullback-Leibler伪距离,即(可视为一种判别信息量),从而把估计量g(y)的Kullback-Leibler损失(KL损失)定义成)。如此,就能利用判别信息量带来的概念与技术上的便利进行有关损失的估计。
可见,Frontiers in Statistics确实内容丰富,新意盎然,是一本好书。
三、关于阅读的几条建议
从上面的介绍我们知道,Frontiers in Statistics是很值得仔细阅读的。为了读好它,本文提出以下几点建议供读者参考。首先,因为协方差矩阵已渗入自然科学、人文科学的各个方面⑦,所以我们应该熟悉有关的矩阵计算,特别是“稀疏协方差矩阵”的估计和计算。
其次,综述性的学术文献一般较长(一篇这样的文章包含上万个单词是很常见的),这需要读者具有足够的耐心,而对这种文献在行文中所提及的另外一篇(或另外几篇)重要文献,读者也应有能力跟踪。例如,第2章认为“半参数”这一术语最早出现在Gail等于1980年“Biometrics”(生物计量学)发表的论文,而为了深入讨论这一专题,又必须对半参数与非参数模型作出对比。限于篇幅,第2章没有详细展开这种对比而是在末尾处提供了若干参考文献供读者进一步追踪:其中一篇特别重要的综述由Bickel与Ritov合写⑧,它详细阐述了半参数与非参数模型的历史发展、取得的成果及需要更深入研究的课题。显然,不读Bickel与Ritov的这篇文章会有许多损失。
Bickel与Ritov的文章精彩迭出,现试举一例作简要说明。在谈及半参数模型的历史发展时,Bickel与Ritov写到:
“Semiparametric statistics arose primarily from three main fields of applications:biostatistics and reliability,where censored and truncated data first came to the fore and in 1958 and the Kaplan-Meier estimate first appeared; sample surveys and census,where biased and stratified samples and the Horvitz-Thompson estimate appeared; and econometric models where all of these types of data presented themselves.Founding figures in these fields were Neyman,Hartley and Hajek in sampling,Kaplan and Meier in survival analysis,and Rasch and others in econometric modeling.Theoretical development through the theory of point processes came into survival analysis in the work of Aalen (1978a,b).More generally,decision theoretic asymptotic optimality in these models was developed in the work of Levit (1978),and Ibragimov and Has' minskii(1982).Pfanzagl (1982) and subsequently Bickel et al.(1993) developed in a systematic way estimation for regular parameters in models of this type.Results for inference in particular models appear continuously.The emphasis is on estimation,testing and confidence intervals for regular parameters,with convergence playing a central role.It appears,we believe correctly,that this area is a fairly direct descendant of the pre 1975 nonparametric statistics,e.g.,the rank tests of Hajek (1962) Gehan (1965),starting with van Eeden (1970).”
这一段主要告诉我们,半参数统计学肇始于统计学在下述3个方面的应用,即生物统计和可靠性统计(Kaplan和Meier于1958年首次对删截型数据给出统计分析);统计调查及人口普查(有偏样本和分层抽样样本出现,Horvitz和Thompson估计问世);计量经济学模型(在这种模型中所有类型的数据都能出现)。Neyman,Hartley及Hajek在抽样技术方面,Kaplan和Meier在生存分析方面,Rasch等人在计量经济学模型方面均有建树。在理论发展方面,Aalen将点过程引入生存分析是一个重大突破(1978),更具普遍意义的是Levit(1978),Ibragimov及Has'minskii(1982)的工作,他们发展了判决理论的渐进优化方法。此后,Pfanzagl(1982)和Bickel等人(1993)关于具有正规参数的模型又发展出系统的估计方法。有关这些统计问题的研究结果层出不穷,重点无外乎涉及具有正规参数(模型的)估计(含区间估计)及假设检验,而以速率收敛在这些统计分析中发挥了中心作用。Bickel与Ritov认为这些工作都是1975年以前的非参数统计学(如秩检验)的继续。
再其次,我们应采取循序渐进的阅读策略,整本书读起来有困难就先读懂一章,一章有困难就先读懂一节,一节有困难就先读懂一个定理,总之,要稳扎稳打、步步为营,就怕起步起不来。切忌囫囵吞枣,似懂非懂⑨。
最后,读者还应具备一定的动态对等翻译能力⑩。因为在阅读专业文献时,我们时常需要逐字逐句地将外语文献译成汉语,以便精确理解它。
注释:
①范剑青,福建莆田人,1982年毕业于复旦大学数学系,随后考入中国科学院应用数学所攻读硕士学位,师从方开泰教授,1986年进入美国加州大学伯克利分校攻读博士学位,师从Bickel教授和Donoho教授,1989年以优异的成绩提前毕业。现为美国普林斯顿大学统计与金融工程终身教授,The Annalsof Statistics杂志主编,2000年COPSS奖得主,在非参数建模、非线性时间序列、生物统计、广义线性模型、小波、计量金融与风险管理等方面均做出重大贡献。
②由于各种原因,在民意调查、市场调研、社会经济调查、医学及其他科学试验等方面,普遍存在数据丢失或数据不全的现象,因此,缺失数据模型近年来受到极大的关注,亟待深入研究。
③本节主要取材于Frontiers in Statistics前言,为方便读者理解,本节对有关内容添加了注释。
④对于一组不完全数据,i=1,2,…,n,若全部均被观测到而缺失,则,反之,(即未缺失)。MAR意指给定Y及Z时,δ与X条件独立。
⑤交叉核实的基本思想是留下一个数据点作为模型的核实数据,而用其他所有的数据点来建立模型。
⑥伊辛模型(the Ising model)是德国学者Ising提出的最简单的描述无限多个相互作用的自旋物理模型。晶格的每个格点上占据一个有向上、向下两个可能状态的自旋,它们与其最近邻自旋间有相互作用。相互作用会使最近邻自旋的排列方向一致,因此在绝对零度所有自旋的取向将会完全一致。该模型具有丰富的物理内容,例如,它可以描述液体的冻结和蒸发等相变现象,也可以研究连续的量子相变、动力学临界行为等。1925年,Ising本人得到一维伊辛模型的精确解。1944年,美国物理学家Onsager获得二维伊辛模型的精确解,被视为统计物理学上的一项重大进展。但迄今尚无被学术界公认的三维伊辛模型精确解。
⑦范剑青,工作论文.High-dimensional Covariance Learning.Wuhan University.June 20,2008.
⑧Non and semi-parametric statistics:Compared and contrasted by Bickel and Ritov.Journal of Statistical Planning and Inference 91 (2000) 209-228.
⑨这是张尧庭先生生前对我们的谆谆教导。
⑩“Dynamic Equivalent Translation”“(动态对等翻译”)是美国著名语言学家Eugene A.Nida于20世纪60年代提出的一种全新的翻译理念。他坚持认为任何能用一种语言表达的东西,都能够用另外一种语言来表达;语言之间、文化之间能够通过寻找翻译对等语,以恰当方式重新组织信息的形式和语义结构而进行交际。Eugene A.Nida的“动态对等翻译”被公认为是对传统翻译理论和方法的重大突破。