统计学生命力的重新审视,本文主要内容关键词为:统计学论文,生命力论文,重新审视论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、统计学的生命力在于应用
(一)统计学产生于应用
统计学的发展过程中可以看出统计学产生于应用,在应用过程中发展,它的生命力在于应用。
300年前,威廉·配第(1623-1687)写的《政治算术》,从其研究方法看,被认为是一本统计学著作。政治算术学派的统计学家将统计方法应用于各自熟悉和感兴趣的研究领域,都还是把其应用对象当作肯定性事物之间的联系来进行研究的。他们确信,事物现象存在着简单明了的数量关系,需要用定性与定量的方法将这种关系(规律)揭示或描述。使人们能够更具体、真切地认识世界。
数理统计学派的奠基人凯特勒在统计学中引入了概率论,把它应用与自然界和社会的许多方面,从而为人们认识和说明不确定现象及其相互之间的联系开辟出了一条道路。在自然科学和社会科学的许多领域,都留下凯特勒应用统计学研究的烙印。自从凯特勒把概率论引入了应用中的统计学,人们对客观世界的认识及描述更全面、更接近于实际了。他在广泛应用拉普拉斯等人概率论中的正态曲线、误差法则、大数法则等成果的过程中,为统计学增添了数理统计方法,进而又扩展了统计学的应用范围。
在应有中对发展统计方法贡献显著的当推生物统计学派的戈尔登(1822-1921)、皮尔逊(1857-1936)和农业实验学派的孟德尔(1822-1884)、戈塞特(1876-1937)等。戈尔登六年中测量了近万人的“身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、、色觉及个人的其他资料”。在探究这些数据内在联系的过程中提出了今天在自然科学和社会科学领域中广泛应用的“相关”思想。将大量数据加以综合描述和比较,从而能使他的遗传理论建立在比较精确的基础上,为统计学引入中位数、四分位数、分布、回归等极为重要的概念和方法。皮尔逊在检验他老师戈尔登的“祖先遗传法则”和自然选择中“淘汰”对器官的相关及变异的影响中,导入了复相关的概念和方法。在讨论生物退化、反祖、遗传、随机交配等问题中,展开了回归与相关的研究,并提出以X[2]检验作为曲线配合适合度的一种量度的思想。
农业实验学派的孟德尔和戈塞特同样是在实验回答各自应用领域中出现的新要求、新课题,发展了统计思想和统计分析方法。孟德尔及其后继者贝特森等人创建的遗传试验手段,比通过记录生命外部联系曲折反映事物内在本质的描述统计更加深刻。他们运用推断的理论与实验的方法,通常只用小样本来处理。戈塞特的T分布与小样本思想更是在由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性”的情况下产生的。今天,这些统计思想和分析推断方法已经成为了科学家们不可缺少的基本研究工具了。
近现代,统计学已经空前广泛应用于最高级的运动形式——社会。其结果便是出现了系列与其应用对象指导理论和其它相关学科交织在一起的边缘学科。如在社会经济方面的投入产出经济学、经济计量学、统计预测学、统计决策学等等。在这些边缘学科中,统计学与其应用对象结合更紧密、更自然。这些学科的专家学者至少在两个或两个以上的专业领域里有比较深厚的学术造诣。统计学的应用帮助他们在各自的应用领域中取得辉煌的成就。
可见,统计学的发展一刻也离不开应用。它在应用中诞生,在应用中成熟、独立,在应用中扩充自身的方法内容,同时扩展了应用领域,又在应用中与其他学科紧密结合形成新的边缘学科。一部统计理论发展史同时又是一部应用统计发展史,正因如此,统计学的生命力在于应用。
(二)理论研究为统计学的应用奠定了基础
统计理论问题的研究和应用研究从总体上说应该属于“源”和“流”的关系。如果理论不成熟,方法不完善,统计应用研究也很难达到较高的水平。因此,充分发挥统计学的生命力,必须建立在统计理论研究的基础之上。
现阶段,我国统计理论工作者在大胆解放思想的基础上,冲破各种精神桎梏,对传统统计学进行了一次全面的反思,在统计理论研究方面取得了令世人瞻目的可喜成果,其研究的前景是十分令人乐观。
第一,我国统计理论研究的僵化局面已经打破,大多数人已不再在“姓资”或是“姓社”问题上纠缠不休,不再死搬硬套马克思列宁主义原理,不再仅仅局限于统计指标的阐释,抛弃了教条主义的那套东西,那种掺杂着门户之见的论辩基本消失,统计理论研究的环境越来越好。
第二,统计理论研究领域更加广阔,如在国际统计比较研究方面;在统计文化与统计行为研究方面;在统计组织体制与统计法规体系研究方面;统计与教学结合、统计与计算机结合等都取得了可喜的进展,这大大丰富了我国统计理论研究的内容,并在实践中取得了一定的成效。
第三,把统计理论放在改革开放的大背景下进行探讨,大胆借鉴了西方统计理论中的合理成份,使统计政策的制定有了比较坚实的理论基础。我国统计调查模式、统计核算体系的改革,统计分析方法的丰富以及统计参与决策能力的增强标志着我国的统计建设进入了一个新的阶段。
从国际上看,统计分析技术的研究有了新的发展。这些研究的总体特征是,广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法研究,并拓展了统计研究的新领域。这一些都充分地体现了统计学强有力的生命力,其具体表现在:
第一,统计学为计算机科学的发展发挥作用。在计算机协助的电子通讯、网络创新、资源及信息统计中的统计软件等方面,对统计信息搜集、存贮和传递中利用计算机提高工作效能,建立统计信息时空结构有了新的发展。在网络推断、统计软件包、统计建模中的计算机诊断方面,提出统计思想直接转化为计算机软件,通过软件对统计过程实行控制的作用,以及利用计算机程序识别模型、改善估计量性质的新方法。这些研究成果使人们兴奋地看到计算机技术正在促进统计科研工作发生革命性变化。在软件的质量评估上及统计程序和方法在软件可靠性检验等方面也有了新的发展。
第二,统计理论与分析方法的新发展。近年来,统计方法成果丰硕,反映了统计理论与分析方法在不断的发展中趋于成熟和完善。在贝叶斯方法、非线性时间序列、多元分析、统计计算、线性模型、稳健估计、极值统计、混沌理论及统计检验等方面,内容广泛而翔实,可以归纳三个方面:(1)理论上有新的开拓。如应用混沌理论提出混沌动态系统、混沌似然分析;引入数学中象分析、谱分析的方法,探讨象分析中同步模型化的方法,建立经验谱类函数的假设检验方法等;(2)不同的分析方法相互渗透,交叉结合运用,衍生新的分析方法。如马尔可夫链,蒙特卡罗方法在贝叶斯似然计算中的应用,参数估计方法的非参数校正,状态空间模型与月份时间序列的结合运用;(3)借助现代计算机技术活跃新的研究领域。在计算机技术迅速发展的带动下,模拟计算理论和方法有了长足的发展,这给非线性模型等因计算繁烦而沉闷多时的研究领域注入了新的活力,提出了非线性结构方程模型的特征向量估计方法,非线性回归中的截面有效性逼近,带噪声的非线性时间序列的识别等富有见地的新思路。Logistic模型、向量时间序列模型的研究也因计算技术的解决而不乏新成果。
第三,统计调查方法与记述的创新。调查方法是统计方法论的重要组成部分,近年来,在抽样理论与方法、抽样调查、实验设计方面十分关心如何改进调查技术、减少抽样误差等问题。调查过程的综合管理、不管概率抽样设计、分层总体的样本分配、抽样比例的回归分析和实验设计正交数组的构造方法等方面有了新见解。再抽样及随机加权方法、随机模型及连续调查报告的趋势计量、辅助信息和抽样方法,则涉及多种统计分析和计算机方法的应用,在转换样本调查设计等方面也取得一定成果。计算机辅助调查有了新的发展。
众所周知,理论来源于实践,反过来又服务于实践。统计理论的研究和分析技术的发展,无疑对统计的实践起到了一定的指导作用。从另一角度也显示出了,统计理论和分析技术的不断完善,为统计学的应用奠定了基础,确保了统计学强大的生命力。
二、科学的融合体现了统计学旺盛的生命力
(一)科学融合趋势的兴起为统计学的发展提供了机遇
近代科学融合潮流的出现,不仅是科学自身发展规律的必然表现,更是科学发展的内在要求和社会实践的迫切需要。
从现代科学发展的轨迹,及科学的融合过程我们看到:一是同一科学部类内部的有关学科之间的相互交叉与渗透,产生了例如物理化学、生物统计、射电天文、经济地理等学科;二是不同部类的有关学科之间的相互交叉渗透,产生了例如数理经济、社会生物、计量历史等学科;三是由于科学与技术的紧密结合,使得许多学科实现了工程化,产生了例如化学工程、生物工程、知识工程、金融工程等学科;四是近数十年来出现了系统论、控制论、信息论、协同论、突变论、耗散结构论、超循环理论、混沌理论等一批“横断”学科,它们所发现的一般规律正在越来越多的学科中得到应用;五是由于科学研究活动的群体化及社会化程度不断提高,以及数学模型及计算机的普遍应用,自然科学家要学习经济与管理知识,而社会科学家则要学习数学与计算机知识,双方的相互了解日益增多。目前这一融合过程还在继续并不断增强,最后将会在此基础上实现新的综合,进而实现科学的融合。这一趋势的兴起为统计学的纵深发展提供了机遇。
(二)对系统性及系统的复杂性的认识渗透着统计思想
自20世纪初以来,由于社会实践的广度及深度的迅速扩展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性的认识也更加全面而深入,它们的结合处处渗透着统计思想,概括起来有以下几个方面:
第一,微观与宏观的结合。人们对客观世界的认识往往是从个别事物开始的,但是当人们对一类事物积累了若干个体的认识后而想把握对其总体的认识时,逐渐会发现个体与总体的性质之间有一定差异;(1)总体具有个体所不具备的某些性质。(2)总体的性质可以与个体的性质联系起来。(3)无规律运动的个体可以组成有规律运动的整体。
第二,层次结构与功能结构的结合。按照系统论的观点,可以将由个体(单元)集合而成的整体称为系统。系统有两种基本的结构,即层次结构与功能结构。例如一个国家的经济系统可以按地区来划分,也可以按行业来划分。在研究一个系统时,必须注意这两种结构的结合。
第三,静态和动态的结合。客观事物总是处于不断的发展变化之中,它从一个状态推移到另一个状态,这一推移就称为过程。对一项事物即可以从静态的角度研究其状态,又可以从动态的角度研究其过程。近年来人们发现,最好的方法是将静态和动态结合起来,从一事物过去的状态推移来加深对其现状的认识,并预测出其发展变化的方向。现在的趋向则是将二者结合起来,用统一的模型,例如将静态模型中的参数表示为时间的函数来进行模拟及预测控制。
第四,系统与环境的结合。为了便于进行研究,通常将研究对象看作系统,而将其外部世界看作环境,并且还常假设系统处于与环境隔绝的平衡状态。应看到,系统及其环境都不是均一的,因此系统内部各单元之间的相互作用的可能域几乎是无穷无尽的,这也是系统产生随机性的原因之一。
第五,明确性与模糊性的结合。应当承认,客观世界从哲学上说是可知的,但在实际上却总有未知的部分。我们应当承认在对客观世界的认识中存在着一定的模糊性,并采取适当的方法来处理这种模糊性,使其相对地“明确化”。近年来有些学者将模糊数学用于复杂现象的研究中,取得了良好的效果。
第六,确定性与随机性的结合。随着科学的发展,人们开始认识到系统的随机性,即由于一些偶然性因素的作用,系统内会出现多变的联系,不可预知的因果关系,以及无一定规律可循的发展变化,从广义上说是无序的。近年来还发现,即使是在确定性的系统中,也存在着内在的随机性,就是所谓混沌的现象。应当承认,确定性与随机性都是客观存在的。从较短的时期内和较低的层次上来看,随机性可能会出现较多,甚至会起主导作用;但是从较长的时间和较高的层次上看来,确定性还会起主导作用。人们永远不可能准确地预测未来,但概括地预测未来是完全可能而且十分必要的。这就是确定性与随机性的结合。
第七,自组织与组织的结合。由于系统内部各单元之间的相互作用,可以使系统向功能更强、更加适应外部环境的方向发展变化,例如生物的进化、技术的进步、社会的发展等等。这一过程就称为系统的自组织。在某些情况下,可以通过外部环境的改变,人为地加速或延缓系统的发展变化,这一过程可称为系统的组织。例如在经济系统中,无数企业及个人的日常经济行为通过市场这一“看不见的手”在促进经济的发展,而政府这只“看得见的手”也可以通过调整利率、税收政策及货币发行量等手段来进行宏观调控。在任何一个国家的经济系统中,都存在着这两只手的作用,只不过在二者相对的强弱上有所区别。但应当注意的是,宏观调控决不能违反客观的经济规律,否则将会适得其反。
(三)定性与定量相结合的综合集成方法反映了统计学强有力的生命力
各部类科学的研究方法大不相同,在同一部类的各学科之间的研究方法也不尽相同,但从方法论的高度上说,对复杂系统应当有一个带普遍性的研究方法。可以认为,钱学森教授于1990年提出的定性与定量相结合的综合集成方法是迄今为止最值得重视的方法。
这一方法的实质是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对其确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,体现了在科学事例的过程,统计学的实际和强有力的生命力。
第一,定性分析与定量分析相结合。定性分析是指通过判断及推理,从用观察或调查等方法所得到的数据中获得对某一系统的性质及其发展规律的认识。而定量分析则是指通过计算(包括运算、统计及仿真)与数学推导,从实验或实践得到的数据中获得对某一系统的结构及其变化规律的认识。在自然科学的某些学科中早已采用定性分析的方法,例如动物及植物的分类、地质年代的判别、中医的望闻问切、辩证施治等。而在社会科学及人文科学中也已逐渐引入了定量分析的方法,例如数理经济学、计量历史学等。当前需要进一步促进这两种方法的结合,而且这一结合应当是双向的。即既可以由定性到定量,也可以在定量分析所得出结论的基础上进行判断推理,并考虑一些难以量化的因素,从而作出最终的决策选择。
在社会科学家中则存在着两种倾向。有些经济学家过分追求高深的数学方法,沉迷于复杂的数学推导中,而忽视了对经济机制及规律的探讨,因而会得出背离实际的结论。也有些社会科学家仍死抱着传统的观念,不相信也不愿意学习及运用定量分析的方法。
总之,当更多的科学家相信只有通过计算与“算计”相结合才能更好地发挥科学的作用时,科学的融合方有可能建立在有共同语言的基础上。
第二,分析与综合相结合。分析就是了解一个已有系统的单元、结构及功能,而综合则是将有关的单元集成为一个具有预定功能的系统。在研究复杂系统时,这两种手段是交替使用、相辅相成的。我们既要了解一个系统是由哪些单元所构成,其层次结构和功能结构如何,系统的总体功能是什么;也要了解系统是如何通过组织及自组织而不断演化的,如何由低级状态逐步发展到高级状态。对某一层次的分析通常会为其上一层次的综合打下基础。
第三,专家知识的集成。复杂系统的研究通常需要多学科领域的专家们参加,这就需要有一个将各领域专家的知识进行集成的方法,而且这一集成过程应当贯彻研究的全过程。例如在软科学研究中,要实现软科学专家与领域专家及决策者的结合,软科学专家与领域专家不仅是在一起工作,还要相互了解、相互尊重。领域专家一定要树立总体观念,不能只顾追求自己领域内的局部最优。决策者应当向软科学专家提出课题,并尽量参加总体框架的制定及方案选择的讨论,还要在研究过程中经常与软科学专家及领域专家交换意见。在软科学研究的五个基本环节(目标分析及总体框架的建立、现状分析及预测、建立模型、方案评价及选择、提出建议)中,都需要注意专家知识的集成。
第四,专家经验判断与计算机运算的结合。专家的经验判断是十分宝贵的,但是这种判断往往是定性的,而且不尽一致。计算机运算则具有强大的数据处理能力,能够以很快的速度定量地显示专家的判断,展示系统的结构与发展,并能模拟出各种假想方案的预期结果。因此复杂现象的研究需要人脑与电脑的结合。一般来说,人脑比较擅长于形象思维,富有创造性,适于进行定性分析;而电脑则擅长快速计算及按照既定的规则进行严格的逻辑推理,虽然可以具有自学习功能,但绝无创造性,适于进行定量分析,二者正好可以相辅相成。
通过上面分析,我们不难得出这样的结论:随着科学融合的不断深入,为统计学的进一步发展开辟了广泛的前景,为统计学的研究增加了新的领域。也就是说,在未来的科学发展过程中,统计学不仅不会被淘汰,而且将保持其旺盛的生命力,这是客观的、也是必然的发展结果。