统计与数学:对抗与合作_数学论文

统计学与数学:对抗与合作,本文主要内容关键词为:统计学论文,数学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

至少在统计学家中有一条公论,即统计学是一门数学科学,但它不是数学的一个分支。我们甚至有格言来作为表达本学科与数学的不同之处的方法。G.Box说:“所有的模型都是错误的,但有些是有用的”。G.Cobb说:“在数学中,内容掩盖了结构。在数据分析中,内容提供含义”。D.Moore说:“数学定理是正确的;当用技巧使用时统计方法有时是有效的”。只要数学对另一个领域的现象建模,这些格言总适用,只是要强调统计是另一个领域。Cobb和Moore[2]探讨了这一事实对统计教学的内含。

本文的焦点既不是数学和统计学的科学区别,也不是这些学科的教学。我们关心的是这些学科现在运行的环境和我们的环境对我们前景和合作机会的影响。特别地我们相信美国统计学会(ASA)和美国数学协会(MAA)间日益增加的合作对数学家和统计学家的利益都有好处。

当然其他主要的学会,如美国数学学会(AMS)和数理统计研究所(IMS)也为数学家和统计学家服务。事实上这些机构是支持科学研究的最主要的团体,并且由此它们在这两门学科的文化中起巨大作用。AMS的作用是特别显著的,这是因为大多数数学家是作学术研究的,而大多数统计学家则不侧重学术研究。我们特别推荐ASA和MAA,因为这些团体在诸如大学本科教育的领域中一直更加活跃,以及与MAA有关的统计学家比与AMS有关的统计学家更多。

我们以这样一个简单的论点开始:统计学具有可能对数学有极大帮助的文化实力,而数学具有能够为统计学家提供对其生存至关重要的庇护的组织实力。这两门有联系的学科间更好的关系可以帮助二者。我们可以说数学是法国人,统计学是不屈不挠的盎格鲁撒克逊人。为自己悠久历史和高度发展的文化而自豪的法国人小心翼翼地防备盎格鲁撒克逊人实用主义的侵袭。有一位法国外交官说:“它在实际中可行,但它在理论上可行吗?”改变文化从来都是不容易的,但有迹象表明数学家逐渐在认识某种改变的必要性。他们这样做时可能(无意地)把统计从默默无闻中挽救出来。

在发挥我们的论点时,我们呈上一些潜在的统计学家和数学家都不愉快的含义。侧重学术研究的统计学家将不得不放弃自治的幻想并寻求数学组织实力下的庇护。更糟的是,正当各种发展使统计学的实施比过去更少地依赖数学时,人们该认识到数学为统计学提供了智力和机构的保护。于是来到我们餐桌的统计学家将被端送上劣质的馅饼。对我们的数学家同事我们端送什么呢?我们督促他们象旁人一样看待他们的文化并作改变。糟糕的是,我们献上的是自己的领域,统计学,作为这种改变的模式。旁人如何看待数学?AMS最近花了七年时间,调查了数学系学术委员会主席和系主任。以下是系主任说的话[6,p65]。

每一次讨论的流行话题是数学的孤立。许多系主任承认数学家不与其他系或数学以外的部门交流,他们认为这对研究和教学都是一个问题。在许多场合下,系主任把数学和与各处却有联系的统计学进行对比。

我们说数学变得孤立而统计学受危害,这引起辩论,但我们要以数据立论并希望别人也如此做。

一、统计学是不同的

我们以描述统计学是一门更健康的学科的方式开始。在许多鼓舞人的重要迹象中,我们发现日益增加的学生注册人数,对教学的一致意见,更多的非学术行业就业以及与许多学术领域的联系,对技术改革的正面反映。

(一)日益增加的注册人数

1995年CBMS调查详细记载了注册的情形。即使我们只看数学系和统计系,也能看到选初等统计课的学生迅速增加,而粗略地讲,数学系的其他各门课在减弱。

初等统计学注册人数(单位:千)

数学系

 统计系

年制学院

总和

1990

 87   30  

54

171

1995

  115   49  

72

236

根据同一调查[19,p.90],二年制学院(那里数学系注册人数在增加)注册统计和微积分I的比从1990年的5.6%增加到1995年的8.2%。在过去的三年里,高级定位统计学(Advanced Placement Statistics)的建立和迅速增长,——考试次数1997约为年7500次,1988年15486次,1999年25240次,2000年预期38000次——这意味着首次大量的有志从事学术活动的中学生接触到当代以数据为中心的统计学。有些将决定更多地学习这门学科。

同时主修数学和注册高级(upper division)专业课程的人数大大削减[9]:

教学注册人数(单位:千)

1985 1990 1995 %变化(1990~1995) %变化(1985~1995)

微积分

637

647

539 -17

-15

高级课

138

119

96

-19

-30

统计学注册人数上升的趋势伴随着人们对,特别是在入门课程中,应该教的内容有广泛一致的意见一起发生。

(二)对教学的一致意见

虽然宣称任一组科学家对某一学科达到一致意见是太轻率了,但统计学家已按科学标准对我们应该教给初学者的重要课程达成一致意见。如R.Scheaffer所说[27,P.156],“就统计学入门课程而言,统计学家今天已达到比我以往事业生涯的任何时候更紧密的一致意见。”请与数学家中“改革微积分”的战争比较。

统计学的博士课程经历更多的争论,但朝着有三个相等基本材料的模式演变:概率论,统计理论和方法论。平等地对待方法论(一般是既有经典的又有使用计算机大强度计算的)是相对近期的趋势。请与下列事实对比:AMS专业委员会一直未能就“AMS是否应宣扬进行更多的交叉学科研究,并相应地拓广研究生课程,如果是这样,怎么办?”这一问题发表报告,而原因是其成员意见不一致[17]。

甚至在应国家数学教师委员会之邀评论重要的标准(Standards)[22]的修改草案时也可看到数学家间缺乏一致意见,可把MAA团体的陈述“我们努力工作并且对我们的报告成功地达到一致意见”[26]与AMS的回答,它“发现在许多问题上我们远没有一致意见”进行对照。ASA团体很快就统一的报告达成一致。

为什么统计学注册人数在增加?为什么会产生对教学的一致意见?原因无疑是多种多样的,但这两个趋势肯定与人们日益认识到统计学是一门以解决现实世界上的问题的学科有关。这门学科的这一意义也反映在它与其它科学学科的联系,以及学习统计的人有在非学术行业就业机会之上。

(三)更多的非学术行业就业

1999年度的AMS-ASA-IMS-MAA调查[18]显示了基础数学和统计学的博士就业的持续差别,我们感谢AMS的J.Maxwell提供这一报告的预印复印件。1998~1999年博士学位获得者在美国就业情况如下:

按学位论文领域划分的新博士的非学术行业就业:

这里PAN指概率,应用数学和数值分析领域的集合。“其他”可以认为是基础数学。非学术行业就业领域间的差别虽然依然显著,但由于近年来越来越多的基础数学博士寻求非学术行业就业,这些差别事实上已经有些减少了。还存在相当大的年间差别:这三组人的1997~1998年博士学位获得者非学术行业就业的百分比为54.7%,46.5%和29.49%。然而,这一差别不改变三个领域相对的位置。

同一调查的数据表明获得统计学博士学位的妇女多于获得数学博士学位的妇女:

数学科学女博士

统计学 其他领域

35.7%25.7%

虽然数据不足,我们猜测这一差别与统计学非学术行业就业机会较多有关。

由于调查数据只与博士学位获得者有关,它们没有充分表达领域间的对比,统计学有旨在训练非学术工作统计工作者的有意义和非常适于应聘的专业硕士学位。大多数统计系把专业硕士课程和第一阶段的博士课程(它也可能导致硕士学位)区分开来。虽然由于具有硕士学位的统计工作者通常不参加专业学会,所以数据不易获得,但是根据活跃的专业人员个数来看,数学和统计学是大小相近的学科,统计学在学术界是较小的领域,但在校园之外数学是较小的领域。

统计学家在校园里和其他领域的同事合作时也象在非学术行业就业一样有较多的机会。

(四)与许多领域的联系

数学家无可非议地被他们学科的抽象美所吸引,B.Russel把这种美刻画为如雕像美一样冷酷而严峻。但是在过去的一个世纪里,特别是近50年里,追求抽象美常常意味着割断与其他学科的联系。数学家就象他们的系主任告诉AMS调查员的那样,由于不愿与其它学科的研究者交谈而变得声名狼藉。甚至一组被调查的高级数学家也赞同说:“数学科学家和其他科学家的交流在全世界都是薄弱的”。

当然这组数学家推诿说非基础数学的数学科学家常常要在必须进行交流的环境中工作。这对于从事非学术工作的统计学家即大多数统计学家当然是对的。在私人部门的统计工作几乎总是属于交叉学科的,集中于满足医学实验,市场研究,或改进工业生产的需要,而不是统计学本身的内部发展。从事学术工作的统计学家较迟感到应作的事,但有许多人已表现出转变的热情。长久以来统计系就进行了为校园服务和训练研究生的咨询工作。随着科学统计学的改变,前沿研究变得不太象数学研究而日益与其它学科交叉,注重方法,常常被从其它领域产生的问题所推动。常常可以发现有名望的青年统计学家集体作基因组,计算金融学,神经科学,数据压缩等的研究。在一流的斯坦福统计系,大约有一半的教师受其他学科的联合聘用(兼职)。Carnegie Mellon学院要求所有的统计学博士生与外系某人合作完成一个持续一学期的交叉学科项目。约十年前的一次大会上产生了国家研究委员会的报告“现代交叉学科大学统计教育”[23]。在过去十二年里NRC的应用和理论统计学委员会举行把统计学应用于各种其他领域的新生研究领域的大会并出版了论文集。

虽然统计学在作为一个独立领域存在的过去一个世纪中比数学更外向,但它有力的延伸和与其它学科富有成效的联系是主要由计算机引起的较近期发展。

(五)被计算技术强化和重新定向

科学统计学文化和内容的改变的大部分原因是统计教学改革,改观了统计实践以及创立了新类型研究问题的技术。

在计算机产生之前,统计学教师基本上只有两种选择——推理或算法。某些课程强调证明,因而失去了除最喜爱数学的学生;其它一些课程强调计算,因而使除了最急于通过考试的学生之外的人感到厌烦。这两种教学重点都没有显示出统计学是实际有用的或使人智力上感兴趣的。一经计算机产生而使学生可以处理实际数据之后,大家的意见较快达成一致大概是毫不足怪的。

统计实践也感到计算技术的深刻作用。既然你可以很快地完成一次分析,那么就可以用不只一种方法分析数据集并比较其结果。一旦你把数据输入计算机,为增加的分析而必须作的有限努力是极小的。多重分析导致更强调验证假设和拟合模型,这又进一步开拓了诊断和统计图方法的研究领域。

由于非学术统计学就业的重要性和在校园提供咨询的传统,科学统计学最终要响应专业实践的变革。但变革最原始的推动力一直是新类型问题向人类智力的挑战。

50和60年代的科学统计学,由于希望可以在数学上令人满意地进行归纳推断而显得内向。统计实践的向外拉力目前是更令人注意的。例如40年前贝叶斯学派一直在证明他们的方法具有非贝叶斯学派所不具备的诱人的性质。虽然论据在数学上是严格的,但是他们没有使从事实际工作的人转变观点,甚至在不太复杂的应用场合,贝叶斯后验分布也太难于计算。高速计算机计算使人们可能在新的环境下重新迎接计算上的挑战并且以科学研究响应。在过去十年中,马尔柯夫链蒙特卡洛和其他以计算机加强的方法把贝叶斯后验分布的计算变得近于自动进行。现在贝叶斯方法在实践中的应用日益增加,并且“贝叶斯计算”成为一个活跃的研究专业。

用以往的标准看现在的计算问题资源是无穷尽和无约束的,它们与产生以前不可想象的数据量的其他领域的扫描技术结合起来,提出了有关分析大数据集的新问题;可参见文献[10]和[7]。明智地使用计算机计算同时改变了分析小数据集的方法,这是因为再抽样方法允许用大规模计算来取代难以验证的模型假设[5]。其结果是由于技术把统计学移向它在数据分析和科学推断的根基,研究重点大大转移了。由于不再受限制性假设的束缚,统计学家可以对学术界同事提供更灵活有用的咨询,所以统计学与其它领域的联系加强了。同时可以看到强化的计算方法(bootstrap;神经网络,小波)成为统计核心。一个显然的推论是统计学的应用工作比过去更少地依赖于数学上导出的解析解。然而我们要表明这一重要的新自由不应被误认为与数学独立。

二、哎呀,统计学是不同的

统计学家是否可以满意足了?完全不是。我们所注意到的每一实力都有黑暗的一面。当所有片段合一时产生的画面是具有结构上弱点的。在我们目前环境下统计学对数学的优势是文化上的,而文化实力很少能压倒组织上的弱点。上帝站在大多数人一边。数学有大队人马,统计学只有少数散布在科学丛林中的游击队员。数学远比统计学更可能具有一个即使不昌盛但也是广润的未来。

(一)弱组织的选手

统计学注册学生人数可能在增加,但是更多的统计学课程一直在数学系而不是在统计系讲授。统计学入门课程也在心理系,经济系和商学院及工程学院教。

积极改革的统计学家在教学上已达成一致意见,但是他们缺少机构上的权力。他们的专业组织中没有一个在强调教学上能与MAA匹敌:IMS主要支持科学研究工作者,而ASA有大量的非科学界成员并且强调为实际工作的统计学家服务。ASA的统计教育部是21个部之一,而且ASA的大约17000个成员中只有1000个属于这个部。

统计学确实与许多领域有联系,但是这是因为它是一门方法论学科而不是因为它是一个基本的独立存在的领域。因此大多数学院的统计学是分布在许多基础学科系(包括数学系)中,而且是由主要学业和兴趣在别的方面的教员讲授和实践。大多数大的研究大学有独立的统计系,但它们一般比其他学科的系小,并且不象数学系那样被认为是必不可少的,当予算危机要求裁减时,统计系是自然的目标。

科学界之外也是如此。虽然非科学行业的统计学家比科学行业的统计学家多得多,但是许多公司(Dupont,Lipton,Corning,Kodak,…)已缩小或取消了独立的统计部门,技术使工程师和其他从事直接生产的雇员能比过去更多地进行统计,在一份商业和工业中的统计学状况调查中,Generel Electric的G.Hahn和R.Hoerl提到“没有统计学家的统计”[11]。统计学日益普及,但是“只进行统计分析不再是一个有销路的任务——任何一个有laptop(带专用统计软件的电脑)的人都可以作。”如对Hahn和Hoerl论文的讨论会参加者所注意到的,情形也不是完全暗淡的,但是统计学家就业率高的情形不合比例地集中在医药学工业不应认为是理所当然的。

统计学组织上的弱点在这门学科的方法论性质和由此产生的与其它学科的密切联系之外增大,这提出了令人烦恼的问题。

(二)这门学科有基础吗?

数学家的眼界狭小可能是不明智的,但是它可以用一门深刻学科的悠久历史和不断的成就来解释和部分地确认。数学家以及一些其他人认识这门内向的领域产生极度的美,并为其它科学提供令人难以置信的有效工具。与之对比,统计学本世纪初从其它领域聚结出来,可能又散失回到许多领域中。不清楚在市场研究和分子生物学产生的“统计学家”有什么共同之处。在某一应用学科的应用问题——即研究课题——成为专业化的,并因此与其它应用学科中的问题有本质的不同,在这种程度上统计学家更被认为属于他们应用工作的学科而不是属于独立存在的统计学科。从对未来悲观的(或可能是现实的)观点看统计学会散失回其它的领域。

本科生的数学也经历了虽然较温和但相似的分散消失情况。Carfunkel和Young[8]记载了微积分以外的课程教学移向其它科学系的情形。当CBMS调查表明在高级数学课程注册不断的磨擦,他们的工作未被人注意,这是一个令人烦恼的文化迹象。缺少专攻数学的学生已被人注意到,这是不健康现象的另一征兆。如果说科学统计系面临灭绝,那么可以说数学系未来的危险是让人们看起来很象是哲学系,一门历史悠久和受人尊敬的学科从事于只是自己感兴趣问题的大规模研究中。数学系无疑会继续比哲学有更多的教学任务,这是一种微弱的安慰。

(三)来自信息技术的威胁

虽然统计学通过计算机计算得到加强和重新定位,但是它现在面临被信息技术吞没的危险。Friedman[7]和其他人注意到一些新的领域,在这些领域中给人以指望的统计概念在由非统计学家比统计学家更强烈地探索着。信息技术是当今取代统计学和数学这两者的传统作用,而对多数科学领域最重要的方法论。数学兼供方法论,因此还将生存下去。统计学是内在的方法论学科,因此面临危险。

三、协同作用的基础:理论上是可行的

为什么统计学不应让自己被其应用领域重新吸收,或者被信息技术整个吞没?另一方面,为什么数学家想把统计学置于自己机构的伞下?由于现存的文化差异,除非有深层次的约定,否则真实的合作是不可能的。幸运的是有这种共同约定。下面讨论其中的四条。

(一)本科数学课程

统计学家依赖并关心数学本科教学计划。的确许多一流统计系的研究生教员对报名申请的候选人是否学过好的实分析课程比是否学过好的统计方法课程更关心。虽然ASA在创意加强本科生统计教学计划,这毫不减弱本科数学对统计学家的重要作用。事实上完全相反。一个向较好的统计研究生课程努力的学生应该修完至少七门数学课程:三门微积分加上线性代数,概率论。数理统计和实分析中的各一门。多修更好。(请把这一点和计算机科学现在要求的数学课程有多么少对比。)如果统计学本科生课程增长了,注册数学课的人将受益。

(二)本科阶段教和学的目标

统计学课程注册人数的增加是计算机科学和经济学课程注册人数增加这一更大范围格局的一部分。这些领域联合起来的增大不仅仅是抵消了数学入学人数的侵蚀。数学界的一个内向的反应是把这一格局当成就像文科的职业化教育趋势的部分而不屑一顾。另一种看法是:传统的数学讲解和教学常常展示了这一学科作为完整结构的抽象性。后面将会举例说明。学生得到了一个完整的产品,但却没有参加到它的生产过程中去。统计学和其它定量描述的学科提供、而传统数学课程常常不提供的是更多地体验在形成更抽象论述之前寻求低水平的抽象模式,然后验证其真实性的过程。当然数学家仍依赖这一过程,而且也不妨碍他们把它作为本科数学课程更明显的一部分。例如在Mount Holyoke学院所有主修数学的学生被要求选修专为这一过程设立的,称为“数学实验室”的二年级课程[21]。当学生们体验这一过程而不仅仅是学习它的产物时,学习与研究之间的障碍被健康合理地减弱了。

当然这一见解远不是原创的。构成主义很早以前就从教育学院转移到数学系,相应的改革运动敦促理科教员把他们的实验作业远不是作为对经典结果的形式验证而是更作为一种发现的过程,即活生生的科学方法的实践。我们论点的关键是数学家和统计学家虽然有表面上的差别,但对寻求模式,推广和在更深水平上进行验证这一过程有共同的义务。

关心教学的数学家在为各种类裂的问题而奋斗,其中有技术的作用,应用场合,联系各种课程的前提结构[25]。关心教学的统计学家面对同类问题;但是由于计算机计算对于统计学家要作的事更重要,计算机使统计教学比数学教学更早更深刻地改变。例如为教学使用而设计的统计软件包Minitab是60年代制作的。在70年代早期,许多大学统计系在部分课程中使用计算机并开始系统地思考怎样介绍计算机入门方法。到80年代中期已有一些基础教科书包含了计算机练习题。统计学家在对基础课程设置上达到一致意见不是没有争论的,但是由于更迫切的需要我们的争论比数学家中的争论要更早而且持续更长时间。因此统计学可能为数学提供一些有用随模型。

(未完待续)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

统计与数学:对抗与合作_数学论文
下载Doc文档

猜你喜欢