约翰·格朗特统计思想研究
文/吴嘉桐 王幼军
一、格朗特的生平
关于约翰·格朗特(John Graunt,1620.4.24—1674.4.18)的生平信息,人们知之甚少,目前所知的一些非常有限的信息大都来自于约翰·奥布里(John Aubrey,1626—1697 年)《名人小传》中的一篇关于约翰·格朗特的生平简介以及卡尔·皮尔逊(Karl Pearson)在统计学史讲义中提供的一些信息。
约翰·格朗特于1620 年出生于英国伦敦,在家中排行老大,父亲亨利·格朗特(Henry Graunt)是一位来自汉普郡(Hantshire)的伦敦布商。格朗特早年跟随父亲学习经商,后来子承父业,将父亲传给他的布商生意经营得相当成功。1641 年2 月,约翰·格朗特与玛丽·史考特(Mary Scott)结婚,婚后他们育有一儿一女。
约翰·格朗特聪慧过人且勤奋好学,通过自学掌握了拉丁语和法语,21 岁时他被德雷柏公司(Drapers’Company)授予荣誉员工的称号,并在1671 年晋升为该公司的监督人,他担任此职直到1672年。他以监督人的身份就职于多个市政办公室直至在市议会担任职务,在此期间他还担任一个军乐团的指挥。
格朗特生活在一个现代科学思想快速孕育和发展的时期,在各个领域,人们探求知识的方式正在转变为实验实践等,格朗特是体现这个时代精神的一个典型代表人物。成立于1660 年的伦敦皇家学会在现代科学的兴起过程中扮演了一个极其重要的角色,就在伦敦皇家学会成立的那一年,约翰·格朗特出版了一本关于人口方面的著作《关于死亡表的自然和政治的观察》(Natural and Political Observations upon the Bills of Mortality,简称为《观察》)。书中分析了60 年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。《观察》出版后大受欢迎,该书获得许多学者和各界人士的极高评价,查理二世对这部别具一格的著作印象极为深刻,在他的推荐下,在该书出版仅一个月后,即1662 年2 月26 日,格朗特就成为唯一以商人身份加入皇家学会的会员,他也是伦敦皇家学会会员的第一位统计学家。1664 年11 月,他又当选为皇家学会理事会成员,直到1666 年4 月,他一直是理事会会议的常规成员。
非正式环境包括博物馆、植物园、水族馆和动物馆等人工设计的场馆[1]。博物馆和学校的伙伴关系是不同的教育者共同努力的结果,其目的是让学生进行丰富的、有活力和有意义的学习活动[2]。下面以上海自然博物馆为例,结合沪教版教材高中《生命科学》第3册第9章“生物进化”一节,谈谈利用非正式环境中的博物馆资源,如何通过“馆校合作”来开展科学活动。
格朗特还以其他方式验证了上述估计值。根据三个教区的观察结果,他发现平均每11 户家庭每年有3 次葬礼。以平均家庭人口规模为8,估计粗略的死亡率(CDR=死亡人数与总人口的比率)为3/88,得到每年的死亡人数为384000×3/88 ≈13000 人,从而推算出伦敦居民的总户数为:
二、格朗特的著述
微灌技术主要是把灌溉用水运送到农作物的根部进行局部灌溉,相对来说微灌比喷灌更具加节水,而且灌溉的更加均匀。
所谓的政治参与,这是近现代以来全新的政治相关概念,同时也表明着我国政治的发展和进步,是政治文明的体现。
(b)She bought the computer her brother had recommended.
三、格朗特的统计学成果
总户数= 有能力怀孕的妇女总数×2=2B×2=4B=(12000×2)×2=48000(户)
(一)死亡表的提出
格朗特曾在他的著作中提到,确定伦敦居民的人口总数是他研究的基本任务之一。他认为可以根据城市报告的总出生人数得出伦敦居民人口总数的客观估计值。如果每年的出生人数是B,那么育龄妇女(年龄组为16—40 岁)的数量将为2B。对于这样的女性来说,两年内可能只有一个以上的孩子(这相当于一般的生育率为1/2)。假设16—76 岁年龄组的女性人数是育龄妇女数量的两倍,并且与家庭数量相同,家庭数则为4B。
通过对这批数据进行整理分析,格朗特作出了一系列的推论,例如对某种疾病,他统计出在1631—1635 年5 年期间有254 例死亡,而这5 年中死亡人口总数为47757;又在1656—1660 的5 年期间有250 例死亡,而死亡人口总数为68712。因为<(分别约为0.0037 和0.0053),他推断这种病的死亡率有了下降。
(二)人口数量的估算
格朗特写这本著作所依据的资料来源于“死亡公报”(bill of mortality),该公报自1604 年起由伦敦的教会每周发表一次。在19 世纪之前,欧洲因饥饿、战争、疾病等原因,尤其是受到黑死病流行的影响,死亡率很高,促使伦敦教会发表这种公报,该公报以周为单位并根据死者死因分类记录了死亡和受洗者(受洗者的数目大致等同于出生的人数)的名单,如1632 年公报中包含63 种病因,按字母次序排列,自1629 年起公报中男女分开统计,格朗特就是通过整理分析这些数据,对当时有关伦敦的人口问题作出一些论断。书中叙述了死亡公报的起源和发展、关于不同死因特别是黑死病致死人数的统计、男女的差异、不同教区的差异、伦敦城市人口数及增长状况等8个表,其中的三个表对1629—1636 年和1647—1660 年期间,伦敦每一年的死亡人数,按死因分为81 类进行分类统计;对1629—1664 年期间按男女分类统计了伦敦死亡和受洗人数;对6 个黑死病大流行的年头——1592、1603、1625、1630、1636 和1665 年伦敦每周死亡总人数和黑死病死亡人数作了统计。
这样的男人习惯了抨击,随时随地用自己的阅历所及来绑架把他的另一半。安妮因为太过重视老公,像行星一样围绕着他这颗太阳旋转,所以没办法走远,而后来便成为丈夫挑三拣四的理由。
格朗特假设平均家庭人数是8(男人、妻子、三个孩子、三个仆人或者住客),那么人口的规模为32B。
为了得到B 一年的数量,格朗特并没有直接采用进行洗礼人的数量。他发现,在1642 之后,与非瘟疫年的死亡人数相比,由于内战和其他原因,洗礼的做法已经变得不那么普遍了。取而代之的是,他将墓葬的数量乘以13000,由因子12/13(在1642 年前的非瘟疫年的墓葬数与埋葬数的比率)得出1661 年B 的估计值为12000 人。
历史上也有一段围绕此书的作者究竟谁的争论。曾有人认为,威廉·配第才是《观察》的真正作者,的确在格朗特去世后,配第本人的一些说法对这种怀疑也起到了推波助澜的作用,但这种说法似乎经不起严格的推敲。卡尔·皮尔逊在1978 年的著作(其中的第二章)对此进行了慎重的考虑。他提醒人们注意:配第当时是皇家学会委员会的成员(主席),该委员会在1662 年收到格朗特递交的50本《观察》后对其进行了审议,并给予了积极正面的评价,这些都是在格朗特当选为皇家学会会员之前。
根据格朗特的观察,有怀孕能力的妇女人数一般为登记出生年份的正常出生人数的二倍。他根据伦敦出生总人数12000 人,平均每两户有一位能怀孕的妇女,推算出伦敦居民的户数为:
约翰·格朗特的工作开创了新的时代,开始以数据为研究对象、对数据进行整理和分析,他是第一个从大量数据的分析中得到统计推论的人,总体而言,他对统计学的贡献反映在他的《关于死亡表的自然和政治观察》一书中,其主要的创新思想有如下几点:
总人口数=总户数×平均每户人口数=48000×8=384000
格朗特最重要的一部统计学著作是1662 年出版的《关于死亡公报的自然和政治观察》(Natural and Political Observations Made upon the Bills of Mortality),该书以伦敦每年每周举行葬礼的次数以及伦敦的教堂所收集的各类数据为基础,对大量的原始数据进行整理、分类、排比和分析,并通过适当的形式表示出来,从中得出了惊人的结论和规律。格朗特是第一个从大量数据的分析中得到统计推论的人,并且他的工作开创了一个分析数据的崭新研究方向,从这种意义上说,这本书被称作描述性统计的开创性之作,有的学者甚至把此书的出版看作是统计学史的起点。该书从1662 至1676 年这14 年间共发行了五版,1662 年发行了第二版和第三版,1665 年发行了第四版,1676 年发行了第五版。
因此,人口的规模将达到384000 人。考虑到几个郊区教区的人口埋葬的数量约为城市的1/5,他把这个数字扩大了20%,得出伦敦人口总数约为460000。
格朗特晚年时生意破产,生活陷入了贫困。这一切始于1666 年9 月,他的房子在伦敦大火中被毁坏,据说,他陷入窘境的一个主要原因是,他从一名加尔文宗教徒(清教徒)转变为一位狂热的罗马天主教徒后便退出了商业领域,并辞去了所担任的一切公职。他于1674 年4 月18 日逝世,时年54 岁。
总死亡人数÷ 平均每户死亡人数=13000÷3/11=47667(户)
总人口数=总户数×平均每户人口数=47667×8=381336(人)
根据格朗特的验证与之前计算出的人口估计值非常接近。
(三)寿命表的创立
格朗特也对他搜集到的一些较为简陋的生命登记资料进行了整理、归纳,希望从中得出新的结论。格朗特所发现的人口寿命规律具体表现在他创造性地编制了初具规模的“寿命表”,这是综合评定各种年龄死亡率与人口寿命的统计表。他编制伦敦居民寿命表的具体方法是:根据儿童特定原因造成的死亡人数估计6年前死亡的比例。在调查期间(1604—1661 年),他考虑了由十个不同的原因(诸如:堕胎和死胎、鹅口疮、惊厥、佝偻病、出牙等)造成的死亡人数,并将其增加了50%,加上死亡人数的一半。他将这一数字与该时期非瘟疫死亡总人数相关联,得出的结论是,在出生的100 名儿童中,能活到6 岁的只有64 个,活到16 岁的只有40 个,活到76 岁的只有1 个,一般没有人能活到86 岁,他取六个平均比例数来确定中间年龄16、26、66、76、86 的幸存者。在每一百人中,年龄与死亡之间的关系是迥然相异的,格朗特依据大数法则,从参差不齐的数据中归纳出了大致相同的准则。这个表中列出的各年龄死亡人数以及计算方法对后来展开人寿保险事业提供了有效的依据,并指出了现代人口统计的研究方向。
2.3.1 水提工艺设计 以加水量、煎煮时间、煎煮次数为因素,选用L9(34)因素水平表安排正交试验。见表4。
(四)大数法则思想的萌芽
格朗特通过对大量的多种数据的研究得出了许多具有确定性和普遍性的结论,即大数定律的思想:通过对事物进行充分的大量的观察,可使事物中非本质的偶然因素的影响相互抵消或削弱,从而显示出整个现象稳定的、具有一般特征的“大数法则”。
格朗特对于其发现的规律事实作出了具有他那个时代特征的解释评论,例如,他发现整体上男性的出生数比女性的出生数略高,但总体而言,男女的数量保持着一定的平衡,这种现象部分是由于一些客观的因素所致,但这个事实发现的更重要的价值在于为反对一夫多妻制提供了有力的证据,自此以后,这种性别出生的比率问题成为统计学领域的一个热门的话题。
格朗特的工作对同时代乃至后来的学者都产生了影响,十七世纪英国政治经济学家威廉·配第(Willian Petty,1623—1687 年)和格朗特开创了英国的“政治算术”传统,将统计方法从对人口统计问题拓展到对广泛的社会、经济问题进行分析。因此,格朗特被尊称为“近代统计学之父”。
在给定条件下,当泥浆侵入半径小于4m时,侵入半径对双侧向测井值影响较大,随着侵入半径的增加,深、浅侧向测井响应值下降很快;当侵入半径大于4m时,浅侧向测井响应值几乎不随侵入深度而变化,但深侧向测井响应值随侵入深度的增加而变化,直到侵入半径大于20m为止。可见,侵入深度越深,深、浅侧向测井值差异幅度越小,特别是浅层侵入(不超过深侧向探测深度),深侧向电阻率极高,而浅侧向电阻率很低,幅度差值过大。在这种情况下,裂缝没有工业价值[9]。
(作者单位:上海师范大学)