高三数学“概率与统计”章教学问答(二),本文主要内容关键词为:概率论文,问答论文,数学论文,高三论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
6 简单随机抽样有哪些特点?
答:(1)它要求被抽取样本的总体的个数有限, 以便对其中各个体被抽取的概率进行分析。
(2)这种抽样是从总体中逐个进行抽取, 这就使得它具有可操作性。
(3)这是一种不放回抽样。 由于在抽样的实践中常常采用不放回抽样,使简单随机抽样具有较广泛的实用性,而且由于在所抽取的样本中没有被重复抽取的个体,所以便于进行分析与计算。
(4)这是一种等概率的抽样, 不仅每次从总体中抽取一个个体时,各个体被抽取的概率相等,而且在整个抽样过程中,各个体被抽取的概率相等,从而保证了这种抽样方法的公平性。
实施简单随机抽样主要有两种方法,即抽签法和随机数表法。
与系统抽样、分层抽样相比,简单随机抽样是最简单、最基本的抽样方法,另两种抽样方法都建立在简单随机抽样的基础之上。这三种抽样方法的共同点是:它们都属于等概率的抽样,都体现了抽样的公平性。
7 掷一枚均匀硬币两次, 如何从二项分布的直方图上算出正面朝上至多发生一次的概率?
答:先画出直方图(n=2,p=0.5)如图1所示。由图可见, 正面朝上至多发生一次的概率,就是横坐标从-0.5到1.5这两个长方形的面积之和,其中第一个长方形的面积对应于正面朝上至多发生一次的概率
P=0.25×1+0.5×1=0.75。
8 如何利用直方图来引进正态曲线与正态分布?
答:对于n较大,p=0.5的二项分布直方图, 如果用一条平滑的曲线把每个长方形的中点联结起来,就能得到一条钟形曲线,称为正态曲线(图2),其函数解析式为
回顾二项分布的直方图及上面第7问的回答中所举的例子, 直方图中各长方形的面积可以表示有关的概率值。对于正态曲线,如果规定,试验的观察值x落在区间(a,b)内的概率P(a<x<b )就是由这条曲线、x轴、直线x=a及x=b所围成的图形的面积(图3),那么称这种概率分布为正态分布。
一个平均数为μ、标准差为σ的正态分布可以用公式z=(x-μ)/σ将它变换成平均数为0、标准差为1的正态分布。平均数为0、 标准差为1的正态分布称为标准正态分布(图4),其公式为
由于必然事件的概率是1,所以在标准正态曲线下方、z轴上方的总面积等于1,为了计算与标准正态分布有关的事件的概率, 可以列出如图5中阴影部分面积的表,以备查用。
用正态曲线去近似二项分布的直方图,当n比较大,p等于或接近于0.5时,效果比较好(图2)。一般地说,n越大,p越接近于0.5, 近似程度就越高;反过来,n很小,p接近于0或1时,近似程度就不好,我们一般要求,np≥5及nq≥5,否则计算概率的误差太大。
9 什么叫做线性回归?请举例说明
答:在实际生活中,变量之间的关系,除了如同圆面积S=πR[2]这类确定性关系外,还有一类“相关”关系。例如,人的下身长与总身高这两个变量之间虽然不可能建立一个精确的解析式,但这两个变量有着密切的关系,一般说来,下身长的人长得也高。又如,中学毕业班学生毕业考试的成绩与高考成绩之间,虽然不可能建立精确的解析式,但它们的关系也非常密切,一般说来,毕业考试成绩好的学生高考成绩也好。
为了深入考察这一情形,我们再看一个例子。
右栏的表格是某省20个县城2001年的一份统计资料,其中x[,i] 表示第i个县城在2001年建成的新住宅面积(单位:10[3]m[2]),y[i]表示第i个县城在2001年的家具销售量(万元)。
新住房当然要添置新家具,这是人们普遍的心理,因此,新建成的住宅越多,家具的销售量就越大,把上面20个县城的统计资料表示在图上,横坐标表示新建成的住宅面积,纵坐标表示对应县城的家具销售量,从散点图(图6)上,我们也可以看出上述规律。
现在的问题是,如果我们要用一条直线=bx+a去代表这一组散点,反映这些点的变化趋势,那么斜率b与截距a应该如何确定?
从直观上看,如果所有的点都在某条直线上,那么用这条直线去代表这一组点,反映它们的变化趋势,自然是再好不过了。这时,对于这一组点,这样的一条直线具有最好的代表性。另一个极端是,如果所有的点都不在某条直线上,且这条直线远远偏离这些点,我们自然会认为,用这条直线去代表这一组点,代表性极差。
可以证明(见教科书第42页至43页的阅读材料),给定n 对数据(x[,1],y[,1]),(x[,2],y[,2]),…,(x[,n],y[,n]),且假定能用直线去描述它们所代表的点的变化趋势,那么直线 =bx+a具有最好的代表性,其中
我们把这条直线称为回归直线。
回到上面的例子,由于家具销售量与新住宅落成的面积间呈现出明显的线性趋势,所以我们可以用回归直线去描述它。
由已知数据可以算出
由于我们算出的回归直线方程较好地反映了与x之间的线性相关关系,所以可以用它去进行估计与测算,例如,若给出此省某县城在2002年预计新建成的住宅面积为350×10[3]m[2],则可以大体估计出此县城当年可销售家具
=1.0811×350+218.4147
=596.8(万元)这就为我们进行商品经营提供了科学的测算依据。
由此可见,教科书在这一小节只研究一元线性回归问题,处理的是两个变量之间的关系。研究的一般步骤如下:
(1)从一组数据出发,求得两个变量的相关系数r,确定二者是否具有相关关系或相关的程度;
(2)如果两者具有相关关系,确定两个变量之间的关系式, 即回归直线方程=bx+a(其中b是回归系数,a是常数);
(3)根据回归直线方程,由一个变量的值, 预测或控制另一个变量的取值。
由于这里的计算一般十分烦琐,所以应尽量使用科学计算器。
10 如何帮助学生小结本章的知识结构?
答:本章知识结构可画成右栏所示的框图。
这里上半图概率部分承接高二下学期的最后一章,下半图统计部分承接初中学过的知识,从图中可以看出上、下部分之间的联系。
虽然本章可以承接高二下学期的最后一章,但本章内容不易记忆,为了提高教学效果,也可以在完成高三教科书的其他各章后再进入本章,这样可能会节约一些教学时间。
11 高考对本章内容的要求目前是怎样定位的?
答:目前高考考查本章内容仅限于填空题。现转录如下。
(1)2000年新课程卷。
(理工农医类)某厂生产电子元件,其产品的次品率为5%, 现从一批产品中任意地连续取出2件,其中次品数ξ的概率分布是
答案:(自左至右)0.9025,0.095,0.0025。
(文史财经类)从含有500个个体的总体中一次性地抽取25 个个体,假定其中每个个体被抽到的概率相等,那么总体中的每个个体被抽样的概率等于____。
答案:0.05。
(2)2001年新课程卷:
(理工农医类)一个袋子里装有大小相同的3个红球和2个黄球。从中同时取出2个,则其中含红球个数的数学期望是____。(用数字作答)
答案:1.2。
(文史财经类)一个工厂有若干个车间,今采用分层抽样方法从全厂某天的2048件产品抽取一个容量为128的样本进行质量检查。若一车间这一天生产256件产品,则从该车间抽取的产品件数为____。
答案:16。
思考题
1 为什么教学大纲要安排“正态分布”和“线性回归”这两项内容?它们在“概率”与“统计”中处于什么地位?
2 怎样把握本章教学内容在高考中的要求?