用样本的数字特征估计总体的数字特征中最常考的知识点是由样本的频率分布直方图去估算样本的种众数、中位数及平均数。其中估算中位数和平均数是学生运算容易出现问题较多的地方,出问题的原因其一是不理解算法的意义,造成老师讲时会,过后考试遇到又不会,各种各样的算法都有。中位数一般是根据中位数的定义通过列方程求解,首先是确定中位数所在的小组,然后过中位数做一条垂直于横轴的直线,根据中位数的定义可知这一条直线两侧小矩形的面积直和为0.5,利用这一性质我们就可以通过解方程的方式来求出中位数。而估算的平均数其实就是一种加权平均,每个组的平均值取小组中间值(有特别说明的也可去小组端点值),每个小组的频率就是权重,根据加权平均的算法就可以估算出样本平均值。其二是运算缺少耐心,没有良好运算习惯,没有估算意识。比如估算平均数一般运算量会比较大,容易出错。有的学生缺少耐心放弃计算,有的学生在运算过程中没注意观察是否可以简化运算,比如相加得整数的部分先加起来等。有的学生算完后没有思考自己算出来的结果是否合理,从而判断自己的运算有没有出错。
用最小二乘法求两个线性相关变量的回归方程的运算问题主要出现在的计算。回归方程的斜率(为表述方便称之为“乘积式”)或(为表述方便称之为“展开式”)式有两种形式,这两种形式在考试中一般至少会给出一种。但是2016年全国理科3卷18题要求学生理解两种形式的等价变形,当年就有相当多的学生由于没有掌握两种形式的关系而无法解题,这之后才使得老师在教学中加强学生对公式的理解及变形的教学,要求学生能记住公式的两种形式。在实际解题过程中,根据观测数据的特点,恰当的选用运算量更小的形式计算。一般情况下,当样本的观测值与样本平均值作差后,所得到的数据的有效数字相对于原来样本数据少时一般用“乘积形”式来求,反之则用“展开式”来求。
例1:(南宁市2019年第二次适应性考试第18题)一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录.得到如下资料.
利用散点图可知x,y线性相关.
(1)求出y关于x的线性回归方程;
(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.
我们对两个平行班进行统计发现,两个班级有95个学生求平均值正确且理解公式算法,在这95个人当中选用乘积式计算的同学有53人,其中算得正确结果的有45人,计算结果错误的有8人。选择展开式计算的有42人,其中算得正确结果的有25人,计算结果错误的有17人。统计如下2×2列联表:
≥6.635,因此,有99%的把握认为计算正确与否与所选用的公式形式有关。对于本题来说,通过以上两种运算过程的对比,显然乘积式的运算量较少,运算的准确率自然较高。
通过对结果算错的25个同学运算过程进行分析,学生运算错会出现在各个环节,从散点图来看,估值在3左右比较合理,有15个同学的结果与3相差比较大,平时对运算结果有检验意识的同学应该感觉运算肯定有误,需要检查运算过程。培养学生的数感也是我们学生学习数学后应该获得的一种基本数学素养。
独立独立性检验当中的卡方的计算,对学生来说也是比较难算的,最主要的原因就是没有掌握最基本的运算策略,有部分学生把分子分母全部乘出来然后约分再算除法,有的甚至没有约分就进行除法运算。对于卡方公式运算策略是优先处理分子括号里面的乘积的差的运算,这一个运算一般都可以通过提公因式简化运算,运算得的结果的平方是没有必要去把它算出来的,而应该保留乘积的形式,以便和分母进行约分,如果有这一个约分的意识,把卡方的值先约分到最简再进行除法运算,那么这个卡方计算的正确率就会高很多。以上是在统计里面的一些常见的运算的问题,这些问题也反映出学生运算习惯与运算的策略没有很好的把握与落实。
概率的运算问题主要在于概率、数学期望以及方差的运算。首先我们要弄清超几何分布和二项分布这两种特殊的分布列的概念,记住他们的概率公式、随机变量的期望公式及方差的公式可以大大的简化我们运算过程。如果不是这两种特殊的分布列,那么我们在计算过程当中,第一个最主要的问题就是概率计算的问题。要从分利用离散型随机变量取每一个值的概率之和等于1这一性质检验我们的分析及运算是否正确。我们看下面例子:
例2:(2016全国1卷理科19题)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数,求X的分布列.
解:每台机器更换的易损零件数为8,9,10,11,
记事件Ai为第一台机器3年内换掉i+7个零件(i=1,2,3,4)
记事件Bi为第二台机器3年内换掉i+7个零件(i=1,2,3,4)
由题知P(A1)=P(A3)=P(A4)=P(B1)=P(B3)=P(B4)=0.2,P(A2)=P(B2)=0.4.
设2台机器共需更换的易损零件数的随机变量为X,则X的可能的取值为16,17,18,19,20,21,22,
P(X=16)=P(A1)P(B1)=0.2×0.2=0.04,
P(X=17)=P(A1)P(B2)+P(A2)P(B1)=0.2×0.4+0.4×0.2=0.16,
P(X=18)=P(A1)P(B3)+P(A2)P(B2)+P(A3)P(B1)=0.2×0.2+0.4×0.4+0.2×0.2=0.24,
P(X=19)=P(A1)P(B4)+P(A2)P(B3)+P(A3)P(B2)+P(A4)P(B1)=0.2×0.2+0.4×0.2+0.2×0.4+0.2×0.2=0.24,
P(X=20)=P(A2)P(B4)+P(A3)P(B3)+P(A4)P(B2)=0.4×0.2+0.2×0.2+0.2×0.4=0.2,
P(X=21)=P(A3)P(B4)+P(A4)P(B3)=0.2×0.2+0.2×0.2=0.08,
P(X=22)=P(A4)P(B4)=0.2×0.2=0.04.
所以X的分布列为
本题学生出现的最多问题是在计算P(X=19)、P(X=20)等出现漏考虑的情况,例如,X=19应该包含第一台和第二台需要更换易损零件数分别为:8+11=19,9+10=19,10+9=19,11+8=19四种情况,但学生有可能不考虑顺序而认为只有两种情况8+11=19,9+10=19。这种错误如果学生有意识检查概率之和是否等于1就能发现这些错误。
例3:甲、乙二人进行一次围棋比赛,每局胜者得1分,负者得0分,约定一方比另一方多3分或满9局时比赛结束,并规定:只有一方比另一方多三分才算赢,其它情况算平局,假设在每局比赛中,甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立,已知前3局中,甲胜2局,乙胜1局.设X表示从第4局开始到比赛结束所进行的局数,求X得分布列及数学期望.
本题X=4的情况已经比较复杂了,X=6的情况就更加复杂了,从正面去分析容易错漏,此时利用概率和为1的性质可化繁为简,快速解决问题。
总的来说,这一知识模块的运算主要是数字的运算,只要遵循以上运算原则,形成良好的运算习惯,正确计算出结果并不难。
论文作者:潘承猛,韦彪
论文发表刊物:《教育学文摘》2019年第11期
论文发表时间:2019/12/6
标签:概率论文; 中位数论文; 机器论文; 学生论文; 这一论文; 件数论文; 样本论文; 《教育学文摘》2019年第11期论文;