华东师范大学附属周浦中学 上海 201318
摘 要:本文从用样本标准差评价总体标准差时需遵守的三大标准(无偏性、有效性、一致性)出发,说明上教版样本标准差S= 作为总体标准差的点估计值的合理性。
关键词:样本标准差 公式合理性 研究
上教版高三数学(试用本)中给出的样本方差、样本标准差的计算公式不同于其他版本的教材,教材中也没有给出说明,给广大老师的教学和学生的学习带来不少困扰。
方差和标准差给出的是一组数据偏离平均数程度的大小,数值越小,说明这组数据越向平均数集中;数据越大,说明这组数据偏离平均数的程度越大。在某些统计问题中,做不到也没必要对总体中的每一个个体进行研究,就需要从总体中抽样研究。那么怎样用样本的标准差来估计总体的标准差呢?不同的版本有不同的说明:
一、对方差和标准差的定义
1.上教版
设总体有N个个体,它们分别为x1,x2,…,xN,总体平均数为μ= (x1+x2…+xN),总体方差σ2= [(x1-μ)2+(x2-μ)2+…+(xN-μ)2],σ叫作总体标准差。
如果样本为x1,x2,…,xn,样本平均值为x= ,用样本的标准差s=作为总体标准差的点估计值。
2.人教版
设有n个数据x1,x2,…,xn,各数据与它们的平均数x的差的平方分别是(x1-x)2,(x2-x)2,…,(xn-x)2,我们用这些值的平均数,即用s2= [(x1-x)2+(x2-x)2+…+(xn-x)2]来衡量这组数据的波动大小,称它为这组数据的方差。
3.苏教版
一般地,设一组样本数据x1,x2,…,xn,其平均数为x,则称s2= ∑(xi-x)2为这个样本的方差,其算术平方根s=∑(xi-x)2为样本的标准差。
4.《教育统计与测评导论》
设x1,x2,…,xn为从总体x中抽出的一个样本,称S2= ∑(xi-x)2为样本方差,S=∑(xi-x)2为样本标准差。
二、典型例题
1.上教版高三数学(试用本)第108页例1
某赛季甲乙两名篮球运动员在若干场比赛中的得分情况如下:甲:18、20、21、22、23、25、28、29、30、30、32、34;乙:8、13、14、16、23、26、28、33、38、39、48。问谁的比赛成绩比较稳定(结果精确到0.01)?
解析:易得甲乙两名运动员每场得分的平均值均为26分。
设甲得分的标准差为s1,记甲的每场得分与其得分平均值的差的平方和为∑1,则∑1=(18-26)2+(20-26)2+(21-26)2+…+(32-26)2+(34-26)2=296,s1= = ≈5.19(分)。
设乙得分的标准差为s2,同理得s2= = 159.6≈12.63(分)。
因为s2>s1,所以甲运动员的比赛成绩比较稳定。
2.上教版高三数学(试用本)第106页例3
为了解某体校学生长跑的情况,观察随机抽取的20名学生一周内跑步的累积千米数,在各个区间内频数记录如下表所示:
区间频数fi 累积频数
(5.5,10.5) 11
(10.5,15.5) 23
(15.5,20.5) 36
(20.5,25.5) 511
(25.5,30.5) 415
(30.5,35.5) 318
(35.5,40.4) 220
求一周内学生平均累积跑步的千米数及其标准差。
解析:先求出各个区间的中点值:8、13、18、23、28、33、38。
利用公式x= ,
s= ,其中xi、fi分别为i第个区间的中点值和频数,i=1,2,…,m,n=f1+f2+…+fm。
本题中n=20,m=7,经计算得:x=24.5,s=8.29。
因此可知:学生平均每周累计跑24.5千米,标准差为8.29千米。
期刊文章分类查询,尽在期刊图书馆
3.2009年重庆高考卷(文科)
从一堆苹果中任取5只,称得它们的质量如下(单位:克):125、124、121、123、127。则该样本标准差为____(克)(用数字作答)。
解析:因为样本平均数x= (125+124+121+123+127)=124,则样本方差s2= (12+02+32+12+32)=4,所以s=2。
以上三个例题都用到了样本标准差,由于教材不同,选用了不同的公式。那么,上教版中的样本标准差为什么要除以n-1?这么做能消除系统偏差的依据是什么呢?对应地,样本均值为什么没有除以n-1呢?
三、基本原理
根据样本统计量对相应总体参数所作的估计叫作总体参数估计。总体参数估计分为点估计和区间估计。点估计是指用某一样本统计量的值来估计相应的总体参数的值。比如,用样本均值和样本标准差来估计总体平均数和总体标准差就是点估计。点估计的评价标准是:无偏性、有效性、一致性。
1.无偏性
当用某一个样本统计量的值估计总体参数值时,总会有所偏差,有的大于总体参数,有的小于总体参数。如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。
设x为一总体,x的数学期望和方差分别为μ、σ2,(x1,x2,…,xn)为从总体x中抽出的一个样本,则有EX=μ,DX=σ2,ES2=σ2。
为了给出证明,下面列出一些需要的定义和性质:
两个定义:
(1)μ=EX。
(2)σ2=DX=E(X-EX)2。
数学期望有以下性质:
(1)常数性EC=C,C为常数。
(2)齐次性ECX=CEX。
(3)可加性E(X+Y)=EX+EY。
(4)独立性E(X·Y)=EX·EY,X、Y相互独立。
方差具有下列性质:
(1)常数性DC=0,C为常数。
(2)二次性DCX=C2DX。
(3)可加性D(X+Y)=DX+DY,X、Y相互独立。
证明:样本均值X= ∑Xi,样本方差S2= ∑(Xi-X)2,EX=E ∑Xi= E∑Xi(齐次性)= ∑EXi(可加性)= ·nμ=μ。
可见:样本均值X是总体均值μ的一个无偏估计量。
DX=D ∑Xi= D∑Xi(二次性)= ∑DXi(可加性)= ·nσ2= σ2。
ES2=E ∑(Xi-X)2= E∑(Xi-X)2(齐次性)= E[∑(Xi-μ+μ-X)2]
= E[∑((Xi-μ)2+(X-μ)2-2(Xi-μ)(X-μ))]
= [E∑(Xi-μ)2+E∑(X-μ)2-2E∑(Xi-μ)(X-μ)](可加性)
= [E∑(Xi-μ)2+nE(X-μ)2-2nE(X-μ)2]
= [E∑(Xi-μ)2-nE(X-μ)2]
= (nσ2-nDX)= (nσ2-n· σ2)=σ2。
可见:样本方差S2= ∑(Xi-X)2不是总体方差σ2的无偏估计量。
若令S*2=S2,则ES*2=ES2=ES2=·σ2=σ2。
所以,S*2为σ2的一个无偏估计量。 称为贝塞耳氏校正数。
2.有效性
当总体参数不止有一种无偏估计时,某一种估计量的一切可能样本值的方差小的为有效性高,方差大的为有效性低。如:样本均值X、中位数Md、众数M0都是总体平均数μ的无偏估计量,但X的一切可能样本值的方差最小,所以X是总体平均数μ最有效的估计量。
3.一致性
当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计量是总体参数一致性估计量。如:样本均值X是总体平均数μ的一致性估计量,样本标准差s是总体标准差σ的一致性估计量。
通过上面的分析可见,上海教材里将样本的标准差:
s= ·
= ,作为总体标准差的点估计值是合理的。
参考文献
[1]刘新平 刘存侠 教育统计与测评导论.北京:科学出版社,2012。
[2]王孝玲 教育统计学.上海:华东师范大学出版社,2003。
论文作者:凌燕萍
论文发表刊物:《素质教育》2018年4月总第267期
论文发表时间:2018/4/16
标签:样本论文; 总体论文; 方差论文; 标准差论文; 平均数论文; 参数论文; 数据论文; 《素质教育》2018年4月总第267期论文;