董业平 山东省枣庄市市中区永安镇中学 277116
摘 要:系统抽样使用范围是总体中元素的数目很大时,此时样本容量就不宜太小;系统抽样的基础还是简单的随机抽样,其抽样步骤是一个规范化程序;系统抽样的随机性体系两点:总体中剔除个体的随机性,总体中个体被抽到样本中的随机性;运用系统抽样抽到的样本,其代表性还需论证。
关键词:特征 方法步骤 公平性 代表性
一、系统抽样的特征
将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽样一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。根据抽样前“预先制定的规则”,系统抽样的方式是各种各样的。
目前高中数学教材主要介绍了最简单最常用的系统抽样是等距抽样(也称机械抽样)。系统抽样使用范围是总体中元素的数目很大时,此时样本容量就不宜太小,否则样本就不能较好反映总体的特征。
与简单的随机抽样相比, 系统抽样的优点体现在以下几方面:
1.操作简便。
系统抽样在编号后“按照预先制定的规则”抽取样本;简单的随机抽样编号后要“搅拌均匀”,最后逐个抽取个体组成样本。当总体中元素的数目很大时,“搅拌均匀”将花费很大气力。
2.简便易行。
总体中的个体常常存在一种自然编号,如生产线上的产品的顺序编码、如学号、身份证号等,便于施行系统抽样。
3.偏差更小。
系统抽样在第一段是简单随机抽样,而以后为等距离抽取,从样本中个体在总体中的分布看, 系统抽样抽取的个体在总体中分布更均匀。用样本特征反映总体的相应特征偏差会更小。
期刊文章分类查询,尽在期刊图书馆
系统抽样的不足之处是在不了解样本总体的情况下,所抽的样本仍会存在一定的偏差。
二、系统抽样的方法步骤
一般地,假设要从容量为N的总体中抽取容量为n的样本,运用等距抽样可按下列步骤进行:
1.先将总体中的N个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等。
2.确定分段间隔数k,对编号进行分段。当 是整数时,取k= ;如果 不是整数,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数恰被样本容量整除。
3.在第1段个体中,用简单随机抽样法确定样本中首个个体编号t(t≤k)。
4.按照一定的规律,通常是将首个个体编号t加上间隔k得到第2个个体编号(t+k),再加k得到第3个个体编号(t+2k),依次进行下去,直到获取整个样本。
注意:等距抽样基本特征是样本中个体的编号若按从小到大的顺序,其间隔数相同。把握等距抽样是把握系统抽样的基础。
三、系统抽样的随机性
系统抽样的标志是抽样的随机性,即每个个体被抽到样本中的机会是均等的。为了实现这一点,操作时要力争做到:
1.总体中剔除个体的随机性。
在确定分段间隔数时,总体中的个体N如果不能被样本容量n整除,则用简单随机抽样的方法从总体中剔除若干个个体,剔除的个数数目为总体中的个体数N除以样本容量n所得的余数。总体中每个个体被剔除的机会均等,留在抽样总体中的机会仍然相等。
2.总体中个体被抽到样本中的随机性。
确定首段个体编号要运用简单随机抽样法,让首段中的每个个体被抽到样本的机会均等,由等距抽样的规则,各段中的每个个体被抽到样本的机会也均等。
四、提高样本代表性的措施
例如,为了了解高一(5)班学生的体重情况。若把该班的学生男女交叉编号后分组,每组6人,用掷骰子的方法在前六名中任选一名,用l表示该同学的编号, 由等距抽样规则,样本中学生编号为(l+6k)(k=1,2,3,…)。这种系统抽样法得到的样本或者都是男生,或者都是女生。通常男生的体重与女生体重的分布有明显的不同,故上述的样本不能很好地代表总体,是一个“坏”样本。
系统抽样所得样本的代表性与具体的编号有关。编号的周期性是造成样本发生偏差的根本原因。为检验个体编号是否具有周期性,可采用如下方法:从不同的编号开始等距抽样,得到几个不同的样本。对比不同的样本的特性,如果有明显差别,说明总体的编号存在某种周期性规律,且周期与间隔数相同。
如果对总体加以调查研究,通过分析把握总体结构,充分利用已有信息对总体的个体进行排队后再抽样,可提高样本的代表性。
如上例,如果把高一(5)班学生按体重排成一路纵队后编号,再采用上述的等距抽样法得到一个样本,那么样本会具有很强的代表性。
论文作者:董业平
论文发表刊物:《中小学教育》2018年2月总第304期
论文发表时间:2018/1/15
标签:样本论文; 个体论文; 总体论文; 编号论文; 系统论文; 随机性论文; 代表性论文; 《中小学教育》2018年2月总第304期论文;