PPS抽样方法在新产品开发经费支出估计中的应用论文_乔敏敏

(西北师范大学,甘肃 兰州 730070)

摘要:本文基于2014年我国31个省市自治区的规模以上工业企业新产品开发经费支出数据,运用简单随机抽样、PPS抽样、分层抽样3种抽样方法,抽取几个地区作为研究样本,对2015年我国规模以上工业企业新产品开发经费支出进行估计,同时,比较了3种抽样方法的效果。结论表明,在我国新产品开发经费支出的抽样估计中,由于各地区的新产品开发经费支出差异较大,分层抽样的估计效果更好。

关键词:新产品开发经费支出;抽样方法;效果比较

创新不仅是当代经济学的一个重要概念,更是这个新时代的主流思想,而新产品的开发是创新的重要体现,它体现了企业不断增强的自主研发和自主创新能力,有利于推动中国制造向中国创造转变、制造大国向制造强国转变。为了解我国新产品开发情况,本文拟利用相关数据,采用简单随机抽样、PPS抽样、分层抽样3种抽样方法,对我国规模以上工业企业新产品开发经费支出进行估计,并对他们的估计效果进行比较,选择出最优估计方法。

1.简单随机抽样及其估计量

1.1简单随机抽样概述

简单随机抽样又称纯随机抽样,是一种最基本的抽样方式。它的定义为:设抽样总体由有限总体N个抽样单元组成,N是一个已知正整数,从中按随机原则抽取n个抽样单元构成一个样本,从而依据样本信息推断总体特征。这种抽样的方法称为简单随机抽样。

1.2简单随机抽样过程

(1)编制抽样框

将我国31个省市自治区从01—31分别编号,01:北京、02:天津、03:河北、04:山西、05:内蒙古、06:辽宁、07:吉林、08:黑龙江、09:上海、10:江苏、11:浙江、12:安徽、13:福建、14:江西、15:山东、16:河南、17:湖北、18:湖南、19:广东、20:广西、21:海南、22:重庆、23:四川、24:贵州、25:云南、26:西藏、27:陕西、28:甘肃、29:青海、30:宁夏、31:新疆

(2)抽取样本

以25%的标准比例选取样本容量,利用随机数表抽取8个省市自治区作为样本,被抽中的编号分别为:03、04、11、13、16、22、27、29,编号对应的8个省市分别为河北、山西、浙江、福建、河南、重庆、陕西和青海。2015年这8个省市的规模以上工业企业新产品开发经费支出(单位:亿元)分别为:246.54、68.17、898.93、297.40、306.55、238.85、163.79、9.88。下面以这8个省市规模以上工业企业新产品开发经费支出来估计2015年我国31个省市自治区规模以上工业企业新产品开发经费支出和各地区平均新产品开发经费支出。

1.3总体均值的估计

点估计为: ;方差估计为:

置信度为95.45%的置信区间为:

故置信区间为[113.07,444.45]。2015年我国各地区规模以上工业企业实际平均新产品开发经费支出为331.32,在置信区间之内。

2.PPS抽样及其估计量

2.1PPS抽样概述

PPS抽样又称放回不等概抽样,是指按总体单元的规模大小来确定单元每次入样的概率。假设总体中第i个单元的大小或规模的度量为Mi,总体的总规模为 ,每次抽样中第i个单元被抽中的概率用Zi表示,则 。

2.2 PPS抽样的实施方法

PPS抽样的实施方法主要有代码法、拉希里方法、规模累计等距抽样法。本文拟采用规模累计等距抽样法。仍以25%的标准比例选取样本容量,以2014年我国31个省市自治区规模以上工业企业新产品开发项目数作为规模,进行累计 Mi,计算抽样距离K,从而确定代码范围,并计算出样本入样的概率。将M0= 除以样本容量=8 ,得到抽样距离K=40785.75,代码范围为1~326286 。在1~40785.75之间随机抽一个数 ,若抽 r=20000,处于陕西的代码范围,因此陕西作为抽中的第一个样本。其余的样本代码为 r+(n-1)K,通过计算具体为42785.75、83571.50、124357.35、165143、205928.75、246714.50、287500.25。查表1可知,代码所对应的分别是四川、河南、上海、山东、广东、浙江和江苏。这8个地区2015年规模以上工业企业新产品开发项目数(单位:个)分别为4434、6971、9780、14378、28306、43456、55123、57204。这8个省市被抽选的概率为 ,分别为陕西0.0136、四川 0.0214、河南0.0300 、上海0.0441、山东0.0868、广东0.1332、浙江0.1690 和江苏0.1753。2015年规模以上工业企业新产品开发经费支出分别为163.79、214.57、306.55、571.62、1122.14、1831.04、898.93、1711.74.。用这8个样本省市来估计2015年我国31个省市自治区规模以上工业企业新产品开发经费支出。

2.3汉森—赫维茨估计量

2.3.1总体标志总量的估计

点估计为: ;方差估计为:

置信度为95.45%的置信区间为:

故置信区间为[3284.74,18467.4]。2015年我国31个省市自治区的规模以上工业企业新产品开发经费支出为10270.83,在置信区间之内。

2.3.2总体均值的估计

总体均值是将总体标志总量除以总体单元数,因此在汉森- 赫维茨估计量的基础上除以 N,即得总体均值的估计量。

点估计为: ;方差估计为

置信度为95.45%的置信区间为:

故置信区间为[105.96,595.72]。2015年我国31个省市自治区的规模以上工业企业实际平均新产品开发经费支出为331.32亿元,在置信区间之内。

3.分层抽样及其估计量

3.1分层抽样过程

以2014年我国31个省市自治区规模以上工业企业新产品开发项目数为依据,将31个地区分为4层,即≤2000:西藏、青海、海南、新疆、宁夏、内蒙古、贵州、甘肃山西;2000~6000:云南、吉林、陕西、广西、黑龙江、江西、辽宁;6000~10000:河北、四川、重庆、湖南、福建、河南、湖北、天津;≥10000:北京、安徽、上海、山东、广东、浙江、江苏。

以25%的标准比例来选取样本容量,根据分层结果,子层内采用简单随机抽样方法按比例抽取样本,共抽取8个地区作为研究样本。给每个子层内的地区分别编号,见简单随机抽样的抽样框。利用随机数表抽取样本,第一层抽取2个地区分别为贵州和山西;第二层抽取2个地区分别为辽宁和陕西;第三层抽取 2个地区分别为河北和湖北;第4层抽取 2个地区分别为上海和浙江。故抽取2015年这些省份的新产品开发经费支出数据进行估计,如表2。

这是一个不等比例的分层抽样,由于总体单位数较少,为了使分配给每个子层的样本数为整数,只能按不等比例分配样本数。

3.2总体均值的估计

点估计为: ;方差估计为:

置信度为95.45%的置信区间为:

故置信区间为[233.24,381.02]。2015年我国31个省市自治区的规模以上工业企业实际新产品开发经费支出为331.32,在置信区间之内。

4.三种抽样方法的效果比较

在样本容量相同的情况下,本文运用简单随机抽样、PPS抽样、分层抽样对我国规模以上工业企业的新产品开发经费支出进行估计,并就上述3种抽样方法估计的总体均值结果进行汇总,如表3。

表3 总体均值估计结果汇总表

总体均值方差估计区间抽样精度误差率

简单随机抽样278.766862.8[113.07,444.45]40.57%59.43%

PPS抽样350.8414991.77[105.96,595.72]30.20%69.80%

分层抽样307.131365.09[233.24,381.02]75.94%24.06%

由表3可知,利用PPS抽样方法估计的总体均值为350.84亿元,比简单随机抽样和分层抽样方法估计的总体均值更接近于我国各地区的实际平均新产品开发经费支出331.32亿元,分层抽样次之,但就抽样精度和误差率而言,分层抽样的估计效果明显优于其他两种抽样方法,总体而言,分层抽样方法要好于简单随机抽样和PPS抽样。综上所述,在我国规模以上工业企业的新产品开发经费支出的估计中,对于总体均值估计,分层抽样的估计效果最好。

5.结论

利用简单随机抽样、PPS抽样、分层抽样3种抽样方法,对2015年我国31个省市自治区规模以上工业企业新产品开发经费支出进行估计,并对三种抽样方法的估计效果进行比较,通过比较可以看出,分层抽样的估计效果更好。这是由于我国各地区规模以上工业企业的新产品开发经费支出之间差异较大,所以分层抽样抽样的效果更好,优于简单随机抽样和PPS抽样。因此,可以得到以下结论:当对总体单位标志值差异较大的总体进行估计时,分层抽样估计可以得到较为准确的估计值。

参考文献

[1]金勇进,杜子方,蒋妍.《抽样技术》,中国人民大学出版社,2015年7月第四版.

[2]甘肃经济信息网 http://www.gsei.com.cn/

[3]倪佳勋.抽样调查[M].桂林:广西师范大学出版社 ,2002.

[4]周庆元.PPS和简单随机抽样估计效率的实证检验[J]. 理论新探(2014年01期).

[5]宋新民,李金良.抽样调查技术[M],中国林业出版社,2007年第二版.

论文作者:乔敏敏

论文发表刊物:《知识-力量》1月中

论文发表时间:2018/9/18

标签:;  ;  ;  ;  ;  ;  ;  ;  

PPS抽样方法在新产品开发经费支出估计中的应用论文_乔敏敏
下载Doc文档

猜你喜欢