基于卡尔曼滤波估计的连续性抽样调查研究,本文主要内容关键词为:卡尔论文,连续性论文,调查研究论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、问题提出
随着社会经济事物的不断变化和发展,很多调查的目标总体也在不断变化和发展。为了能及时反映目标总体的这种变化规律和发展趋势,调查部门就需要对同一总体在不同时间进行连续性的抽样调查。国外很多大型抽样调查都是连续性抽样调查,如美国现时人口调查、加拿大劳动力调查等;我国政府统计中很多全国性的大型调查也都是连续性抽样调查,如城市住户抽样调查、规模以下工业企业抽样调查和农产量抽样调查等。通过连续性抽样调查可得出一系列更加准确的时序数据,研究社会经济的学者可建立各种计量经济模型,利用时间序列、面板数据模型等计量分析方法研究得出社会经济事物的变化规律和发展趋势,为政府和社会各界服务。
在连续性抽样调查研究中,围绕如何产生更加准确的时序数据的问题,不同的学者针对不同的调查方法提出了不同的估计理论。在连续性调查中,主要存在轮换样本调查和重复样本调查两种方法。在轮换样本调查中,由于不同时期的连续样本之间存在一定的重叠,即同一总体单元的数值在不同时期存在一定相关关系,因而一般使用组合估计方法进行有效地估计。Binder and Hidiroglou(1988)对已有的组合估计方法进行了总结[1],Park,et al.(2001)在平衡轮换模式下研究了广义组合估计量[2],陈光慧和刘建平(2008b)在平衡轮换模式下研究了固定窗宽的最优线性无偏估计量[3]。而在重复样本调查下,每次调查样本都是从调查总体中重新抽取的,连续样本之间没有相关性,因而不能使用传统的组合估计方法进行估计。但是,同一有限总体的某些特征在不同时间上却存在相关性,因此可建立各种时间序列模型进行估计[1]。Blight and Scott(1973)假定连续总体的均值满足线性的马尔可夫过程,从而将随机模型引入到连续性抽样调查中[4],Scott and Smith(1974)进一步假定在不同时间上的总体均值满足某一随机模型,比如总体均值满足一阶自回归过程[5]。Scott,Smith and Jones(1977)在此基础上还考虑了非平稳时间序列的问题[6]。
但是,对于很多调查总体而言,连续调查数据并不是平稳的,而是具有一定长期趋势和季节变动的非平稳时间序列;对于很多模型误差项零均值、齐次方差的假定一般都能满足;而且由于连续性调查中的时序数据往往并不是太多,只能运用一些较为简单的时间序列模型,因而限制了更为复杂的时间序列分析方法的使用[7]。因此,本文在原有研究的基础上,建立连续性抽样调查条件下的状态空间模型,并通过成熟的卡尔曼滤波方法进行连续性抽样估计。第二节将给出一般性的状态空间模型和卡尔曼滤波等式,第三节将在连续性抽样调查条件下给出具体的状态空间模型和卡尔曼滤波估计方法,第四节还将给出数值分析,对卡尔曼滤波估计的精度进行对比。
二、状态空间模型与卡尔曼滤波
本节首先给出状态空间模型的基本结构及其卡尔曼滤波等式。状态空间模型一般由两组线性等式构成,分别是观察值等式和系统等式。
观察值等式可表示为
三、估计方法
本节在连续性抽样调查条件下建立状态空间模型的基本结构,包括总体均值的系统等式和样本均值的观察值等式。最后运用卡尔曼滤波估计方法对连续性调查数据进行估计。
(一)总体均值条件下的系统等式
本文假定通过连续性调查得到季度的时序数据,且总体均值的季节变动模型满足如下关系
四、数值分析
为了通过连续性抽样调查数据验证第三节研究的状态空间模型及卡尔曼滤波估计方法,本节参考Binder and Hidiroglou(1988)给出的例子[1],通过模拟方法产生24期连续样本的时间数列数据,每期数值由4个轮换样本估计值构成,其中轮换样本估计值是遵循由式(16)和(17)所确定的状态空间模型和轮换模式而产生的数据。具体计算结果见表1。
表1 卡尔曼滤波估计量及其方差估计量
简单估计量是对4个轮换样本简单估计量进行简单平均得出的估计量,卡尔曼滤波估计量是通过卡尔曼滤波方法得出的估计量。通过表1的结果发现,由于利用了所有24期的调查数据,卡尔曼滤波对过去各期的估计量进行更新之后得出各期的卡尔曼滤波估计量,此估计量利用了更多的调查信息,其方差估计量将更小,估计精度也将提高。
五、结束语
本文不同于一般的计量分析论文,其研究目的不是研究如何应用某些计量方法分析已有的时间序列数据,得出某些经济规律,而是研究在连续性抽样调查中,这些时序数据是如何估计出来的,以及如何使这些时序数据更加准确等问题。这是一个更深层次的问题,只有当那些通过连续性抽样调查得出的时序数据更加准确时,那么通过计量方法研究这些数据得出的结论才更有可能符合实际情况。否则,不准确的时序数据,即使运用再科学的计量分析方法来研究,也很难得出准确结论。
在研究连续性抽样调查时,本文打破了现有的抽样估计理论,引入了时间序列分析方法,根据总体的长期发展趋势和季节变动趋势,建立关于连续性调查样本的状态空间模型,利用成熟的卡尔曼滤波估计方法给出总体均值的估计量。使用该分析方法能够充分利用所有过去各期调查信息的相关性对现期及过去各期的估计量进行调整和更新,从而得出精度更高的估计量。本文更重要的意义在于打破了现有抽样估计理论的限制,引入了各种成熟的时间序列分析方法,从而大大拓宽了抽样估计的研究范围。