人口动态与形势
数据漏报对总和生育率与出生率确定性函数关系的影响
朱宝生1,乔晓春2
(1.常州工程职业技术学院,江苏 常州 213164;2.北京大学 人口研究所,北京 100871)
摘 要 :根据总和生育率与出生率确定性函数关系,利用国家统计局人口统计数据,分别计算了四种出生人口数据漏报模式下总和生育率与出生率的关系系数。并与官方公布数据(有数据漏报)情况下估算的关系系数进行对比分析,发现虽然出生数据漏报对总和生育率和出生率有明显的影响,但是对总和生育率与出生率关系系数影响很小,可以忽略。因此,可以认为出生人口数据漏报对总和生育率与出生率具有同等的影响,而对两者之间的关系系数没有影响。并利用不受数据漏报影响的K 值,估算出中国1990年以来的总和生育率,研究结果是官方和非官方都可以接受的生育水平。最后,文章还对今后的研究方向提出了建议。
关键词 :数据漏报;总和生育率;出生率;函数关系;人口统计
一、问题的提出
出生率和生育率是反映人口生育水平的两个常用指标,出生率也称为粗出生率,它的优点是资料容易得到,能够从官方统计数据中获得,但是由于受到人口年龄构成和性别构成的影响,不能够很准确地反映生育水平,难以进行比较研究。生育率通常包括:一般生育率、分年龄生育率、终身生育率以及总和生育率等,通常所说的生育率一般都是指总和生育率。总和生育率是比出生率更好的指标,它能够准确地反映现有生育水平,避免了育龄妇女构成的影响,可以直接用于比较研究,是最具有代表性的人口统计指标,具有直观、易理解的特点。在社会相对稳定的情况下,总和生育率可反映妇女生育率变化的趋势。但是除了普查年及小普查年,人们很难获得总和生育率的数据,而官方可以通过每年一度的人口变动抽样数据估计出历年的出生率数据。如果能够建立总和生育率与出生率之间的确定函数关系,就可以利用公布的出生率数据估计每年各个地区的生育率数据。我们曾经给出过总和生育率与出生率有确定性函数关系:总和生育率(β )=出生率(CBR ) /常数(K ),即β =CBR /K [1],再根据人口统计数据估计出K 值,这样如果已知出生率,就能够在K 值给定的情况下估算出历年的总和生育率。
然而,自20世纪90年代以来中国出生人口漏报是一个很普遍的现象。这可能会导致对K 值的估计不准确,进而会影响到使用出生率对总和生育率所进行的估计。本文的目的就是在假定出生人口存在漏报的情况下,分析漏报对K 值的影响,最终来判断利用出生率来估计总和生育率的有效性[1-4]。
二、以往研究的回顾
长期以来,出生人口数据漏报一直困扰着中国的人口学者,用漏报的出生人口数据计算出来的总和生育率与出生率总是不准确的,为此,人口学者尝试着利用各种间接数据来研究中国的总和生育率和出生率。关于出生人口数据漏报对生育率影响的研究文献很多,根据数据处理方法和来源的不同,可以分为三类不同的研究。一类是假定普查数据是可信和准确的,直接利用普查数据估计总和生育率,这类得到的结果是最低的,认为自2000年以来中国的总和生育率不超过1.5[5-7]。第二类研究对普查数据提出质疑,通过各类方法调整后,再进行总和生育率的估计,由于使用的调整和估计方法不同,估计的结果也存在较大的差异,估计的总和生育率水平在1.42—1.75[8-11]。第三类研究利用教育数据、公安数据等其他系统数据来校对、调整普查数据,进而估计总和生育率,估计的生育率水平在1.6—1.7[12-14]。也有学者采用其他方法对生育率水平进行估算,比如,陈卫、杨胜慧采用布拉斯(Brass)提出的生育率间接估计P /F 比值方法,对中国2010年的总和生育率进行间接估计,得到的结果为1.66[15];陈卫、张玲玲利用普查同队列人口的比较计算,估算出2005—2010年间的生育水平基本上在1.5以上[16]。研究出生人口数据漏报的学者,主要有孙学礼和秦凯世,张广宇和原新,夏乐平,郭志刚等[12,17-19],其中郭志刚和夏乐平具体给出了育龄妇女分年龄别的出生人口数据漏报说明和各个年龄别出生人口数据漏报的比例[12,19]。
以上计算适用于地级市指标的计算。如表2所示,长三角两省一市基本公共服务水平指标体系与各地级市不同,仅用人均财政支出表示公共服务水平,因此这是一项主要从投入来衡量各地区水平的指标。为了清晰体现地区间的差异,我们利用集中系数对比两省一市与全国基本公共服务水平差异,将省份i的j类公共服务的二级指标按人口平均与全国相应人均指标相比:
不同于已有文献关注于调整出生人口和育龄妇女人数来估计生育水平的方法,本文通过研究在有出生人口数据漏报情况下,总和生育率与出生率确定性关系系数的稳定性,并利用不受出生人口数据漏报影响的关系系数K 值,对1990年以来的中国人口生育率给予大致的估计。
图8给出了不同稀疏因子所对应的分类正确率.太小或太大的稀疏因子都不能取得最理想的分类正确率;太小的稀疏因子造成矩阵稀疏系数的稀疏性不够,从而造成信息冗余或维数灾难;太大的稀疏因子会造成原始时频图像中故障特征信息的损失.从图8可以得出,稀疏因子选为0.2是最佳选择.
三、数据和方法
1.数据来源及预处理
本研究所采用的年平均总人口数、分年龄别育龄妇女人数和每年对应的分年龄别出生人口数(活产数)取自国家统计局《中国人口年鉴》、《中国人口统计年鉴》和《中国人口和就业统计年鉴》,共获得了1986年到2015年近30年的数据。经过对数据进行处理[注] 由于早期的统计数据没有经过信息化处理,不是电子数据,本文作者花费大量时间把纸质的统计数据完全电子化,为后续的研究分析创造了条件,在此要特别感谢周小青、秦雪姣同学的大力帮助。 ,获得了可以用来计算总和生育率与出生率函数关系系数的数据:得到分年龄别妇女人数、分年龄别活产数、年平均总人口数、分年龄别育龄妇女结构数据、分年龄别生育率数据、分年龄别标准生育模式数据。
3.孵化管理 根据颜色判断受精卵的发育程度,将受精卵发育至红色的抱卵虾移入网箱内孵化。转移过程动作轻快,防止受精卵受损或脱落。网箱由内外2只网箱嵌套组成,网箱大小可根据需要定制,内网箱网衣网眼为0.8~1cm,外网箱网衣60目。这种方法使幼虾与亲虾及时分离,防止被亲虾残食且方便收集幼虾。每平方米网箱放待产亲虾最好不超过10只,培育条件同亲虾培育,但一般不投喂。每天检查亲虾,及时把脱离幼体的亲虾移出网箱,放回亲虾培育池继续培育至下一次产卵,每只雌虾可产卵2~3次。澳洲淡水龙虾有护幼行为,虾苗孵化一周左右脱离母体,体长1cm左右成为幼虾,收集计数后转移至池塘培育。
2.总和生育率与出生率关系系数K 值的计算公式
根据假设定义:关系系数K =出生率CBR /总和生育率TFR (β ),即:
K =CBR /β
(1)
2〉 对只要求按╳╳容量设计时,要按远近结合原则做好总体规划,不人为堵死扩建条件,又不因要留发展而多征或早占地与增加电厂本期工程投资。对有扩建条件的场地,不应将本期工程的辅助生产建、构筑布置在厂区扩建端,不应为扩建留有限制条件。为了控制工程造价,应以“近期工程为主、兼顾远期工程”的原则处理好本期与下期工程的关系。
(2)
出生人口数(活产数):
(3)
根据分年龄别生育率定义:
(4)
设定标准生育模式:
(5)
1995年成比例数据漏报情况下(按照30%的漏报比例),K 值的计算过程及计算结果参见表3。
信息化管理系统实施过程中往往需要改变现有业务流程。传统模式下,流程的冗余,很多情况是考虑通过设置层层的审批环节,将责任无限度地分摊给每个审批环节,减少自己审批的责任和压力。物资管理系统运行后,应根据不同岗位设置相应的职责、权利和义务,确保责权利统一一致,能不增加审批环节就省掉,能承担的责任绝不推脱。
(6)
设定分年龄别育龄妇女结构:
我国城乡供水定价机制方面仍然存在水价水平总体偏低、水价成本约束机制尚未健全,水价秩序不规范、水价结构不合理、水价制定中不适当的行政干预、定价过程中对环境、生态及地方实际情况考虑不足等问题,另外,农村水价存在问题明显。
(7)
则根据上述公式可以推导出关系系数K 值的计算公式:
CBR =
(8)
即:
(9)
这里,C x 表示分年龄别育龄妇女结构、h x 表示标准生育模式、f x 表示分年龄别生育率、x 表示年龄别、W x 表示分年龄别育龄妇女人数、B 表示出生人口数(活产数)、B x 表示分年龄别出生人口数(分年龄别活产数)、P 表示平均总人口数、β (TFR )表示总和生育率、CBR 表示粗出生率。
根据上述公式,进行进一步的推导,建立K 值与实际人口统计数据之间的直接关系,以便能够清楚地研究统计数据漏报对K 值的影响程度:
根据表1没有数据漏报的1995年K 值计算过程及结果,求出的K_ 1995=0.009449001;根据表5固定漏报人数的1995年K 值计算过程及结果,求出的K 2_ 1995=0.009196178;根据官方人口统计数据查到1995年的人口出生率CBR_ 1995=17.12(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR 2_ 1995=CBR /K =(17.12/0.009196178)/1000=1.861642956,TFR_ 1995=1.811831748, 求两者的差TFR_ 1995-TFR 2_ 1995=-0.049811208,虽然两者的结果不完全一样,但是可以看出两者的差很小,误差在5%的置信区间内,在误差范围内可以认为两者是一样的。同样根据表2没有数据漏报的2015年K 值计算过程及结果,求出的K_ 2015=0.007854348;根据表6固定漏报人数的2015年K 值计算过程及结果,求出的K 2_ 2015=0.00770434;根据官方人口统计数据查到2015年的人口出生率CBR_ 2015=12.07(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR 2_ 2015=CBR /K =1.566649447,TFR_ 2015=1.536728446, 求两者的差TFR_ 2015-TFR 2_ 2015=-0.029921001,虽然两者的结果不完全一样,但是可以看出两者的差很小,误差在5%的置信区间内,在误差范围内可以认为两者是一样的。因此可以得出结论,出生人口数据在每个年龄别漏报人数固定的情况下,对K 值计算结果影响很小,可以忽略。
(x =15,16,…,49)
(10)
通过上面的公式(10)能够清楚地发现,影响K 值的主要因素是分年龄别出生人口数(分年龄别活产数)、分年龄别育龄妇女人数以及平均总人口数。在计划生育政策的影响下,会出现一定程度的出生数据漏报,并可以表现为分年龄别出生人口数(分年龄别活产数)的漏报。人口漏报主要集中在0—9岁的少年儿童阶段,由于上学申报户口等原因,漏报的人口随着年龄的增长会逐步补报,而15—49岁育龄妇女漏报很少,其漏报率只有0.159%,这个漏报情况对地区育龄妇女总和生育率的影响很小,可以忽略[20];即使在出生人口漏报严重的20世纪90年代,人口漏报也不超过10%,国家统计局对1993年和1994年人口变动情况进行了抽样调查,发现1993年和1994年人口漏报率分别为6.9%和6.4%[21],而人口出生率漏报也多是在5%以下[22],漏报的出生人口对总人口数量的影响微乎其微,也可以忽略。因此在数据漏报对总和生育率与出生率确定性函数关系影响研究中,不考虑分年龄别育龄妇女人数和平均总人口数这两个变量的变化[20-28]。
本文主要研究出生人口数据漏报,特别是分年龄别出生人口数(分年龄别活产数)的漏报对K 值的影响。
3.研究方法
为了便于研究,本文把分年龄别出生人口数(活产数)漏报对K 值的影响分为四种模式。
(1)每个年龄别的出生人口数成比例漏报。举例说明,对15,16,…,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段漏报的出生人口数都具有相同的比例,比如都是30%,则每个年龄段漏报前的出生人口数(活产数)然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),代入K 值计算公式估算K 值,再对计算结果进行分析。
(2)每个年龄别漏报的出生人口数据固定。举例说明,对15,16,…,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段都漏报1000个活产,则每个年龄段漏报前的出生人口数(活产数)然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),代入K 值计算公式估算K 值,再对计算结果进行分析。
她睁眼看着窗外,从半夜醒来,直到天色渐亮,一夜间,阳台上盖了一床雪的被子。易非看着那雪被子越来越厚,衬着雪的背景也越来越明亮。东方发白了。小巷子里有第一个孩子起来,开了门,对着雪地大呼小叫时,易非也起来了。
(3)每个年龄别漏报的出生人口数据没有规律,每个年龄别漏报人数不确定,而是随机漏报。举例说明,对15,16,17,…,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段漏报的出生人口数都不一样,也没有规律,假定按照随机函数RAND()的50%比例漏报,则每个年龄段漏报后的出生人口数(活产数)漏报前的出生人口数在B x (官方公布的数据)和1.5B x 之间随机变化,(随机函数RAND()返回大于等于 0 且小于 1 的均匀分布随机实数,每次计算工作表时都将返回一个新的随机实数,这里用随机函数RAND()来产生随机数据),然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),代入K 值计算公式估算K 值,再对计算结果进行分析。
(4)根据已有文献关于育龄妇女分年龄别出生人口漏报分布,研究出生人口漏报对K 值的影响。根据文献的论述,40岁以上育龄妇女生育已经极少,因此在研究漏报对K 值的影响时,这个年龄段的漏报可以忽略。15—19岁及35—49岁两个年龄段育龄妇女,占整个生育群体的比例从1980年的12%逐步减少到5%,他们对整个生育率的影响是有限的,在研究漏报对K 值的影响时也不予考虑,而20—34岁是高生育率年龄段,该年龄段出生人口数据漏报对总和生育率、出生率及K 值的影响最大,这个年龄段出生人口数据漏报是研究的重点。根据文献的研究结果,由于官方制定的晚婚晚育的限制,导致20岁、21岁和22岁育龄妇女出生人口漏报问题严重,漏报比例分别达到63%、28%和18%,而进入可以生育第一胎的23—26岁年龄的育龄妇女群体,漏报情况很少。进入27岁的年龄段,由于进入第二胎生育期,漏报的数据再次升高,在27—34岁的年龄段漏报的数量超过20%[12,19,24-25]。
本文首先利用已知年份的出生人口数、妇女人数和总人口数,求出官方公布数据下的K 值,然后再把该年份的出生人口数作为有漏报的出生人口人数,分别采用上述四种模式的数据漏报方法获得漏报前的出生人口数,并用漏报前的出生人口数代替原来的出生人口数,利用K 值计算公式分别求出四种出生人口漏报模式下的K 值,再用四种漏报模式下求出的K 值与官方公布的数据(有数据漏报)下求出的K 值进行对比分析,研究四种出生人口数据漏报对K 值的影响程度。
四、结果与讨论
在下面的讨论过程中用到的一些变量,在这里分别作如下的定义说明:B x 表示官方公布(有漏报数据)的活产数;代表每个年龄别出生人口数成比例漏报前的活产数;代表漏报了固定出生人口数前的活产数;代表随机漏报了出生人口前的活产数;代表根据已有文献漏报了出生人口前的活产数;f x 表示官方公布数据情况下的分年龄别生育率;f x1 表示成比例漏报下的分年龄别生育率;f x2 表示固定漏报情况下的分年龄别生育率;f x3 表示随机漏报下的分年龄别生育率;f x4 表示根据已有文献漏报比率下的分年龄别生育率;h x 表示官方公布数据下的标准生育模式;h x1 表示成比例漏报下的标准生育模式;h x2 表示固定漏报下的标准生育模式;h x3 表示随机漏报下的标准生育模式;h x4 表示根据已有文献漏报比率下的标准生育模式;K 表示官方公布数据下的总和生育率与出生率关系系数;K 1表示成比例漏报情况下的系数;K 2表示固定漏报情况下的系数;K 3表示随机漏报情况下的系数;K 4表示根据已有文献漏报比率情况下的系数。
根据K 值计算公式(10),在平均总人口P 和分年龄别育龄妇女W x 没有漏报的情况下,即可以把公式中的P 和W x 看作固定值。现在只研究出生人口数漏报,也即分年龄别出生人口数漏报对K 值计算结果的影响。本文利用国家统计局《中国人口统计年鉴》和《中国人口和就业统计年鉴》获得了1986年到2015年近30年的人口统计数据,并对每一年的数据进行了分析处理。首先利用上述数据求出每一年的K 值,然后,分别针对四种数据漏报模式,求出四种漏报情况下的K 值,并对填补了漏报数据求出的K 值与官方公布数据(有漏报数据)情况下求出的K 值进行比较分析,研究数据漏报对K 值的影响。通过对每一年数据的研究分析,发现每一年数据漏报对K 值的影响是一致的。为了能够清楚地展示研究过程,下面以1995年和2015年两个年份的研究过程为例,展示分析出生人口数据在四种漏报模式下,数据漏报对K 值的计算结果的影响。
1.成比例漏报情况下K 值的稳定性研究结果与分析
1995年官方公布数据情况下,K 值的计算过程及计算结果参见表1。
表1 1995年官方公布数据的K 值计算
注:1.1995年的K 值=0.009449001;2.年份:1994-10-01日至1995-09-30日抽样;P (总人口数抽样)=12366955;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
2015年官方公布数据情况下,K 值的计算过程及计算结果参见表2。
表2 2015年官方公布数据的K 值计算
注:1.2015年的K 值=0.007854348;2.年份:2014-11-01日至2015-10-31日抽样;P (总人口数抽样)=21312241;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
根据总和生育率定义:
表3 1995年成比例数据漏报的K 值计算
注:1.1995年的K 1值=0.009449001; 2.年份:1994-10-01日至1995-09-30日抽样;P (总人口数抽样)=12366955;C x =W x /P ;f x =B x /Wx ;hx =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
2015年成比例数据漏报情况下(按照50%的漏报比例),K 值的计算过程及计算结果参见表4。
表4 2015年成比例数据漏报的K 值计算
注:1.2015年的K 1值=0.007854348;2.年份:2014-11-01日至2015-10-31日抽样;P (总人口数抽样)=21312241;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
根据表1官方公布数据的1995年K 值计算过程及结果,求出的K_ 1995=0.009449001;根据表3成比例数据漏报的1995年K 值计算过程及结果,求出的K 1_ 1995=0.009449001;根据官方人口统计数据查到1995年的人口出生率CBR_ 1995=17.12(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR_ 1995=CBR /K =(17.12/0.009449001)/1000=1.811831748,TFR 1_ 1995=CBR /K =(17.12/0.009449001)/1000=1.811831748, 可以发现TFR_ 1995=TFR 1_ 1995=1.811831748,两者的结果完全一样。同样根据表2没有数据漏报的2015年K 值计算过程及结果,求出的K_ 2015=0.007854348;根据表4成比例数据漏报的2015年K 值计算过程及结果,求出的K 1_ 2015=0.007854348;根据官方人口统计数据查到2015年的人口出生率CBR_ 2015=12.07(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR_ 2015=CBR /K =(12.07/0.007854348)/1000=1.536728446,TFR 1_ 2015=CBR /K =(12.07/0.007854348)/1000=1.536728446, 可以发现TFR_ 2015=TFR 1_ 2015=1.536728446,两者的结果也完全一样。因此可以得出结论,出生人口数据在每个年龄别成比例漏报的情况下,对K 值计算没有任何影响。其实这个结论从K 值的计算公式(10)也能清楚地得出,在式(10)中,由于W x 和P 是固定值(根据前面的阐述),则在两次K 值的计算过程中,W x 和P 保持不变,设定(此处C 为一个比例常数),则可以得到:
3.3 通过香气成分归纳总结并结合调香技术配制香精配方B,感官评价表明香精配方B,香气浓郁,头香、体、香和尾香过渡自然且有层次感,与百香果的天然香气基本一致,因此,可以开发为一种新型百香果果汁香精,应用于食品和医药领域。
K 1/K
综上所述,通过对高催乳素血症患者实施甲磺酸溴隐亭进行治疗,患者临床疗效较为显著,服药期间出现的不良反应较少,值得临床进一步研究。
3.随机漏报情况下K 值的稳定性研究结果与分析
(11)
即:K 1=K
因此在每个年龄别的出生人口数成比例漏报情况下,估算出的K 值与官方公布数据情况下估算出的K 值一样,也就是说成比例漏报对K 值的结果没有影响。
2.固定漏报情况下K 值的稳定性研究结果与分析
1995年每个年龄别漏报的出生人口数为固定数值情况下(固定漏报500人数),K 值的计算过程及计算结果参见表5。
表5 1995年固定漏报人数的K 值计算
注:1.1995年的K 2值=0.009196178;2.年份:1994-10-01日至1995-09-30日抽样;P (总人口数抽样)=12366955;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
1995年每个年龄别漏报的出生人口数为随机数值情况下(漏报前的活产数值的计算过程及计算结果参见表7。
表6 2015年固定漏报人数的K 值计算
注:1.2015年的K 2值=0.00770434;2.年份:2014-11-01日至2015-10-31日抽样;P (总人口数抽样)=21312241;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
伊德里斯著作中提及的早期地理学家包含八世纪的波斯地理学家伊本·胡尔达兹比赫,九世纪亚美尼亚人地理学家艾哈迈德·本·雅库布 (al-Yaqubi),十世纪的基督教修士埃尔西奥·安蒂奥士,十世纪的阿拉伯地理学家豪盖勒 (Ibn Hawqal)和马苏第和《珍异记》,克洛德(Claude)家族的托勒密。 [13]伊德里斯的地理学知识主要来自两个传统:希腊托勒密的地理学传统和早期伊斯兰地理学的巴勒希学派 (见图2)。
=1 (x =15,16,…,49)
1.需加强对病害得检测和预报,在常发地区定期调查田间杂草和玉米粗缩病的病发率和严重程度,并且还要调查灰飞虱数量密度以及带毒率。对玉米粗缩病发生的趋势作出具有时效性以及准确性的预测,用来指导防治。
2015年每个年龄别漏报的出生人口数为固定数值情况下(固定漏报2000人数),K 值的计算过程及计算结果参见表6。
表7 1995年随机漏报出生人数的K 值计算
注:1.1995年的K 3值=0.009485175;2.年份:1994-10-01日至1995-09-30日抽样;P (总人口数抽样)=12366955;C x =W x /P ;f x =B x /W x ;h x =f x /(f 1+f 2+…+f 49);K =sum(C x X h x )
2015年每个年龄别漏报的出生人口数为随机数值情况下(漏报前的活产数值的计算过程及计算结果参见表8。
根据表1没有数据漏报的1995年K 值计算过程及结果,求出的K_ 1995=0.009449001;根据表7随机漏报出生人数的1995年K 值计算过程及结果,求出的K 3_ 1995=0.009485175;根据官方人口统计数据查到1995年的人口出生率CBR_ 1995=17.12(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR3_1995=1.804921891, TFR_1995=1.811831748, 求两者的差TFR_1995 - TFR3_ 1995=0.006909857,虽然两者的结果不完全一样,但是可以看出两者的差很小,误差在5%的置信区间内,在误差范围内可以认为两者是一样的。
根据出生率定义:
表8 2015年随机漏报人数的K 值计算
注:1.2015年的K3值=0.007871837;2.年份:2014-11-01日至2015-10-31日抽样;P(总人口数抽样)=21312241;Cx=Wx/P;fx=Bx/Wx;hx=fx/(f1+f2+…+f3);K=sum (Cx X hx)
同样根据表2没有数据漏报的2015年K值计算过程及其结果,求出的K_2015=0.007854348;根据表8随机漏报出生人数的2015年K值计算过程及结果,求出的K3_2015=0.007871837;根据官方人口统计数据查到2015年的人口出生率CBR_2015=12.07(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR3_2015=1.53331427,TFR_2015=1.536728446, 求两者的差TFR_2015 - TFR3_2015=0.003414176,虽然两者的结果不完全一样,但是可以看出两者的差很小,误差在5%的置信区间内,在误差范围内可以认为两者是一样的。因此可以得出结论,出生人口数据在每个年龄别随机漏报的情况下,对K值计算结果影响很小,可以忽略。
4.已有文献漏报情况下K值的稳定性研究结果与分析
根据已有文献研究结果,对总和生育率、出生率及K值产生影响的出生人口数据漏报,主要是20至34岁的高生育年龄段出生人口数据漏报。根据文献给出的20至34岁年龄段出生人口漏报比率,以1995年的人口统计数据作为研究数据,展示数据漏报对K值的影响。
1995年20—34岁高生育年龄段出生人口漏报估计的K值计算过程及计算结果参见表9。
(2)农村环境治理。目前我国农村环境污染情况日益严峻,随着各部门对点源污染的整顿治理,农业面源污染越来越严重,其中农业面源污染是指在农业生产过程中农用化肥、农药等其他污染物,通过农田地下渗透,进入水资源而形成的面源污染。另一方面,工业及城市污染向农村转移,农村旧污染与新污染相互叠加,这些极大地损害了农业绿色生产过程中所需的土壤条件、气候条件、水资源条件等。面对农村环境污染问题,各地区加强宣传农村环境保护工作,完善农村环境保护政策,加快推进农村环境治理相关措施。因此,本文使用各地区环境污染治理投资总额(亿元)与各地区地方财政支出(亿元)比重表示农村环境治理,用x2表示。
表9 1995年根据文献漏报人数的K值计算
注:1995年的K4值=0.00927879;年份:1994-10-01日至1995-09-30日抽样;P(总人口数抽样)=12366955;Cx=Wx/P;fx=Bx/Wx;hx=fx/(f1+f2+…+f49);K=sum (Cx X hx)
根据表1没有数据漏报的1995年K值计算过程及结果,求出的K_1995=0.009449001;根据表9(为了简化表的内容,省略了部分年份数据)高生育年龄段出生人口漏报的1995年K值计算过程及结果,求出的K4_1995=0.00927879,根据官方人口统计数据查到1995年的人口出生率CBR_1995=17.12(‰),则根据总和生育率与出生率确定性函数关系公式可以得到TFR4_1995=CBR/K=1.8450681608, TFR_1995=1.811831748, 求两者的差TFR_1995-TFR4_1995=0.0332364128,虽然两者的结果不完全一样,但是可以看出两者的差很小,误差在5%的置信区间内,在误差范围内可以认为两者是一样的。因此可以得出结论,出生人口数据在20至34岁高生育年龄段出生人口漏报的情况下,对K值计算结果影响很小,可以忽略。
5.与已有文献研究结果的比较与分析
通过上述的研究,可以得出,出生人口数据漏报对总和生育率与出生率确定性关系系数影响较小,可以忽略。这样就可以利用人口统计数据求出关系系数K值,并通过官方公布的人口出生率数据估算出每一年的生育率。
表10 1990年以来的TFR值对比
资料来源:引自张广宇、原新2004年研究及参考文献中各位作者的论文[4, 10-12,16, 18,26]。
表10 是本文和部分学者估算的20世纪90年代以来的总和生育率数据。可以看出,本文研究结果与多数专家的研究结果基本保持一致,也是官方和多数学者认可的生育水平。本文研究数据显示,20世纪90年代初,生育率水平已经接近更替水平,以后就逐渐下降,到世纪之交,尽管数据还保持在1.6以上,但是中国人口生育率已经很低的事实已经毋庸置疑。与官方登记的生育率数据在2005年有所升高对应的是,估算的生育率值在2005年也有所提升,达到了1.764,然后又一路下滑,到2010年降到了1.58。由于2013年末“单独二孩”和2015年末“全面两孩”政策的影响,总和生育率在2014年和2016年又出现了一波小幅反弹,到2016年上升到1.648。
五、归纳和总结
有关20世纪90年代以来中国生育水平的学术研究中,数据质量问题成为研究中国生育水平的关键问题。在众多的研究中,有关生育率水平的探讨主要通过两大类方法来处理。一类是调整出生人口数据,通过考察各类调查、普查数据之间的关系,调整、回推出生人口数据;或者利用教育、公安等其他系统数据,通过校对、调整出生人口数。另一类是采用一些对普查数据质量要求较低的计算方法,比如采用生育率间接估计的P/F比值方法、变量r方法等。
不同于已有研究关注于出生人口数据质量对生育率的影响,本文从总和生育率与出生率确定性函数关系系数入手,研究出生漏报对关系系数K值的影响,研究发现数据漏报对K值的影响很小,足以忽略,从而可以利用人口统计数据求出K值,并利用官方公布的出生率估算出每年的总和生育率数据,本研究提供了一种利用人口统计数据计算生育率的新方法,可以计算出每一年的生育率数据,计算结果是官方和非官方都接受的生育水平。
总而言之,初中道德与法治对学生未来的生活和发展起着重要的作用,不仅有利与他们养成良好的行为习惯,还能使其提高法律意识,从而为将来的发展打下良好的基础。
K值随着时间的变化规律,以及与K值有关的标准生育模式hx的变化规律是今后需要进一步研究的问题。
(致谢 :作者感谢安徽农业大学教授徐俊博士在论文撰写过程中给予的支持!)
参考文献 :
[1] 乔晓春,朱宝生.如何利用(粗)出生率来估计总和生育率?[J ].人口与发展,2018(2):65-70,100.
[2]CAMPBELL A A .Manual of fertility analysis [M ].London :Churchill Livingstone ,1983:3-10.
[3]ENTWISLE B .CBR versus TFR in cross -national fertility [J ].Demography ,1981,18(4):635-643.
[4] 佟新.人口社会学[M ]. 北京:北京大学出版社,2000:63-93.
[5] 郭志刚.六普结果表明以往人口估计和预测严重失误[J ].中国人口科学,2011(6): 2-13,111.
[6] 郝娟,邱长溶.2000年以来中国城乡生育水平的比较分析[J ].南方人口,2011(5): 27-33.
[7] 朱勤.2000—2010年中国生育水平推算——基于“六普”数据的初步研究[J ].中国人口科学,2012(4):68-77,112.
[8] 李汉东,李流.中国2000年以来生育水平估计[J ].中国人口科学,2012(5):75-83,112.
[9] 王金营,戈艳霞.2010年人口普查数据质量评估以及对以往人口变动分析校正[J ].人口研究,2013(1):22-33.
[10] 崔红艳,徐岚,李睿.对2010年人口普查数据准确性的估计[J ]. 人口研究,2013(1):10-21.
[11] 米红,杨明旭.总和生育率、出生性别比的修正与评估研究——基于1982—2010年历次人口普查、1%抽样调查数据[J ].人口与发展,2016(2):12-19.
[12] 夏乐平.1979—2000年中国人口生育趋势:出生数据和教育数据的比较分析[J ].人口研究,2005(4):2-15.
[13] 杨凡,赵梦晗. 2000年以来中国人口生育水平的估计[J ]. 人口研究,2013(2): 54-65.
[14] 陈卫.2000年以来中国生育水平评估[J ].学海,2014(1):16-25.
[15] 陈卫,杨胜慧. 中国2010年总和生育率的再估计[J ].人口研究,2014(6):16-24.
[16] 陈卫,张玲玲. 中国近期生育率的再估计[J ].人口研究,2015(2): 32-39.
[17] 孙学礼,秦凯世.出生漏报的症结及建议采取的措施[J ].人口与经济,1993(1):49-51.
[18] 张广宇,原新.对1990年代出生漏报和生育水平估计问题的思考[J ].人口研究,2004(2):29-36.
[19] 郭志刚.再论队列平均子女数不能作为当前总和生育率的估计[J ].中国人口科学,2008(5): 26-33,95.
[20] 王金营,何云艳,王志成,等.中国省级2000年育龄妇女总和生育率评估[J ].人口研究,2004(2):20-28.
[21] 贾同金,赛音.人口变动情况抽样调查现状与问题分析[J ].人口研究,1995(5):28-31.
[22] 周夷谷,于丽莎.出生人口数量增多是我国第三次出生高峰的主要内容——兼与查瑞传老师商榷[J ].人口研究,1992(5):25-28.
[23] 乔晓春.“单独二孩”,一项失误的政策[J ].人口与发展,2015(6): 2-6,18.
[24] 周皓.我国第四次人口普查漏报情况的重新估计——基于第五次人口普查的分析[J ].人口研究,2003(2):36-41.
[25] 李若建.历次人口普查中低年龄组人口漏报研究[J ].中山大学学报(社会科学版),2013(2):145-152.
[26] 赵梦晗.2000—2010年中国生育水平估计[J ].人口研究,2015(5):49-58.
[27] 乔晓春.实施“普遍二孩”政策后生育水平会达到多高?——兼与翟振武教授商榷[J ].人口发展,2014(6):2-15.
[28] 郭志刚.中国的低生育水平及其影响因素[J ].人口研究,2008(4):1-12.
The Effect of Data Leakage on the Relationship between Total Fertility Rate and Birth Rate Determinate Function
ZHU Baosheng1,QIAO Xiaochun2
(1. Changzhou Vocational Institute of Engineering,Changzhou 213164,China;2.Institute of Population Research,Peking University,Beijing 100871,China)
Abstract :Based on the deterministic function relationship between the total fertility rate and the birth rate, the relationship coefficients between the total fertility rate and the birth rate under four birth data leakage modes are calculated by using the National Statistical Bureau’s demographic data. Comparison to the relationship coefficient of the estimation with official publication of data(data missing), it is found that although the missing report of birth data has a significant effect on the total fertility rate and birth rate, it has little effect on the relationship coefficient between the total fertility rate and the birth rate and the impact of data leakage can be ignored. Therefore, it can be considered that the birth population data leakage exert the same influence on the total fertility rate and the birth rate, but has no effect on the relationship coefficient between the two. The total fertility rate in China since 1990 has been estimated using K values unaffected by missing data. The fertility is that both official and non-official are acceptable. Finally, the paper also puts forward some suggestions on the future research works.
Keywords :data leakage;total fertility rate;crude birth rate;function relation;demographic statistics
中图分类号 :C921
文献标识码: A
文章编号: 1000-4149(2019)01-0001-13
DOI :10.3969/j.issn.1000-4149.2019.01.001
收稿日期 :2018-03-04;
修订日期: 2018-10-02
基金项目 :国家社会科学基金一般项目“生育率与出生率关系研究”(15BRK006)。
作者简介 :朱宝生,常州工程职业技术学院副教授,北京大学高级访问学者;乔晓春(通讯作者),北京大学人口研究所教授,博士生导师,中国人口学会副会长,中国人口学会人口信息和人口统计专业委员会主任。
[责任编辑 方 志]
标签:数据漏报论文; 总和生育率论文; 出生率论文; 函数关系论文; 人口统计论文; 常州工程职业技术学院论文; 北京大学人口研究所论文;