我国 2000年人口普查数据修正之我见
●侯海桂
摘 要: 2010年和2000年两次人口普查的年龄段数据存在多处矛盾,如2010年10~14岁年龄段人数75532610人比2000年的0~4岁年龄段的人数68978374人还要多(考虑死亡因素,2010年10~14岁年龄段人数应比2000年的0~4岁年龄段的人数少)。这些矛盾告诉我们应该是2000年的人口统计数据是有水分的。文章试图通过前后两次人口普查数据的联系,利用死亡剔除法来修正2000年人口普查数据。
关键词: 人口数 人口普查 人口普查数据
在最近两次人口大普查的统计数据(见表1)中,出现了前后数据的多处矛盾。如2010年10~14岁年龄段的人数(74908462人)比2000年0~4岁年龄段的人数(68978374人)多了近8.6%,类似的情况共有5处之多(见表2)。2000年普查时的0~4岁人口,在2010年普查时正好是10~14岁年龄段,在不考虑死亡情况下,后者也不应该高于前者;况且0~4岁的死亡率是较高的,理论上后者应大大小于前者才对。另外4对年龄段矛盾的理由同样出于此。
表1
表2 2000年和2010年对应年龄段数据矛盾对比表
数据的矛盾,要么说明2000年人口普查的统计数据有水分,要么说明2010年的统计数据有水分。如果是2000年统计数据有水分,则问题在于少统计,如果是2010年统计数据有水分,则问题是多统计。由于瞒报、漏报或漏统计等原因,人口数据的统计,只会少统计,而不会多统计。这说明两次普查中对应年龄段前后数据的矛盾原因,肯定前面少统计,而不是后面多统计。也鉴于此,就为我们利用后面的数据去调整前面数提供了可行性。本文试图通过前后数据的联系来修正2000年人口普查的数据。
一、数据修正的可行性
要利用后面的数据调整前面的数据需要有三个假设:第一,在数据矛盾的对应年龄段中,后面的数据是正确的;第二,各年龄段的死亡率是已知的;第三,除死亡外,其他因素对人口数变动的影响程度小到可以忽略。
基于以下原因,第一个假设应该是成立的。首先,从统计手段及统计经验来看,后面的统计数据应比前面的统计数据来得可靠。其次,从瞒报或漏报的可能性来看,年纪小的人容易瞒报或漏报;年纪大的不好瞒报,也不必瞒报。瞒报的主要原因是超生,年纪小的由于未被周围人所熟知容易被瞒报,也由于未被周人所熟知,容易被居委会、村委会等机构漏报。年纪大不好瞒报是因为他(她)已经被周围的人所熟知;不必瞒报是因为他(她)需要工作。正是这第二个原因使得10年前统计时被瞒报、漏报的人,在10年后不再被瞒报和漏报。在后一次的统计(2010年普查)中可能仍有人被瞒报或漏报,但被瞒报或漏报的应集中低年龄段。也是这个原因告诉我们,2010年的统计数据中,低年龄段的统计数可能仍有水分,但高年龄段的统计数据要真实得多。
在现有条件下,第二个假设也是成立的。《CEC中国市场营销环境年鉴1998》发表过一次1997年中国分年龄段人口死亡率统计数据(见表3)。我国历年的死亡率变化本来就不大,该数据的发表年份离两次大普查时间距离不算远,在很大程度上应可代表2000年到2010年间各年龄段的死亡率。
他画下了万里长江上的积雪,画雪后的溪流、栈道与小屋。一片白茫茫中,王维逐渐从一个生活的参与者,变成了旁观者。他闲来抒发内心情感的寥寥几笔,对于中国艺术史来说,却开启了一个新的时代风尚,他被后世奉为“文人画”的鼻祖。那么“文人画”又是什么意思呢?简单来说,就是带有人文情趣、流露文人思想的绘画。
我们已知的死亡率并非每1岁年龄的死亡率,而是5岁为一个年龄段的死亡率。每过一年后,原年龄段死亡率就不再适用。如0~4岁年龄段的死亡率是8.63‰,但过1年后,原0~4岁年龄段将变成1~5岁年龄段,1~5岁年龄段的死亡率当然就不再是8.63‰了。为了利用2010年的数据还原2000年数据,我们需要计算连续年龄段的死亡率(见表4)。具体做法是,根据已知的年龄段死亡率(表3),通过加权算术平均法计算连续年龄段的死亡率(见表4)。由于需要修正的数据全部集中在低年龄段,因此表4仅计算了部分年龄段的死亡率。具体算方法是以新年龄段交已知死亡率年龄段的年数为权数,结合已知年龄段的死亡率,用加权算术平均法来计算新年龄段的死亡率。如1~5年龄段交已知死亡率的0~4年龄段4年,交已知死亡率的5~9年龄段1年,则1~5年龄段的死亡率计算过程如下:
表3
表4
通过以上分析,笔者认为,根据2010年人口普查数据和适当的数学方法修正我国2000年的人口普查数据的做法是可行的。
通过前面的分析,笔者认为对应年龄段的同一批人(如2000年0~4岁年龄段人口和2010年10~14岁年龄段人口是同一批),十年前和十年后的差异主要受死亡因素影响,将时间拆碎后就是上一年份的人口数乘以该年龄段的存活率(1~死亡率)后等于后一年份的同一批人口数。如2000年0~4年龄段人口数乘以该年龄段的存活率(1-8.63‰)后就等于2001年的1~5年龄段的人口数。如此连续计算十次,就可得到2010年10~14年龄段的人口数。
1~5年龄段死亡率=
二、修正方法及修正结果
第三个假设是最有理由成立的。国家统计局没有提供相关我国公民外迁及外国人加入我国国籍的相关数据,说明这个数据就非常小。新浪新闻在2006年8月23日有一篇题为《中国人移居国外世界第一》的报道称:中国每年净移出56万人。56万的数字,相对于中国人口数来说确实是微乎其微的,再分摊到不同年龄段后更是小到不必理会了。
式中N00(i,i+4)代表2000年度第i到第i+4年龄段的修正人数,其中i=0,5,10,15…,是年龄段的下限;式中N10(i+10,+14)代表2010年第i+10到第i+14年龄段的实际人数(具体数据见表1),i的意义与前述相同;式中S(k)表示以k为下限的第k到第k+4年龄段的死亡率(具体数据见表4),另外k还是表4中的序号。
根据硬度不同设定矫形棒材料为钴铬合金和钛合金,棒的直径均为6.35 mm。钛合金棒弹性模量为11 000 Mpa,泊松比为0.30;钴铬合金棒弹性模量为23 900 Mpa,泊松比为0.35。分别比较2种矫形棒术后胸椎后凸、胸腰交界后凸和腰椎前凸的变化以及椎弓根螺钉拔出力。
既然我们假定2010年的数据是正确的,我们就可以通过剔除死亡因素的方法来修正2000年的人口统计数据。根据上述同一批人前后数据的关系,我们可得到以下数据还原公式:
山西省各个地区分布着各个历史时期的不同革命遗迹,根据不完全统计,山西省到目前为止共拥有3 800多处革命遗址,位居全国的第二。其中太原市共有202处、大同市共有459处、梁山共有275处、晋中市共有610处、长治市共有795处。尤其是晋中市与长治市最为密集。革命战争时期,晋中市作为中共中央北方总局、前方总局、八路军129师师部等高级别的党政军机关作战时间较长的重要地区,遗留下来众多宝贵的革命遗址。而长治市则是抗战老区,是太行与太岳敌后抗战关键的民主根据地,同时也是抗战解放后上党战争的起源地,遗留下了一批老革命先烈的光荣足迹和抗战遗址上百处。
例:2000年15~19年龄段的修正数计算如下:=102151202人
利用上述公式对2000年数据进行修正时,若出现修正数小于原数时应保留原数,说明该年龄段没有漏统计情况。比如说2000年15~19年龄段修正数计算结果为102151202人,比原15~19岁年龄段的实际统计人数103031165人为少,应保留原数。根据此原则,修正后的2000年全国人口数应为1270660508人,比修正前人数高出2.257%。各年龄段具体修正结果如表5。
1)在调节座内腔装有弹簧,当光杆和盘根垫之间摩擦有了间隙的时候,弹簧自动顶紧,填充光杆和盘根垫之间的间隙,有效防止了盘根盒漏油现象。
表5
三、本文的缺陷
本文的修正是建立在假定基础之上的,从文中的分析来看,这些假定应该是成立的,但其在多大程度上成立,本文仅作抛砖引玉之意。
中图分类号: F22
文献标识码: A
文章编号: 1004-4914(2019)07-230-02
(作者单位:广东理工学院 广东肇庆 526114)
[作者简介: 侯海桂,统计高级讲师、统计师,统计专业本科学历,广东理工学院教师。]
(责编:贾伟)