基于回归模型的全国人口预测研究
罗佳沩
(哈尔滨商业大学 能源与建筑工程学院,哈尔滨 150028)
摘要: 使用数学方法预测人口发展趋势较为简便易行。通过IBM SPSS20.0软件对2001---2018年、1949---2018年的人口数据进行11种回归方法建模,预测2019---2050年我国人口趋势,并与《联合国人口展望(2017修订本)》的相关总人口预测结果做比较计算预测误差率,发现数学方法预测人口发展存在难以克服的内在缺陷。我国总人口即将见顶,随后进入人口萎缩通道,现有数学方法很难对此做出准确预测,因此,需要对当今的总人口预测研究结果保持审慎态度。
关键词: 回归模型;人口预测;研究
人口学家王桂新[1]指出,人口预测有数学方法、队列预测法、多区域矩阵法、社会经济模型法及其他预测方法等。由于所需要用到的基础数据较少,且基础数据又容易获取,使得选用特定的直线或曲线函数,拟合人口发展的历史数据,建立数学回归模型,预测人口将来发展趋势的数学回归方法得到一些学者的关注和喜爱。在全国大学生所熟知的数学建模大赛上,人口发展预测也曾作为大赛赛题出现,主要方法是运用数学建模法尽可能准确地拟合人口历史趋势并做未来的人口预测。
1 问题的提出
使用数学模型方法预测人口发展趋势,已经有很多学者做过此类探索。王裕明[2]等人以上海市常住人口出生率为结果变量,以时间为自变量,选择幂函数回归模型拟合数据建立回归模型预测2013---2050年上海市常住人口出生率的变化。刘令[3]等人使用指数增长模型预测我国总人口的发展。张小乐[4]等人通过数值微分以及最小二乘曲线拟合两种方法对Logistic人口回归模型进行参数估计,预测2015---2040年的中国人口发展趋势。
但是,人口预测的数学方法并不像一些研究者所宣称的那样一定会带来较为准确的预测结果,使用不恰当的基础数据或采用不妥当的数学模型方法也可能使预测精度不够,出现较大的预测偏差。例如,刘令等人运用指数增长模型预测我国人口总数,从2015年的13.892亿人到2020年的14.255亿人,此后一路攀升到2050年的15.277亿人。张小乐等人预测中国总人口数2015年为14.407亿,此后持续增长,到2040年达到15.186亿人。但从实际数据来看,我国2015年总人口数实际为13.746亿人,与前述预测结果相差不小。另外,前述预测结果往往没有注意到人口波动发展的趋势,使得其预测的人口只有增长,没有萎缩的情况,但这样的趋势预测与我国人口发展的走势是不相符的。据国家权威部门2016年提供的人口预测意见,我国总人口数将在2030年前达到峰值,约为14.5亿人[5]。这一权威部门的数据其实仍在一定程度上存在高估我国人口总量趋势的问题,但其还是准确预测了我国人口即将见顶并在随后时间里逐渐萎缩的趋势。由此可见,一些研究对我国总人口在未来数10年一直持续增长的预测仍存在科学性问题。
2 试算预测模型与方法
人口预测的数学模型方法基本上都要选取某个范围内的数据作为基础数据。但数据范围对结论有影响。自1949年以来,我国各年的总人口数据在公开出版的统计年鉴中都可以查到,但很多研究者在预测总人口数时并没有选用1949年以来的所有总人口数据作为基础数据,而是从中截取一小段数据。由于截取的方案非常多,文中使用1949---2018年数据以及2001---2018年的全国人口数据两种方案作为试算预测的基础数据范围,并对二者的预测结果进行比较。
回归分析模型可以借助IBM SPSS 20.0软件进行拟合。利用SPSS软件进行估计,可以做直线回归,也可以做10种不同方法的曲线回归估计。以往学者对幂函数回归估计[2]、Logistic回归模型[4]、指数增长模型[3]等方法都使用过。本研究将利用IBM SPSS20.0的直线和曲线估计方法做11种回归方法,再根据目前相对较为准确的《联合国人口展望(2017修订本)》的相关总人口预测结果作为预测是否准确的判定标准,如表1所示。
由表4可知,从中部烟叶化验结果看,3个参试品系糖碱比除GZ90中肥外均偏高,GZ90中肥的整体内在化学成分及糖碱比和氮碱比相对其他施氮水平和照组K326均较适宜、协调。从上部烟叶化验结果看,除K326低肥糖碱比偏高外,其他品种(系)不同施肥标准的内在化学成分及糖碱比和氮碱比均较适宜、协调。综合来看,3个参试品种(系)整体内在化学成分及糖碱比和氮碱比等均在中等施氮水平较适宜、协调。
表 1《联合国人口展望( 2017修订本)》关于中国总人口预测的结果
Tab.1 Results of the United Nations Population Prospect( 2017 Revision) on China’ s population forecast
Notes:United Nations, Department of Economic and Social Affairs, Population Division (2017). World Population Prospects:The 2017 Revision, custom data acquired via website.
3 试算预测结果及讨论
从表2可以看出,使用较近期、范围较短的数据进行统计建模,10年左右时间里的预测,各种回归方法的预测精度基本都在3%以内。但采用较长时间范围内的人口数据进行统计建模,则各种建模方法的预测精度基本上都大大超过3%。而我国总人口在10年左右时间里将达到峰值,随后进入人口萎缩通道这一趋势,基本上所有回归方法都没有预测出来。
采用IBM SPSS20.0软件对我国总人口2019---2050年约32年的总人口发展趋势进行数学回归建模预测,建模方法包括线性模型以及统计软件能够直接计算的10种曲线估计模型。分别采用1949---2018年以及2001---2018年的全国人口数据作为基础数据范围。两种试算预测结果与目前相对较为准确的《联合国人口展望(2017修订本)》的相关总人口预测结果做比较,预测结果的误差率如表2所示。
1949年以来,我国总人口经历了初期的爆发式增长以及后来的人口惯性增长时期。由于1970年开始严格的计划生育政策影响,我国人口出生率有明显下降,在40年计划生育政策的影响下,人口增长态势与新中国成立初有了很大改变。不注意人口结构转变的影响,选取了不太合适的基础数据范围[6],可能导致人口预测结果偏差较大。因此,基础数据的选取时间应尽量选取计划生育政策实施以来的总人口数据作为预测的基础数据。但如何判断选择哪一时间段的人口数据作为基础数据、预测期限多长会使预测精度较高这一问题似乎从数学回归方法本身仍是无法获得满意答案的。
植物园中的盆栽桂花、银边翠、时令蔬菜,质量分数为4.2%的碳酸氢钠溶液、质量分数为25%的氢氧化钠溶液、质量分数为0.1%的碘液。
表 2两种范围基础数据预测总人口的误差比例(%)
Tab.2 The percentage of errors in predicting the total population based on two ranges of basic data(%)
注:本表的误差率根据预测结果与《联合国人口展望(2017修订本)》相关结果比较计算得出。
4 总结
人口问题是影响经济社会发展的关键因素之一。做好人口预测工作,需要选取适当范围的基础数据,也需要采用合适的预测工具。数学方法被一些研究者所惯用,但数学方法没有解决的问题是如何知道所选取的基础数据是否合适够用以及采用哪一种回归方法能够较准确模拟人口变动趋势。以往我国人口一直处于上升区间,用一些数学方法做中短期的总人口发展趋势预测大体上能够确保预测精度较高,误差较小。但我国总人口即将见顶,随后进入人口萎缩通道,而现有数学方法很难对此做出准确预测,因此,需要对当今的总人口预测研究结果保持审慎态度。
石油工业部非常重视这项工程。石油部领导明确提出:“用第一流的施工水平,第一流的工程质量,为第一流的城市服务。”并要求全部工程须经超声波探伤检查和20%的X射线检查。
参考文献:
[1] 王桂新.区域人口预测方法及应用[M].上海:华东师范大学出版社,2000.
[2] 王裕明,吉祥,刘彩云.上海市人口结构变化预测研究[J].上海经济研究,2014,(03):89-98.
[3] 刘令,杨力,林源.基于指数增长模型的全国人口预测[J].山东工业技术,2014,(16):164.
[4] 张小乐,黄晶霞.基于Logistic回归模型的人口预测分析[J].楚雄师范学院学报,2013,28(09):9-13.
[5] 国务院.关于印发国家人口发展规划(2016-2030年)的通知(国发〔2016〕87号)[EB/OL].http://www.nhfpc.gov.cn/bgt/gwywj2/201701/a6dd45cf1660432c91a9ada5e758a
[6] 罗国芬,邢青.谨防数学方法预测常住人口出生率的偏误[J].上海理工大学学报,2018,40(01):40-45.
Research on national population forecast based on regression model
LUO Jia-wei
(School of Energy and Architectural Engineering, Harbin University of Commerce, Harbin 150028, China)
Abstract : It is easy to use mathematical methods to predict population development trend. By using IBM SPSS 20.0 software, 11 regression models of population data from 2001 to 2018 and 1949 to 2018 were built to predict the population trend in China from 2019 to 2050. The error rate of prediction was calculated by comparing the results with the relevant total population prediction results of the United Nations Population Prospect (2017 Revision). It was found that there existed mathematical methods to predict population development. Inherent defects that is difficult to overcome. The total population of our country is about to peak and then enter the path of population shrinkage. It is difficult to make an accurate prediction by the existing mathematical methods. Therefore, it is necessary to maintain a prudent attitude towards the research results of the current total population prediction.
Key words : Regression model; Population prediction; Research
中图分类号: C924.2
文献标志码: B
文章编号: 1674-8646( 2019) 18-0146-03
收稿日期: 2019-07-25
作者简介: 罗佳沩(1999-),男,本科生。
标签:回归模型论文; 人口预测论文; 研究论文; 哈尔滨商业大学能源与建筑工程学院论文;