基于区域差异类型的流动人口快速监测方法,本文主要内容关键词为:流动人口论文,差异论文,区域论文,类型论文,快速论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
文章编号:1000-0585(2011)04-0676-11
修订日期:2010-10-24
1 引言
改革开放以来,我国流动人口增长迅猛,已成为区域经济增长和城镇化发展的重要推动力[1]。1982年和1990年第三、四次人口普查时,我国流动人口分别为657万人和3261万人,占总人口的0.65%和2.8%[2];而在2000年第五次人口普查和2005年1%人口抽样调查时,我国流动人口已分别高达1.44亿人和1.56亿人,占总人口的11.6%和11.9%[3],已整体上迈入了人口流动社会。另外,未来十年将是我国城镇化高速增长时期,据预测,到2020年我国城市化水平将达到55%~60%[4],每年将新增加2000万左右由农村到城镇的流动人口。显然,如此规模巨大的流动人口及其空间集疏过程,势必将对我国城镇发展、国土开发的空间格局与区域主体功能等方面产生重要的影响。
区域发展差异是导致人口跨区域流动与空间集疏过程的主要驱动力。我国现阶段人口流动的总体方向是由农村流向城镇,由中、西部经济欠发达地区流向东部经济发达地区。同时,大规模的流动人口对流出地与流入地的经济社会和资源环境等也会产生重大影响,并具有显著的区域差异性。对于流动人口大量迁入、集聚的城镇,如何提供教育、住房、就业与培训、医疗保健、社会保障等基本公共服务、促进流动人口在当地安居乐业,是当前所面临的主要挑战;而对于四川、湖南等人口大规模流出的农村地区,必须高度重视土地大面积撂荒、留守儿童和老人的比重过高等问题。
目前我国仍缺乏对流动人口进行快速动态监测的有效方法与方案,致使家底不清,基础数据缺失,这已成为各级政府在进行科学决策和及时行动时的主要制约因素之一。现状流动人口数据主要来自于10年一次的人口普查与5年一次的1%人口抽查调查、极少数城市的不定时专题调查以及公安部门对暂住人口的登记。统计部门的人口普查或专题调查虽然相对来说比较准确,但周期较长、成本极高、时效性差,难以反应流动人口的动态性特征。公安部门暂住人口登记数据虽然时效性较好,但因登记申报率不高[5]、登而不销现象严重[6]等问题,精度较差、可信度不高,并且目前只登记流入人口,而忽略了流出人口。另外,国内外学者对我国流动人口的迁移机理、分布特征和区域影响等方面已开展了广泛研究,虽已取得显著进展[7~12],但对我国流动人口区域类型的划分方法尚未达成共识,对其区域差异规律的认识有待进一步深化,尚没有将其应用于对流动人口的动态监测。
总体来看,目前我国对流动人口的监测主要基于单纯的统计抽样调查方法,没有考虑流动人口空间分布的区域差异性特征,不仅存在成本高、时效性或精度较差等问题,而且还无法识别与突出需重点监测的区域与问题。据此,本文在借鉴国内外经验基础上,尝试提出一种基于我国流动人口区域差异类型的快速监测方案,并设计针对不同流动人口类型区特征的监测指标体系,为构建和布局高效合理的流动人口监测网络提供科学依据,以便能在经费、人员有限的条件下更好地估算、把握区域或全国的流动人口总体数据与特征。
2 国内外现有流动人口监测方法评析
2.1 英美两国的流动人口监测体系
依托流动人口与社会保障结合的制度基础,美国与英国都建立起了长期详细调查与短期快速调查相结合的相对完善的流动人口监测体系。美国依靠社会保障号码(社会安全号码)制度,有5种调查方案[13]。其中,周期为10年的人口普查(DC)和每年的美国社区调查(ACS)是美国人口流动监测的主体。人口普查的调查指标详细但周期较长,而每年的美国社区调查主要为人口普查提供年度估计数据,更新快,但是监测指标相对较少,通过二者之间的校核与整合保证流动人口监测的全面性与动态性。英国没有直接的流动人口统计部门,通过病人登记数据系统(PRDS,年度数据,微观连续)和国家卫生服务中心登记(NHSCR,季度数据,核心档案)结合,由职业医生登记病人的迁移新址统计实现对流动人口的动态监测[14];国家卫生服务中心登记(NHSCR)包括所有登记病人的核心档案,数据更新快,每个季度公布,但是只能反映不同卫生区划之间的人口流动。而病人登记数据系统(PRDS)能够更微观和连续的刻画地区间的人口流动,但是其监测周期为一年,会遗漏掉很多短期流动人口,同时由于登记项较少,信息不够完善,与NHSCR数据结合使用则能相互弥补不足,使得人口流动监测更加准确和详细。
综观英美流动人口监测体系可以发现:(1)通过人口登记与社会保障结合,有效引导居民主动登记,确保数据的准确性和动态性。(2)社会保障服务登记地址的变动可快速反应人口的流动情况,实现流动人口的动态监控。(3)通过采用相对全面但周期较长的人口普查和快捷的短期调查相结合,可以实现短期人口快速监测与长期全面准确普查数据的相互校核与相互补充,有助于多源数据整合,形成较完整的流动人口监测体系。
2.2 我国现有的流动人口监测方法
我国现有对流动人口监测主要包括统计部门、公安部门、计划生育部门等部门对全国流动人口的普查或抽查性监测以及部分城市对流动人口的不定期专项调查[15~20],各种方法各具优劣点,总体上仍不完善。人口普查采用长短表形式进行入户普查,数据准确性高,但是十年一次的周期过长,时效性差,成本也非常高。公安部门的暂住人口登记只针对流入人口,因未与社会保障等居民的切身利益挂钩,流入人口并不能因此获得公共性服务,从而导致登记主动性不强,缺登误登率高,登而不销现象较为严重,导致数据的准确性、可信度较差。近年来,计划生育部门已开展对全员流动人口信息调查试点,在试点城市配备专门的调查员,对流入人口和流出人口每一季度进行调查监测,数据的时效性和准确性较好,但同时也面临如何高效合理地布局监测点、以便能在经费、人员有限的条件下更好地估算出区域或全国流动人口总体数据与特征。部分城市对流动人口的专题调查则根据调查目标而设定不同的调查项目,监测时间多为不定期调查,数据的可信度较高但可比性较差,并且成本费用较高,目前只有北京、上海等特大城市开展过。
表1和表2分别对我国目前四种主要的流动人口监测方法及其调查项目进行了比较,从中可以看出:(1)各种方法因监测目的、关注重点不同而对流动人口做出了各不相同的界定,我国目前仍缺乏获得广泛公认的流动人口定义与界定标准[15]。这四种调查方法对于流动人口的定义在年龄、外出时间、跨越行政边界、流动目的、户籍等五个方面存在较大出入,影响了数据的对比性。(2)各方法均采用单纯统计抽样调查方法,假定所有调查单位是同质的,均没有考虑流动人口分布的区域差异,导致监测重点不够突出,监测成本高、效率低。(3)各方法都只侧重对流人地的调查,对流出地缺乏关注;大多仅限于调查流动人口本身的规模与分布、人口属性及经济社会状态等,极少关注流动人口对流入地、特别是流出地所产生的经济社会与资源影响环境及区域差异。
3 我国流动人口区域差异及类型划分
3.1 总体特征
我国人口空间分布具有显著的区域差异。早在1935年人口地理学家胡焕庸即提出了著名的“胡焕庸线”,以爱辉(黑河)—腾冲直线为界,该线以东的中国东部土地面积约占全国的36%,却集中了全国人口的96%;该线以西的西部,面积占全国的64%,人口却仅占4%[21]。该线经1990年、2000年第四、五次人口普查数据验证目前仍然有效[22]。除自然环境条件的区域差异这个最主要的原因之处,我国现阶段人口流动的区域差异特征也有助于进一步强化“胡焕庸线”的持续有效性。
利用地理信息系统空间分析技术,对1990年、2000年人口普查数据和2005年人口抽样调查数据进行分析,发现我国流动人口的空间分布格局总体上具有以下特征:
(1)由经济相对欠发达的中、西部地区流向经济相对发达东部地区。在流入人口规模上,东部地区迁入人口由1990年的1577.4万增长至2000年的8146万和2005年的9000万以上,占全国总迁入人口的比重也相应地由1990年的48.4%提高至2000年的58.3%和2005年的60%以上。广东、北京、上海、江苏、浙江等一直都是流动人口最主要的迁入地和集聚区[22],而四川、河南、湖北、山西等中西部省份是则是流动人口最主要的迁出地区或来源地。
(2)由农村流向城镇,形成了以珠江三角洲、长江三角洲和京津冀都市圈等为代表的东部沿海流动人口集聚带。根据2000年人口普查资料,全国共有流动人口1.21亿人。其中,从城镇流出的3267万,占27.0%,从乡村流出8840万,占73.0%;流入城镇的9012万,占74.4%,流入乡村的3095万,占25.6%。我国新增城镇人口主要集中分布在广东、福建、浙江、上海、江苏、山东等东部沿海省区。在1982-1990年期间,全国共新增城镇人口8938万人,以上6省市共新增3308万人,占37%;而在1990-2000年期间,全国共新增城镇人口16970万人,以上6省市共新增7765万人,占45.8%,提高了近9个百分点,集聚程度进一步提高。
实际上,国内外现有相关研究大多支持我国人口由中西部向东部流动和由农村向城镇流动的总体特征[7~12,23,24],但对于我国流动人口区域类型的划分方法与分类方案则尚未取得共识,更未能将该知识应用于对流动人口的监测布局方案设计之中。
3.2 区域类型划分指标与方法
在国内外已发表的流动人口空间分布特征及区域类型研究成果中,常用的分析变量或划分指标多为单一性指标,主要以迁出率[11,23]、迁入率[11,23]、净迁移率[11,24]和总迁移率等比率类指标居多,即某空间单元的流动人口数量(流入人口、流出人口、净流动人口或总流动人口)占该区域总人口的比率,尤其以净迁移率和总迁移率这两个指标最为常用,其表达式分别为:
如表3所示,以净迁移率或总迁移率为代表的单一性指标划分方法,各具优势与劣势。净迁移率指标能清晰地辨识出净流入人口区(流入人口大于流出人口)和净流出人口区(流入人口小于流出人口),或进一步区分出主要与次要净流入人口区、主要与次要净流出人口区。不过,该指标不能测度区域流动人口的活跃程度,无法分辨出流入人口与流出人口均比较大的流动人口活跃区和流入人口与流出人口均比较小的流动人口非活跃区。与此相反,总迁移率能比较准确地测度区域流动人口的活跃程度,辨识出流动人口活跃区与非活跃区,但却无法分辨出区域流动人口的方向或性质,即属于净流入区还是净流出区。
总体来看,我国流动人口地域类型复杂多样,既有流入人口远大于流出人口的主要净流入区,如珠三角、长三角、京津冀等主要城市群地区,也有流出人口远大于流入人口的主要净流出区,如中西部人口密度较大的农村地区,还有流入人口和流出人口都较多的平衡型活跃区,如浙江、江苏的许多较发达的农村地区,更有大量的流入人口和流出人口都较小的非活跃区,如中西部的一些区位较偏、人口密度较低的农村地区。单一指标很难正确地分辨出流动人口的多样化地域类型,而同时采用净迁移率和总迁移率所构建的复合指标,可以取长补短,能同时清晰地测度出区域流动人口的流动方向与活跃程度。
通过构建以总迁移率(GM)为纵坐标、净迁移率(NM)为横坐标的二维空间,并根据国际经验将总迁移率10%作为区别流动人口活跃区与非活跃区的阈值,并以区县作为基本空间单元,即可以将我国划分为四种不同的流动人口区域类型:即净流入型活跃区、净流出型活跃区、平衡型活跃区和非活跃区等。
3.3 流动人口的区域类型及特征:以广东省为例
根据2000年全国第五次人口普查数据,广东省常住总人口为8523万人,户籍人口为7483万人,省外迁入人口为1506万人,属于省际净迁入人口最多的省市。不过,如果将空间单元细分至区县时,即可发现广东省流动人口分布也存在着显著省内区域差异和多样化的区域类型。本文以2000年全国第五次人口普查分区县数据为基础,以区县为基本空间单元,采用综合考虑净迁移率和总迁移率的复合指标划分法,来识别和划分广东省流动人口区域类型,验证该方法的有效性与可行性。
如图1所示,广东省流动人口区域类型的空间分布呈现出显著圈层结构,由珠三角核心区往外依次属于净迁入型活跃区、平衡型活跃区、净迁出型活跃区和非活跃区。
(1)由广州、深圳、珠海、佛山、中山、东莞、惠州、惠阳等市所构成的第一圈层是珠三角核心区,属于典型的净迁入型活跃区,实际上也是广东省流动人口的主要聚集区。流动人口大量迁入促进了当地经济的快速发展,但也给当地社会带来了一些问题,教育、医疗等公共设施供给压力增加,外来人口聚集区与“城中村”问题较严重。这些问题是当地政府的关注重点,也应成为该类型区流动人口监测的重点特征。
(2)由广州的郊区县市、惠州的郊区县市以及江门、汕尾、河源、清远、四会、肇庆、梅州、韶关的部分县区市所构成的第二圈层,属平衡型活跃区。该区受到核心圈层的辐射带动,既吸引了大量外来务工人员,也导致大量当地人口流向核心圈层,流出人口规模也比较大。因此,对该类型区流动人口的监测既要针对流入人口大量增加带来的社会经济影响,又要针对流出人口迁出带来的相应问题。
(3)由相对偏远的阳江、茂名、云浮、清远、河源、揭阳的部分县市所构成的第三圈层主,是典型的净迁出型活跃区。该区大部分位于丘陵山地区,受到内部圈层辐射,人口大量向第一和第二圈层流动,同时自身经济欠发达,吸引的外来人口相对较少。该类型区大量青壮年劳动力外出务工经商,虽然给当地带来大量汇款收入,但是也导致出现留守儿童和老人比重高、房屋空置和土地撂荒比重大等问题。因此应以流出人口及其对区域经济社会与资源环境的影响作为重点,需要相应的加强监测。
(4)由湛江、汕头和潮州的部分县市所构成的第四圈层,属于流动人口非活跃区。该区的流动人口规模与比重相对较少,对区域经济社会与资源环境的影响也相对较轻,不属于广东省流动人口监测重点。
以上案例分析表明,采用综合考虑净迁移率和总迁移率的复合指标,能够清晰地辨识和划分出广东省流动人口不同区域类型及需要监测的重点监测内容,是有效的和可行的。
图1 广东省流动人口地域类型划分图
Fig.1 Spatial patterns of regional types of Guangdong Province's floating population based on the composite index method
4 基于流动人口地域类型的快速监测方案及指标体系
借鉴英国、美国等西方发达国家流动人口监测经验,并结合我国流动人口空间的区域差异特征,本文提出如下基于流动人口地域差异类型的快速监测方案,依次由划分流动人口区域类型、制订监测样点网络布局方案、设计监测指标体系、估算流动人口规模与特征、数据校核及区域类型调整等五个步骤所组成(图2)。
该方法具有以下特点:(1)通过将长周期、高精度的普查数据与短长期的监测数据相结合,同时兼顾流动人口监测数据对高时效性和高精度的要求。(2)通过识别并划分流动人口的区域类型,并据此确定需监测的重点区域,改正监测样点网络布局方案,减少监测成本、提高监测绩效。(3)根据不同流动人口区域类型特征,设计有针对性的监测指标,突出监测重点、提高监测效率。
步骤一:分析流动人口的区域差异,划分区域类型。
根据目前最新的人口普查的分区域流动人口数据,采用综合考虑净迁移率和总迁移率的复合指标划分法,运用GIS空间分析技术,分析我国流动人口的区域差异特征,划分出净迁入型活跃区、净迁出型活跃区、平衡型活跃区和非活跃区等四种不同的流动人口区域类型,为确定流动人口监测样点网络布局方案提供科学依据。
步骤二:制订基于流动人口区域类型的监测样点网络布局方案。
根据对我国流动人口区域差异的认识,并应用地理数据分层抽样法,制订基于流动人口区域类型的监测样点网络布局方案,可以在确保监测精度的条件下,大幅度地减少监测样点、有效提高监测绩效。地理数据分层抽样能把异质性较强的总体分成一个个空间相关性较强同质性较好的地理单元子总体,能够增加层间方差降低层内方差,有效提高抽样精度[25]。现有地理数据空间分层抽样方法主要有基于行政区划和基于先验知识的分层,与行政区划相比,基于先验知识的分层能够保证层内的地理数据具有较大的相似性,因此同等投入下,其抽样精度优于基于行政区划的抽样,而且空间相关性强到一定程度后,空间相关性越强,基于先验知识的分层抽样表现越好[26,27]。在上一步骤中所划分出的净迁入型活跃区、净迁出型活跃区、平衡型活跃区和非活跃区等四种不同的流动人口区域类型中,由于非活跃区的流动人口的规模较小,在总人口所占比重较低,对区域经济社会与资源的影响较弱,不是关注的重点区域,可以适当减少监测样点的布局;其他三种类型区是流动人口的活跃区,属于监测的重点,需分类增加监测样点的布局密度。实际上,根据2000年第五次人口普查数据,我国约一半左右的区县属于流动人口非活跃区,不属于流动人口监测重点,可以适当减少监测样点的布局密度。
步骤三:设计针对不同类型区特征的监测指标体系。
不同区域的流动人口规模和特征存在一定的差异,流动人口对不同地区造成的巨大的社会经济影响也有显著不同[28,29],在迁出地,留守儿童与老人问题突出,房屋空置和耕地撂荒现象普遍[30];在迁入地,流动人口汇集增加公共设施供给压力,影响当地社会治安[31],因此不同区域流动人口的监测重点与指标体系应该有所区别。全国统一的、无区域差别的监测指标体系,既忽略了流动人口的区域差别与个性特征,又增加了许多无效工作,降低了工作效率。
本文建议采用由共性指标和不同类型区的个性指标所组成的流动人口监测指标体系,如表4所示。共性指标是所有类型区均需收集的监测指标,主要包括反映流动人口规模与流向的指标如净迁移率和总迁移率,反映流动基本的人口与社会学属性特征的指标,如年龄结构、性别结构、婚姻结构和教育结构等两大类。对于流动人口平衡型活跃区和非活跃区,仅采用共性指标即可;对于净迁入型活跃区和净迁出型活跃区,则需要补充监测其区域特性的个性指标。对于净迁入型活跃区,需补充反映流动人口的生存状况、与当地社区的社会融合程度、对当地公共设施与公共服务的压力与影响等方面的个性指标,以便快速评估流动人口对流入城市发展的影响。对于净迁出型活跃区,则需要补充人口迁出对当地人口与社会结构、资源与环境等方面的监测指标,及时监测人口流动对当地新农村建设可能造成的负面影响。
图2 基于区域差异类型的流动人口快速监测方案
Fig.2 The rapid monitoring framework based on the regional disparity types of floating population in China
步骤四:建立流动人口监测数据库,快速估算区域或全国流动人口的规模与特征。
在收集监测样点的系列监测数据、并结合监测区的人口普查数据、统计部门、公安部门、计生部分部门等多部门的相关人口统计数据,建立多源流动人口监测数据库。在此的基础上,运用数理统计学方法,根据监测样点的数据,快速估算区域或全国流动人口的规模与特征。本方案设计的抽样方法是等概率抽样方法(多阶抽样)与非等概率抽样方法(空间分层抽样)[32]相结合形成的复合型抽样。县级以下单元采用多阶抽样方法,按照等概率抽样推断得出抽样的各县流动人口目标变量(规模和特征),
步骤五:与最新人口普查数据进行校核,调整类型区划分及监测样点布局方案。
根据最新的人口普查数据,对快速监测数据进行校核,提升监测数据的质量。在此基础上,重新回到步骤一、二,对流动人口区域类型划分方案及监测样点网络布局方案进行局部调整,开始新一轮循环。
5 结论
(1)我国目前对流动人口的监测主要采用基于单纯的统计抽样调查方法,未能考虑流动人口空间分布的区域差异性特征,存在成本高、时效性差、精度较低,无法识别与区分重点监测区域等问题。综合考虑区域净迁移率和总迁移率的复合指标法,能有效识别出我国流动人口区域差异特征,并明确划分出净流入型活跃区、净流出型活跃区、平衡型活跃区和非活跃区等四种不同流动人口区域类型。
(2)本文通过应用流动人口区域差异的知识,尝试提出了一种基于我国流动人口区域差异类型的快速监测方案,有助于突出需监测的重点区域,大幅度地减少监测样点、有效地提高监测绩效。该方案依次由划分流动人口区域类型、制订监测样点网络布局方案、设计监测指标体系、估算流动人口规模与特征、和数据校核及区域类型调整等五个步骤所组成,将长周期、高精度的普查数据与短周期的监测数据结合,同时兼顾流动人口监测数据对高时效性和高精度的要求。
(3)不同区域流动人口的特征与影响存在较显著的差异,建议采用具有区域针对性的、由共性指标和个性指标所组成的监测指标体系。共性指标主要包括流动人口的规模与流向及其人口与社会学属性特征等指标。对于流动人口平衡型活跃区和非活跃区,仅采用个性指标即可。对于净流入型活跃区,还需补充反映流动人口的生存状况、与当地社区的社会融合程度、对当地公共设施与公共服务的压力与影响等方面的个性指标;对于净流出型活跃区,则需要补充人口迁出对当地人口与社会结构、资源与环境等方面的监测指标。