甘肃省人口流动空间格局和影响因素的ESDA分析,本文主要内容关键词为:甘肃省论文,格局论文,人口论文,因素论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
人口流动是指就业、生活或学习所在地与其户籍所在地处于分离状态的人口在不同区域间的流动。大规模的人口流动是特定时期中国人口分布的重要特征,也是未来影响城市化、工业化与现代化、重塑区域发展格局的重要因素之一[1]。已有研究结果显示:改革开放以来的人口迁移可以简单概括为以经济发展相对落后的农村地区人口迁向经济比较发达的城市地区为主;人口流动的主要地域指向与主要流入地的经济发展水平有着高度相关性[2],人口迁移流动有利于促进区域经济的协调发展[3];也有学者认为人口迁移对经济发展起到了极化效应,在某种程度上加大了区域经济发展之间的差距[4]。因此总结人口流动的主要指向与主要流人地的经济发展总量水平、结构水平、投入水平之间的相关性,研究并提供一定程度的量化认识对科学预知和合理规划未来的人口流动格局、区域经济发展格局、调整产业结构、促进良性城乡互动关系,进而统筹协调人口流动规模和指向地与流入地经济的健康发展、降低现代化成本起着非常重要的作用。传统的人口流动差异度量方法大都是从单一时间或空间尺度研究流动人口地域分布及其与经济发展的关系,因其缺乏空间视角,难以真正反映区域空间差异的变化与机制。空间的影响,尤其是空间自相关和空间异质性必须在研究不同尺度的区域差异问题时加以考虑。以往研究往往假设空间实体之间是相互独立的,而忽视了其扩散或极化效应对区域差异的影响,且研究多集中在全国尺度,很少涉及西部欠发达省份。同时,迄今研究多是从区域的经济总量水平出发来考察人口迁移流动与区域经济发展之间的关系,但事实上,人口流动分布与区域的产业结构和固定资产投资等之间也存在着相互关系[5]。以空间关联测度为核心的ESDA方法,通过定义空间权重矩阵,较好地解决了区域之间的空间关系问题,为人口流动区域差异的定量分析提供了有力支撑。笔者以甘肃省为例,运用空间自相关指数Moran's I分析了2004~2007年的人口流动空间分布特征;同时通过对传统的计量模型加入空间项构建了空间滞后模型和空间误差模型,定量检验各因素对人口流动的影响。
一、ESDA研究方法
(一)空间数据探索分析
ESDA(Exploratory Spatial Data Analysis,即探索性空间数据分析)是一系列空间数据分析方法和技术的集合,以空间关联测度为核心,通过对事物或现象空间分布格局的描述与可视化,发现空间集聚和空间异常,揭示研究对象之间的空间相互作用机制。ESDA是基于数据驱动的,注重发现空间数据的分布模式,揭示数据的空间依赖性与空间异质性的可视现象。
(二)空间自相关分析
空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标,正相关表明某单元的属性值变化与其相邻空间单元具有相同变化趋势,负相关则相反。最常用的指数是Moran's I(莫然指数),计算公式为[6]:
(三)莫然散点图
散点图用来描述横轴对应变量x的所有观测值,纵轴对应空间滞后向量()的所有取值。每个区域观测值的空间滞后就是该区域周围邻居观测值的加权平均,具体通过标准化的空间权重矩阵来加以定义。Moran散点图划分为四个象限,分别对应四种不同的区域经济空间差异类型:右上象限(HH)表示区域自身和周边地区均为高值,二者的空间差异程度较小;左上象限(HL)表示区域自身为高值,周边地区较低,二者的空间差异程度较大;左下象限(LL)表示区域自身和周边地区均为低值,二者的空间差异程度较小;右下象限(LH)表示区域自身为高值,周边地区较低,二者的空间差异程度较大。
(四)空间回归模型
空间回归模型用以检验区域空间相互作用的空间效应,空间误差模型[7]为:
其中ρ为空间自回归参数,ε为矢量形式的空间误差项,其他变量与公式(2)一致。
二、人口流动的空间自相关分析
(一)研究区域与数据来源
本文的分析变量为各地区净人口流动率(即每年的流入人口与流出人口之差与该地区的总人口的比值)。人口数据来自于甘肃省人口与计划生育网(http://www.gsjsw.gov.cn/),社会经济数据资料取自《甘肃年鉴2007》,空间分析尺度为甘肃省14个市(州),市(地)域行政边界数据取自国家基础地理信息中心1∶400万数据库;采用的软件为空间统计分析软件Geo DA和地理信息系统软件ArcViewGIS。
(二)计算结果与分析
利用Moran指数模型,可以定量检验甘肃省各市州人口流动的空间相关性。将各市州的净人口流动率代入公式(1),得到2004~2007年的I值分别为0.2073、0.1016、0.1013、0.1645,显著性统计检验值p=0.001,说明甘肃省净人口流动率分布存在很显著的空间依赖,具有地理上的集聚特征,即净人口流动率高的地区其周边区域流动率也较高,反之亦然。从总体上看,Moran' I值呈现出先减小的趋势,2007年有所回升。I值的减小表明区域差异有缩小的趋势。Moran's I指数从整体上反映了甘肃省地区间人口流动存在的空间自相关情况,但不能详细反映地区内部空间集聚的状况,也不能反映具体地区所处的情况。为了弄清这些情况,可以绘制Moran散点图(见图1)。图1中点拟合曲线的斜率在数值上等于Moran' I值,距离趋势线的点若较远,则相关关系微弱;若散点分布距离趋势线较近,且分布较集中,则趋同趋势显著。同时坐标系把以点表征的区域划分为四种不同的类型。图1显示:2004~2007年,甘肃省14个地州市人口流动趋同趋势明显。从整体上看,4年间过半数的地区都分布于HH和LL象限,这就证明了地区与其邻居之间净人口流动率存在着正的空间相关性,即净人口流动率高的地区在地理空间上倾向于集中在一起,低净人口流动率区域趋势亦然。
以2007年为例,把Moran散点图所划分的四种类型地区反映到地图上(见图2),可以更加直观、清晰地了解具体的净人口流动率空间自相关性在地理空间上的表现形式。
图1 甘肃省净人口流动率Moran散点图
图2 2007年甘肃省净人口流动率自相关集聚图
从图2可以看出:2007年出生性别比H-H地区和L-L地区占据甘肃省的大部分市州,其中嘉峪关和酒泉市属于H-H地区,定西、庆阳、平凉、天水、陇南市和临夏州属于L-L地区,就净人口流动率的高低变化而言,总体上呈现出西高东低、北高南低的格局,H-H地区是省内经济发展水平较高的区域,而L-L地区则全部是欠发达区域;L-H和H-L地区离散分布在陇中和河西,其中金昌、兰州、白银市和甘南州属于H-L地区,而张掖和武威市属于L-H地区。甘肃省人口流动的这种空间分布更加证明:净人口流动率比较高的市级行政区相对地趋于和净人口流动率比较高的市级行政区相邻,而净人口流动率比较低的市级行政区相对地趋于和净人口流动率比较低的市级行政区相邻。由于甘肃省净人口流动率分布整体上存在较强的空间正相关性即空间依赖性,故在进行有关因素对人口流动的计量影响分析时,地区净人口流动率数据之间在空间上相互独立的假定被拒绝了,在处理这些带有空间特性的数据时必须考虑其空间自相关性所带来的影响(如OLS估计的偏误)。
三、人口流动的空间计量分析
(一)模型构建
空间回归模型建立在研究区域单元之间空间相关的基础上,抛弃了传统模型中把空间数据看成孤立的、随机的处理方法,转而探索研究单元之间的相互关系。新的理论框架以近邻效应、模仿和同组效应等形式,研究个体之间“直接”的空间相互作用以及个体之间的相互作用是如何导致集体行为和聚集模式的。分别利用经典收敛模型、空间误差模型和空间滞后模型,对甘肃省人口流动的影响因素进行空间回归,其中传统收敛模型利用最小二乘法进行参数估计,空间误差模型和空间滞后模型利用最大似然法进行参数估计。
人口流动是一个复杂的过程,受多因素综合作用影响,包括经济因素、社会因素、环境因素、政治因素等。由于社会科学研究中的变量很难精确测量或者根本无法测量,经常采用替代变量或标识作为近似。同时,指标的选取一方面要基于已有的理论假设,另一方面也要顾及到数据的可获取性。笔者在参阅前人研究的基础上,结合甘肃省实际,从以下几个方面考虑:
1.经济水平:选择各地区的人均GDP数据来表征不同年份的区域经济发展水平。经济基础决定上层建筑,经济发展的城乡差距是吸引人口流动的重要动因。
2.收入差别:选择城镇居民人均可支配收入与农民人均纯收入的比值来表征城乡收入的差别。在市场经济条件下,经济越发达的地区就业水平就会越高,这样收入差别与就业水平就构成了流动人口发生流动的根本原因。
3.资本投入:选择人均固定资产投资额来表征资本投入程度。资本投入可为地区经济发展注入强大的动力,同时还创造了大量的就业机会,从而吸引大量的劳动适龄人口流入。
4.经济结构:选择第二产业和第三产业占地区生产总值的比重来表征经济结构对人口流动的影响。从流动人口职业分布看,以制造业、建筑业、服务业、商业和个体经营者为主[8],故产业结构也是影响人口流动的重要因素。
5.医疗条件:选择每千人医生数来表征。
将上述指标引入条件趋同模型中,构建传统计量模型如下:
式中PM为地区净人口流动率,PerGDP为对数人均GDP,Inc为人均固定资产投资额,Str为二三产业比重,Med为每千人医生数,μ为随机误差项,a、b、c、d、e、f为待估系数。
构建空间滞后模型为:
式中ρ为空间自回归参数,W为相应的空间权重矩阵。
构建空间误差模型为:
式中λ是一个表示回归残差之间空间相关强度的参数。
(二)结果分析
由于人口流动在地理分布上存在较强的正空间相关,因此计量经济学中经典的最小二乘法要求的数据独立性假设被拒绝,其估计的结果是有偏误的。表1列出了OLS、空间滞后(SL)和空间误差(SE)模型的估计结果;表1中LIK(Log-likelihood)为最大似然函数的值,LIK越高说明拟合效果越好;赤池信息准则AIC(Akaike info criterion)、施瓦茨准则SC(Schwarz criterion)值越低,说明拟合效果越好,这三个值构成了对模型拟合效果进行检验的指标体系。由表1可以看出:传统最小二乘法估计模型得到的残差Moran's I=-0.6967,说明其残差存在很强的空间相关性,使用OLS法估计模型是不合适的。空间误差模型的LIK值较之传统误差模型OLS和空间滞后(SL)模型都要大,而AIC值和SC值比OLS和空间滞后(SL)模型的都要小。因此,选用空间误差模型拟合更准确一些,及值也恰好印证了这样的观点,因为空间误差模型的
值较之OLS和空间滞后模型的
值均有所提高。
另一方面,在考虑空间因素后,经济水平和收入差别对人口流动的影响下降了,而资本投入、经济结构和医疗条件对人口流动的影响增大了,其中经济结构的影响作用最显著,这说明在人口流动的影响因素中,地理因素不容忽视,其对人口流动率有显著影响;医疗条件对人口流动直接影响较小,它可能会通过空间因素(如地理上的邻近)、经济因素等间接影响地区的人口流动。进一步分析空间误差模型的结果可知:本文所选取的反映某地经济发展水平、资本投入、经济结构、收入差别、医疗条件等指标对人口净流动率的影响系数均为正数,这就说明经济水平越高,医疗卫生条件越完善,投资规模越大,二三产值比重越高,收入差距越大,地区人口净流动率则越高。
表1 OLS、空间滞后(SL)模型和空间误差(SE)模型估计结果表
四、结论与讨论
本文借助地理信息系统,运用ESDA技术,通过对甘肃省人口流动的空间统计分析和建立因素影响分析的计量模型,从空间计量学的角度审视了经济发展、投资、城乡差异、经济结构和医疗条件等因素对人口流动的影响,同时给出了新的证据,不仅传统的社会经济制度因素会影响人口流动的变化,而且空间地理因素也可显著地影响人口流动。相比传统的计量模型而言,本文采用的空间计量模型更适应区域数据特征,因而实证结果也更为准确可信。主要结论有:
(1)人口流动在地理上存在集聚现象,呈现出西高东低、北高南低的格局。
(2)空间地理因素对人口流动有显著的影响,空间误差模型的回归拟合度和准确性最高。
(3)经济结构对人口流动的影响作用最显著,医疗条件对人口流动直接影响较小。
(4)某地的经济水平越高,医疗卫生条件越完善,投资规模越大,二三产值比重越高,收入差距越大,则该地区人口净流动率就越高。
在社会转型和流动人口不断增加的时期,各地区应根据本区流动人口的空间分布、结构特征,结合区域中长期发展战略,制定科学合理的规划与实施方案,使人口流动的方向、空间分布与区域发展要求相吻合,使人口流动成为促进区域和谐与持续发展的有利因素。鉴此,仍存在许多亟待完善的地方,如限于数据的可获取程度,只对近四年间的人口流动数据进行了分析,而更长尺度上的规律如何尚需进一步研究。同时,本文采用地级单元作为研究的空间尺度,如果采用更小的县级作为基本单元,其研究结果将有何变化很值得进一步探讨,亦即尺度变化效应。