大数据视角下的武汉市人口格局探析
罗名海1,谭 波1,秦思娴1,肖 琨1,蔡明明2,张月朦2
(1.武汉市测绘研究院,湖北 武汉 430022;2.武汉大学,湖北 武汉 430079)
摘 要: 新兴大数据反映了人、物、信息在空间上的流动和聚集,体现了社会经济要素的动态分布和相互关系。结合自然资源部下达的2018年国家地理国情监测项目“武汉市大数据城市空间格局变化监测试点”,创新开展了“地理国情+大数据”融合研究,从城际人口流动和城市人口分布2个方面开展了武汉市人口空间格局识别,揭示了武汉市对外人口流动规模和方向,城市内部居住和就业人口分布的圈层差异、人地关系和跨江出行特征。
关键词: 手机信令;百度热力;城际人口流动;城市人口分布
传统人口领域研究中,数据源主要包括人口普查统计数据、人流量观测统计数据、交通调查数据、高分辨率遥感数据等,存在更新时效慢、空间粒度粗、获取成本高等特点。传统研究内容主要聚焦在人口的时空分布[1-3]、迁移模式[4]、演变机制[5]、影响因素[6]和模拟预测[7]等方面。随着新兴网络技术的发展,以腾讯位置、手机信令、百度热力等数据为代表的新兴大数据以其时效性高、空间粒度细、人力成本低等优势弥补了传统人口数据的缺陷,为多尺度、高精度的人口格局识别与分析提供了可靠的数据来源和崭新的技术思路。基于新兴大数据的人口研究侧重于对人口迁徙[8]、集聚区分布[9]、职住关系[10-11]、交通通勤行为[12-13]、消费行为[14]、活动模式[15]的识别,以及人口分布与产业、用地等相关要素之间的耦合关系研究[16]等方面。
本文以武汉市为例,利用腾讯位置大数据,从人口流入与流出、人口腹地范围等方面开展城际间人口流动分析。基于联通手机信令、百度热力数据,在交叉验证的基础上,识别城市居住与就业人口分布,进行了分圈层、分三镇、分区域的多尺度人口格局研究,并从人地关系视角分析了居住人口与城镇综合功能单元的关系以及跨江流动特征。
1 数据处理及研究方法
1.1 数据获取
本文获取的新兴大数据主要包括腾讯位置大数据、联通手机信令数据和百度热力数据。
腾讯位置数据基于腾讯地图定位,每5min更新一次,几乎覆盖全球范围内智能手机中 QQ、微信以及滴滴出行等多种应用的用户定位信息,能反映每日实时人口流动情况。本文通过聚合分析,获取了2018-02-01~2018-02-15(腊月十六—腊月三十)武汉与全国地级以上城市和省直辖行政单位间的每日人口出入总量数据。
联通手机信令数据源于智慧足迹大数据,主要涵盖中国联通2G/3G/4G用户的日常信令数据。经过智慧足迹SmartSteps(SS)联通手机信令大数据平台处理后得到分辨率为250 m的人口格网数据(包含居住、就业等类型),时点为2018年6月,其中居住人口判断规则为:①居住地观测时段为21:00到次日8:00;②用户每日在观测时间段内被观测到的秒数,进行月度累加,并进行排名,取排名最高的为用户的居住地;③一个月内工作日出现天数超过10 d。就业人口判断规则为:①就业地观测时段为9:00到17:00;②用户工作日在观测时间段内被观测到的秒数,进行月度累加,并进行排名,取排名最高的为用户的就业地;③年龄段在16~64岁;④一个月内工作日出现天数超过10 d,百度热力大数据,源于百度用户定位信息数据,是由百度大数据平台聚合所得的分辨率为250 m的人口格网数据(包含居住、就业等类型),时间为2018年6月。
1.2 数据预处理
由于联通手机信令和百度热力数据均具有样本有偏性,因此本文结合社区人口统计数据,对2套大数据开展交叉验证和可靠性分析。
将联通手机信令和百度热力的250 m格网数据聚合至社区单元,以社区人口统计数据为检验依据,分别进行k-s检验,结果如表1所示。2套大数据的双侧显著性均小于0.10,说明均不符合正太分布,因此采用Spearman相关系数检验大数据人口与真实社区人口的相关性和可靠性。如表2、3所示,2套数据检验所得Spearman相关系数分别为0.565和0.608,与真实社区人口的相关性都较为显著,说明联通手机信令和百度热力数据统计结果可信,可用于人口格局的识别研究。
表1 联通手机信令与百度人口单样本Kolmogorov-Smirnov检验
表2 联通手机信令数据Spearman相关系数
表3 百度热力数据Spearman相关系数
1.3 研究模型与方法
1.3.1 势力范围模型
在特定时段内,城市之间的人流从侧面表征了中心城市对边缘城市的影响能力,也体现了边缘城市对中心城市的依赖程度,一般采用势力范围模型识别中心城市的人口腹地范围。例如,春节前,中心城市的人口会向其人口腹地流出,而在春节后又会流回中心城市;在十一黄金周节假日前期,游客从居住城市涌向旅游目的地,而后又回到居住的城市。通常基于绝对流入指数、相对流入指数和竞争流入指数3个指标描述城市A和B之间的人口流动。
绝对流入指数,即特定时间内从城市A流入城市B的人口总量。
1.5 观察指标及评价标准 记录手术中出血量、手术时间、手术后下床活动时间、手术后排气时间、手术后住院时间、手术后12 h疼痛评分及住院费用。疼痛程度采用数字评分量表(NRS)评分,NRS评分范围为0~10分,0分为无痛;1~3分为有轻微疼痛,睡眠不受影响;4~6分为中度疼痛,睡眠受影响;7~10分为重度疼痛,严重影响睡眠。
相对流入指数,即特定时间内从城市A流入B的人口总量占流入城市B的人口总量比例。
在20世纪60年代末到80年代初,人工智能曾有过辉煌的发展时期。在各领域专家系统需求的驱动下,人工智能技术得到了蓬勃的发展。20世纪80年代初,人工智能的研究则出现了危机。因为专家系统只能在极有限和狭窄的专业领域中发挥作用,极大地限制了人工智能技术的进一步应用与发展。
式中,{Bi |i ∈[1,N ]∩N +}为除城市A以外其他城市构成的集合。
1.3.2 核密度
式中,{Bi |i ∈[1,M ]∩N +}为所有中心城市构成的集合。
《白皮书》显示,全国年轻家庭母婴用品月均花费达1294元,较2016年增长48%,高级别城市花费更多。但随着租房成本上升,局部母婴消费市场还是呈现出了明显的“消费降级”趋势。然而,绝大多数父母并不愿意在“食品”上动刀,而选择把减少开支的矛头指向“亲子游”“玩具”等非必需品。
当FCompetetiv(eA→ B)> 0. 6时,表示来自城市A的跨城出行过半前往城市B,说明城市A处于城市B的紧密影响区;当FCompetetiv(eA→ B)∈(0 .4, 0 .6]时,表示城市A处于城市B的次紧密影响区;当FCompetetiv(eA→ B)≤ 0. 4时,说明城市A处于城市B的边缘影响区。
竞争流入指数,即特定时间内从某一中心城市流入该城市的总量占来自其他重点城市流入该城市的总量比例。
依托双主体办学优势,与合作企业共同打造网络教学综合服务平台——智慧学习平台,为翻转课堂、创客教育、第二课堂等教学模式提供实践平台,提高学生自主学习能力和课堂教学效果。通过智慧学习平台,落实以学生为中心的个性化培养体系,根据学生的学习情况,对学生进行分层培养。同时,通过“学业周期大闭环迭代,学习过程小闭环推进”的全周期闭环反馈实施体系、学业动态预警机制、毕业生跟踪反馈机制和社会需求反馈机制,建立动态、开放、持续改进的质量保障体系,构建“以生为本”的教学生态环境。
核密度估计(KED)是研究城市热点常用的一种基于密度的空间点模式非参数估计方法,它是根据已有点要素估计未知点要素的密度函数。核密度值随离中心点距离的变化而变化,离中心点越近,密度值越大;离中心点越远密度越小;当距离等于带宽r 时密度为零。核密度的计算公式为:
2.2.1 圈层分布
1.3.3 热点分析(Getis-OrdG *)
㉗高晓霞:《日本审计院》,载审计署审计科研所编《世界主要国家和国际组织审计概况》,中国时代经济出版社2014年版,第291页。
根据春节前腾讯位置大数据,识别春节前夕离汉与来汉人口的出行规律,近似反映城际之间的人口流动状况。
XING Peng-fei, LI Zi-fu, LI Qiang, ZHAO Rui, FANG Yi-bin, ZHAO Kai-jun, DAI Dong-wei, YANG Peng-fei, ZHANG Yong-wei,LIU Jian-min
热点区域是由高值对象在局部空间内频繁聚集出现形成。冷热点分析常采用局部Getis-OrdG *指数法,用来检验局部区域是否存在统计显著的高值和低值,采用可视化的方法显示热点区域和冷点区域。热点分析的显著性Z得分计算公式为:
春节前夕来武汉市的人口主要来自北京、深圳、广东、上海等一线城市(如图2所示),总占比达四成,4个城市的占比分别约为13%、11%、9%、6%。
式中,E ( )和Var ( )分别是 的数学期望和方差;Wij 是空间权重;若Z ( )为正,且数值高,表明i 周围的值较高,属于空间集聚区域,即为热点区域;反之,若Z ( )为负,表明i 周围的值比较低,属于低空间集聚区域,即为冷点区域。Z ( )得分越高,热点的集聚就越紧密;Z ( )得分越低,冷点的聚类就越紧密。
2 研究成果
2.1 城际人口流动
宋廷宇等[16]采用根尖压片法对薹菜进行了染色体核型分析。薹菜又称芸薹菜、油菜薹,是十字花科芸薹属芸薹种白菜亚种的一个变种。薹菜原产于中国,为黄河流域和淮河流域的地方特产蔬菜之一,尤以山东、江苏等地种植较多。试验结果表明,薹菜为二倍体,染色体数 2n=20,核型公式为 K(2n)=2x=20=7m+2t+st,染色体组型为 2A 型。这一结果充分反映了薹菜与菜薹在细胞学水平上的差异,说明薹菜的进化程度明显低于菜薹。吴春红等[17]利用rDNA及C0t-1 DNA的荧光原位杂交技术,结合C0t-1DNA与25SrDNA荧光原位杂交和传统的染色体形态学标记方法,构建了一个早熟白菜苔的精确核型。
3.4 人文关怀有利护生心理发展及职业发展 在带教注重护生职业道德教育、巩固专业技能。临床教学中加强各类临床环境的适应方法、角色转换的心路历程、自我防护技能等学生会遇到的实际问题的教学,教会护生独立思考、独立处事,有利于护生的心理正常发展。对于护生的学习与工作应给予一定的肯定并作出正确的指导,以此方法增强她们的自信心,有针对性、目的性、启发性地引导她们愉快地进行临床护理实习工作,同时更加体会到护理专业的重要性,更热爱护理专业,提升护生的职业认同感。
从全国层面看,春节前夕离开武汉市的人口主要前往湖北、四川、重庆、云南和辽宁,如图1所示。其中,前往长江经济带区域的占比近72%,前往湖北省内其他城市的占比约为58%。从省内来看,接近2/3去往“1+8”城市圈内其他城市,前往孝感、黄冈两市的占比近20%。
图1 2018年春节前夕离汉人口分布及排名前20位城市统计图
对 (d )进行标准化处理得:
图2 2018年春节前夕来汉人口分布及统计图
根据春节前夕的人口出行数据和势力范围模型推算武汉对湖北省内城市的人口吸引程度。从腹地范围看,武汉市人口腹地主要为湖北省内,与鄂、孝、黄、黄联系紧密,略向河南信阳、驻马店延伸,如图3所示。从省内来看,“1+8”城市圈及荆门流出到重点城市的人口有40%以上流入武汉,其中鄂州流出人口有70%流入武汉;恩施、宜昌流出重点城市的人口中只有不到30%来到武汉,受重庆吸引较强。
2.2 城市人口分布
利用2018年6月联通手机信令和百度热力等大数据,识别了居住和就业人口,重新认知了城市内部人口的分布格局。
⑦孙启祥:《陆游打虎诗辨析》,陶喻之:《陆游刺虎公案》,刊《文史知识》2005年第11期“纪念陆游诞辰880周年专号”。
式中,oi 表示研究点i 的核密度;Kj 为研究点j 的权重值;dij 为空间点i 与研究对象j 的距离;r 为带宽;n 为带宽r 范围内研究对象j 的个数;在带宽r 范围内,研究点j 的权重值jK 相同。
从环线分布看,全市居住和就业人口密度沿环线从中心向外逐级递减(如图4所示),但二环至三环内居住与就业总人口占比最高(如图5所示)。后湖、四新、杨春湖、南湖、白沙洲等区域逐步形成居住新组团,位于近郊的东湖高新区、经济开发区等已形成就业次中心。
图3 2018年武汉市人口腹地分布图
图4 武汉市居住和就业人口密度分布图
图5 武汉市各环线居住和就业人口密度与占比统计图
2.2.2 热点区域分析
基于核密度法和热点分析法开展了居住和就业人口的热点区域识别。
从区域分布看,中心城区中,江汉区的居住、就业人口密度处于全市最高水平;硚口区、武昌区次之,且与江汉区差异较小;青山区居住、就业人口密度相对较低。功能区和新城区中,东湖高新区和东西湖区由于临近中心城区、交通较为发达,居住、就业人口密度远高于同圈层内其他区域。
从街道分布看,居住人口密度在50 000人/km2以上的街道有11个;就业人口密度在30 000人/km2以上的街道有9个,均集中分布于江汉区、江岸区和硚口区。
从热点区域分布看,如图6所示,①居住人口:江汉区、硚口区、武昌区拥有大量居住人口显著聚集区域,占各区面积的50%~80%;江岸区、洪山区和汉阳区的居住人口集聚现象也较为显著,比例大于各区总面积的10%。②就业人口:江汉区就业人口显著集聚区面积占比最高,超过85%;其次是硚口区、武昌区,占比均超过五成;东湖高新区就业人口集聚现象也较为显著,但集中在三环以内。③居住与就业人口:江汉区、硚口区、武昌区的居住与就业人口热点区域面积比总和超过100%,具有居住用地与就业用地功能交叉的特征。
图6 武汉市各街道居住和就业人口密度三维分布图
2.2.3 人地关系分析
如图7所示,从“人地关系”视角看,全市居住小区只承载了约60%的居住人口,其次以大型机关、高等院校为主的单位院落承载了超30%的居住人口,还有部分居住人口分布于其他功能单元。
图7 武汉市不同城镇综合功能单元上居住人口热点集聚地分布与统计图
2.2.4 三镇分布及跨江流动分析
从三镇分布看,武昌、汉口、汉阳三镇居住人口占比分别约为26%、20%和8%;东湖高新区占比超10%;经济开发区(汉南区)占比超4%。武昌、汉口、汉阳三镇就业人口占比分别约为26%、22%和7%;东湖高新区占比超12%;经济开发区(汉南区)占比近5%。其中,东湖高新区居住和就业人口占比均超过10%,远远高于常住人口统计结果,人口聚集程度和经济活力凸显。
由于武汉两江三镇的特殊地理形态,跨江出行是居民生活中不可或缺的一个出行特征。如图8所示,从三镇跨江流动看,武昌-汉口、汉口-汉阳、汉阳-武昌日均双向累计出行人次比例约为6∶3∶2,武昌和汉口联系紧密,出行人次占总跨江出行人次的50%以上。
由式(4)、(5)和(6)可知,与H+存在加质子反应,同时和HCO3-均可以与Mg2+形成配合物。当pH为5~7时,由于以上反应的存在,游离减少,同时由于游离趋近于0(当pH为5~7时,[Mg2+]值较高,如图2所示)。当pH为7~14时,由于加质子作用逐渐减弱,且少量Mg2+与Ida2-形成配合物,导致一定量的游离被释放出来,升高,当pH>11时,加质子作用基本消失,变化平缓。值得注意的是,当[Ida2-]T为0~0.5 mol·L-1且pH>12.5时,略微有所增加。这是由于体系中[Mg2+]含量降低(如图2所示),而受制于Ksp造成的。
近日,水利部党组书记、部长陈雷主持召开部党组扩大会议,传达学习十八届中央纪委三次全会特别是习近平总书记重要讲话、王岐山同志工作报告精神,研究部署水利系统党风廉政建设和反腐败工作。陈雷强调,要按照十八届中央纪委三次全会的要求部署,着力抓好以下工作。一要把深入学习习近平总书记重要讲话精神作为重要政治任务;二要全面加强党的纪律建设;三要着力抓好惩治和预防腐败体系建设;四要进一步加强和改进作风;五要强化党风廉政建设责任制落实;六要加强领导干部廉洁自律。部领导矫勇、董力、胡四一、刘宁、李国英、蔡其华、周学文,总工程师汪洪出席会议。
图8 武汉三镇居民跨江出行比例图
3 结 语
本文基于腾讯位置大数据、联通手机信令和百度热力数据,识别了武汉市对外人口流动规模和方向。结果表明,春节前夕离开武汉市的人口近六成去往湖北省内,来武汉市的人口近四成来源于北上广深等一线城市。重新认知了武汉市居住和就业人口格局及职住通勤关系,发现武昌居住和就业人口均超过汉口,武昌-汉口跨江出行人次超过50%,东湖高新区的居住和就业人口占比均超过常住人口统计数据,人口集聚活力凸显。
本研究验证和解释了武汉市人口分布和流动特征,但由于大数据时间和空间粒度的局限性,还缺乏对城际之间、城市内部人口流动轨迹、出行目的、交通方式等的深入研究。下一步将深入挖掘大数据的过程轨迹和标签特征,深度刻画城际之间、城市内部人口分布和流动的时空动态特征,并加强交叉验证,克服大数据的有偏性。通过“地理国情+大数据”融合研究,推动地理国情监测从土地利用扩展到社会经济活动、从静态专业工作走向动态大众生活、从对地观测走向对人观测。
参考文献
[1]柏中强,王卷乐,杨雅萍,等.基于乡镇尺度的中国25省区人口分布特征及影响因素[J].地理学报, 2015,70(8):1 229-1 242
[2]胡曾曾,赵志龙,张贵祥.非首都功能疏解背景下北京市人口空间分布形态模拟[J].地球信息科学学报, 2018,20(2):205-216
[3]赵利利, 孟芬, 马才学. 基于多源遥感数据的武汉市人口空间分布格局演化[J]. 地域研究与开发, 2016,35(3):165-169
[4]李扬,刘慧,汤青. 1985~2010年中国省际人口迁移时空格局特征. 地理研究, 2015,34(6):1 135-1 148
[5]牟宇峰.长三角核心区就业人口格局演变研究[J].地理与地理信息科学, 2014,30(1):70-75
[6]田燕, 余东航, 孙小虎. 武汉轨道交通对城市空间形态与人口密度变化的影响研究[J]. 城市建筑, 2017(14):17-20
[7]林文棋,陈会宴,谢盼,等.基于多源数据的北京市朝阳区人口时空格局评估与预测[J].地球信息科学学报, 2018,20(10):1 467-1 477
[8]李原.贝叶斯层次时空模型在省际人口流入分析中的应用[J].统计与决策, 2018(6):73-77
[9]Deville P, Linard C, Martin S, et al. Dynamic Population Mapping Using Mobile Phone Data[J]. Proceedings of the National Academy of Sciences,2014,111(45):15 888-15 893
[10]钮心毅,丁亮.利用手机数据分析上海市域的职住空间关系——若干结论和讨论[J].上海城市规划, 2015(2):39-43
[11]张天然.基于手机信令数据的上海市域职住空间分析[J].城市交通, 2016,14(1):15-23
[12]丁亮, 钮心毅, 宋小冬. 利用手机数据识别上海中心城的通勤区[J].城市规划, 2015,39(9): 100-106
[13]张维. 基于手机定位数据的城市居民出行特征提取方法研究[D].南京:东南大学, 2015
[14]钟炜菁,王德,谢栋灿,等.上海市人口分布与空间活动的动态特征研究——基于手机信令数据的探索[J].地理研究,2017,36(5):972-984
[15]曹劲舟,涂伟,李清泉,等.基于大规模手机定位数据的群体活动时空特征分析[J].地球信息科学学报, 2017,19(4):467-474
[16]刘鹏程. 基于“人、地、业”视角下的城市空间簇群特征及耦合研究[D]. 南京:东南大学, 2016
中图分类号: P208
文献标志码: B
文章编号: 1672-4623(2019)10-0001-06
doi: 10.3969/j.issn.1672-4623.2019.10.001
收稿日期: 2019-06-06。
项目来源: 自然资源部地球观测与时空信息科学重点实验室经费资助项目(201903)。
第一作者简介: 罗名海,博士,正高职高级工程师,主要从事地理国情监测与大数据研究工作。