基于数据挖掘算法的流动人口定居意愿研究
郭长帅 卓建伟
(上海交通大学 安泰经济与管理学院, 上海 200030)
[摘要] 通过评估5种数据挖掘、机器学习算法,选出评估效果最好的算法模型,对流动人口的定居意愿进行研究和分析。研究发现,定居意愿更多的受到工作收入与生活成本的约束。低学历者在流入地定居为工作机会导向,高学历者定居为收入导向。
[关键词] 流动人口;定居意愿;数据挖掘
一、 背 景
近年来中国经济增速逐渐放缓,根据国家统计局的统计,GDP同比增速从2007年14.2%的高点逐渐降低至2018年的6.6%。关于中国经济增速放缓的原因,学术界亦有所争论。其中的一个重要观点即是资源的空间错配导致了中国经济增长速度的下滑[1]。根据索洛模型中的生产函数,对于特定的经济体,长期经济增长的动力来自于技术进步、劳动力的增长以及资本的增长。若将中国不同的区域视为不同的经济体,则人口在不同区域间的流动将导致劳动力资源的变化,其本质是劳动力在空间上的重新分配。从微观个体角度,人口流动是为了获得更好的发展机会或取得更高的劳动报酬。这个过程也将改进劳动力资源配置的效率。然而由于中国的特定历史遗留问题、复杂的人口管理政策以及各种行政力量的存在,人口流动并不是处于完全的自由状态,由此导致了经济资源的空间分布和人口的空间分布存在扭曲。横向来看,在世界范围内,经济发展或增长方式的转变,往往带动人口流动特点的转变。以美国为例,根据美国人口调查局的统计,铁锈地带* 主要由美国中西部和五大湖地区等工业衰退的地方组成,包括纽约州西部、宾夕法尼亚州、西弗吉尼亚州、俄亥俄州、印第安纳州、密歇根州下半岛、伊利诺伊州北部、爱荷华州东部和威斯康星州东南部。 1850—1970年人口从1 023万快速增至7 203万,人口增量贡献达34%,成为人口聚集的核心。20世纪1970年代开始,伴随着传统制造业的衰落,以及先进制造和现代服务业的崛起,铁锈地带人口增幅逐渐下降,加利福尼亚州、德克萨斯州、佛罗里达州等地区成为新的人口聚集中心。1970—2017年,上述三个州人口增量贡献高达41.7%。纵向来看,根据国家统计局的统计,1978—2010年中国城市化率从17.9%快速提升至49.9%,数亿人从乡村进入城市。大量人口从中西部向珠三角、长三角以及京津流动。在此背景下,对人口流动的研究是当前经济学研究的热点问题。
按照是否在流入地定居,流动人口可以分为两种,一种是定居于流入地,另一种是在经济相对发达的地区获取较好的就业机会或较高的收入,但不在流入地定居,而是往返于流出地与流入地之间。流动人口的迁移或定居具有以下特点:第一,根据《2015年全国流动人口动态监测调查》,被调查流动人口中84%是农业户口,农村人口在城市定居是城镇化的进程,因此定居意愿的情况是进一步认识城镇化进程的一个窗口[2]。第二,人口迁移定居关系到房产政策调控、学籍改革、高铁网络建设、医保异地结算等国计民生的大问题,分析定居意愿的影响因素有利于给上述问题的政策制定提供有效指导。第三,分析定居意愿有助于理解人口迁移定居的过程中涉及到社会融入、文化认同甚至地域歧视、语言歧视以及其他社会矛盾等社会敏感问题。因此,明白影响流动人口定居意愿的因素,对于理解劳动力资源的空间配置,进而理解中国当前经济效率问题提供了提供了良好的视角。
二、 关于流动人口的定居意愿的 文献综述与研究假设
当前已有的关于流动人口定居意愿的研究,对其影响因素做出了较为广泛的研究。关于个人及家庭因素因素对于流动人口定居意愿的影响,王玉君[3]认为,受教育时间越长、未婚以及配偶或恋人在同一个城市的农民工,有更加强烈的意愿在城市定居。王伟等[4]用交互分类比较以及Logistic回归模型,分析了三四线城市新生代农民工定居意愿的影响因素及机制,其模型计算结果表明青壮年、已婚的新生代农民工定居意愿较强。Fokkema和Haas[5]研究了西班牙的摩洛哥和塞内加尔移民,以及意大利的埃及和加纳移民,其结果发现移民之前受过良好教育、了解当地情况的年轻移民展现出更强烈的定居意愿和更高水平的社会融合。关于社会因素对于流动人口定居意愿的影响,李振刚[6]对新生代农民工居留意愿的影响因素进行了实证研究,结果表明社会文化融合对居留意愿有较为显著的影响;且流动的距离也对新生代农民是否愿意定居于流入地有显著影响。刘于琪等[7]对广州、东莞、沈阳、成都、杭州、郑州6城市新移民进行了问卷调查,以研究中国城市新移民的定居意愿,其研究表明影响新移民是否愿意定居于流入地主要因素包括户籍因素、社会网络、社会认同、城市生活评价和地理因素。卜庆国[8]通过调查问卷和实地访谈的形式对郑州市新生代农民工进行调研并运用随机森林模型,分析了影响郑州市新生代农民工留城意愿的特征和因素结果表明在城市居住的时间长短能够显著的影响流动人口的定居意愿。关于经济因素对于流动人口定居意愿的影响,郭云贵等[9]分析了2013年全国流动人口动态监测数据并得出结论:流动人口定居于流入地意愿普遍不高且内部差异大;其决定受到职业类别、行业、就业、工作年限、个人收入、家庭收入、劳动合同类型等因素的影响。Newbold[10]通过对1981年加拿大人口普查微观数据的研究发现,省际的人口流动对于省和省之间的经济形势和就业机会比较敏感。
也有一些研究将流动人口的定居意愿与特定的政策或区域经济背景相结合,侯慧丽[11]通过研究北京市流动人口定居意愿发现,北京市产业疏解的政策与流动人口定居意愿存在背离。被疏解的产业其流动人口在主观上更加倾向于留在北京,这对北京市的产业疏解实施造成了障碍。蔡翼飞和张车伟[12]的研究表明,经济发展过程中,人口与产业的不匹配呈现出先升后降的趋势。
萧飞羽环视沉思的众人,脸上看不出一丁点凶吉的预兆,寻不出一丝可以意味的痕迹,他是那般深沉,那般宁静,又那般不可捉摸,就像海,无边无际;像云,飘浮无寄;更像雾,迷惘而幽静。
现有文献对于定居意愿的研究范围在不断拓展,研究深度也在不断深入,它们对本文的研究提供了有益的参考,但是在以下几点存在可以改进的地方,第一,研究的数据来源局限于单一的数据库,这样研究的因素较为局限,难以形成完整的体系;第二,研究的方法有待丰富,已有的文献大部分采用Logit模型对流动人口定居意愿进行回归分析,随着机器学习、数据挖掘的不断发展,一些前沿的集成算法可以被应用于该领域,以充分利用数据提高模型精度;第三,现有文献较少对不同受教育程度的流动人口进行研究,不同低受教育程度的人口流动至流入地的目的可能是迥异的[13],各城市针对不同学历的外来人口制定的落户门槛也是不同的,因而不同受教育程度的流动人口有着较强的异质性,显然将它们区分开来研究更有意义。
本文试图在以下三个方面有所贡献,第一,研究数据上,本文综合了2015年全国流动人口动态监测数据、《中国城市统计年鉴(2015)》、《中国社会统计年鉴(2015)》三个数据库来构建个人和城市层面的影响因素,务求在本文的一系列假设基础上涵盖所考虑的全部因素;第二,量化分析方法上,本文在传统的逻辑回归模型基础上,使用了决策树模型、随机森林模型、梯度提升决策树分类模型、LightGBM等机器学习、数据挖掘领域的常用和前沿的集成算法,对上述模型效果进行评价并选出效果最好的LightGBM模型对流动人口的定居意愿进行深入研究;第三,对不同的受教育程度的流动人口做进一步深度的研究,分析不同受教育程度的流动人口在定居意愿方面的异同点以及背后的经济学含义。本文是对人口流动方面研究的有益补充。
健全在党的统一领导下协调行动机制。强化党的组织在同级组织中的领导地位,理顺党的组织同其他组织的关系,更好发挥党总揽全局、协调各方作用。新组建省人大社会建设委员会、省政协农业和农村委员会,调整优化人大、政协部分专门委员会职能,更好地保障人民行使国家权力、有效参政议政。紧紧围绕保持和增强政治性、先进性、群众性这条主线深化群团组织改革,更好发挥党和政府联系人民群众的桥梁纽带作用。
三、 假设与模型
(一)假设
根据微观经济学的观点,理性行为人的决策主要由其无差异曲线和约束曲线决定。对于流动人口的定居意愿,影响其偏好的因素涵盖了自身人生规划、婚姻状态、在流入地人脉以及流入地的发达水平、城市规模、基础设施、环境、文化、医疗、教育以及未来发展等诸多因素,其约束曲线主要由劳动收入、生活成本以及家庭财富所决定。
基于此,本文提出以下假设。
假设一:流动人口的年龄、教育程度、婚姻状态、在流入地居住时间长短会影响其对流入地的偏好。迁移与定居是人生大事,微观个体在考虑定居的事情时会综合考虑自己、父母、配偶以及子女的方方面面,居住时间长短也会影响对城市的感情以及在城市的人脉资源等。
不同受教育程度的流动人口之间具有较强的异质性[17],将流动人口按受教育程度不同划分为“小学及以下”、“初中”、“高中及中专”、“大专”和“本科及以上”五组,对五组样本分别进行基于LightGBM模型的定居意愿影响因素分析。得出模型的各类评估指标如下表,从表中的各项评估指标来看,五组机器学习均得到了较好的效果。
假设三:对于城市的定居意愿受到自身收入、生活成本、家庭财富、流动距离以及落户门槛的约束。买房是大多数中国人的人生头等大事,也是流动人口迁移定居的最大约束。一个城市的房价和房租水平是影响个人当前与未来现金流的重大因素。同时,由于多数定居并非举家搬迁,可能家中会有亲属仍然居住于流出地,因此流入地与流出地的距离也是一项约束条件。于由于高铁网络的建设、通讯的发展,地区之间的流动便捷程度使得这一约束有所减小,因而放假方便流动人口向更远、经济更加发达的城市定居[14-15]。
(二)数据与描述性统计
本文所使用个体层面数据来源于2015 年全国流动人口动态监测数据,2015年度人口动态监测调查数据以31个省(区、市)和新疆生产建设兵团2014年全员流动人口年报数据为基本抽样框,采取分层、多阶段、与规模成比例的PPS方法对在流入地居住一个月以上、非本区(县、市)户口的15周岁及以上流动人口进行抽样,样本量为20.6万个。全国流动人口动态监测调查数据具有较好的完整性和较强的代表性。本文城市层面数据来源于《中国城市统计年鉴(2015)》及《中国社会统计年鉴(2015)》。相关变量的描述性统计见表1。
表1 变量统计性描述
个人因素中,定居意愿最重要的影响因素是在流入地居住的时间。根据前文的假设,在流入地的时间会影响流动人口对城市的偏好,随着在城市居住时间的增加,一个人对城市环境的了解,对于城市融入的加深,在城市中人脉资源的增加都会增加流动人口对流入地的感情,影响个人偏好。因为这种感情随时间增加,和受教育程度无直接关系,因此无论何种受教育程度,流动时间对定居意愿的影响程度变化都不大。
(三)模型构建与比较
本文使用Python语言来实现模型,首先对数据进行去重、打乱数据排序等前期工作,然后随机将数据划分为训练集和测试集,其中80%样本为训练集,其余20%为测试集。使用逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树分类模型以及LightGBM模型共计5种机器学习模型进行建模并进行比较分析,对比算法的F 1值(F 1Score=P *R /2(P +R ))、准确度AUC值。其中P 为精密度Precision(Precision=TP /(TP +FP ))、R 为召回率Recall(Recall=TP /(TP +FN )),TP 为真阳性,FP 为假阳性,TN 为真阴性,FN 为假阴性(图1)。
对上述模型的F1 Score以及准确度AUC值评估结果如表2。
表2 五种算法模型效果评估结果
随着受教育程度的增加,收入的重要性逐渐超过成本。这说明高学历的流动人口是收入导向型的,低学历的流动人口是成本导向型。高学历的流动人口人为,只要自己有足够高的收入就能够在城市定居。而低学历的流动人口则认为,只有当在城市的生活成本较低时才愿意在城市定居。这是因为学历会影响收入和收入预期,高学历者认为未来收入会有提高,因而高生活成本可能只是暂时的,而低学历者则相反,他们从事的工作有着较低的天花板,收入成长空间较小,因此更加看重平衣食住行的成本。
从上述图表可以看出,不管何种评论指标,LightGBM模型均表现出最好的效果,其次为梯度提升决策树分类模型。同时,在计算的过程中注意到,相比于传统的逻辑回归模型,LightGBM模型具有更快的训练效率、更低的内存使用、更好的准确率。
VMware虚拟机的创建和部署操作十分简单,并且创建方式多样。一般分为创建单个虚拟机、用模板创建虚拟机、克隆虚拟机。在部署虚拟机的初期阶段,我们主要选择通过单虚拟机的方式进行创建,创建的过程中可根据实际需求选择不同的操作系统和硬件配置。如果基于已创建和配置好的单台虚拟机,我们也可以将此虚拟机克隆为模板,利用模板虚拟机创建出许多与之配置相同的虚拟机,为批量创建部署提供快捷通道。VMware还提供运用开放虚拟化格式(Open Virtualization Format,OVF)和开放虚拟化设备(Open Virtualization Appliance,OVA)模板的方式进行创建和部署。
四、 结果与分析
(一)基于LightGBM模型的流动人口定居意愿研究
根据本文文献综述部分,流动人口的定居意愿受到多重因素影响,这些因素有以下两个特征:第一,如此多的因素中必然有轻重,本文选取了24个因素来研究其对定居意愿的影响,他们对模型都有贡献,但显然贡献的程度是不一样的,重要性程度的排序可以通过Python语言中的特征重要性来实现;第二,由于本文所选取的24个因素来源于不同的数据库,其中的个人层面的因素(如个人收入、受教育程度、年龄等)精确到每一个样本,而城市层面的因素(如流入地城市的人均GDP、高校数量等)只能精确到城市,对于同一城市中的每一个样本,该因素的取值是相同的。因此城市层面的指标和个人层面指标对模型贡献的重要性程度是不可比的,也是没有意义的,只需分别关注个人层面和城市层面对定居意愿影响最大的因素是什么即可。
图1 机器学习流程图
图2 五种算法模型ROC曲线
(a)个人层面特征重要性排名 (b)城市层面特征重要性排名
图3 定居意愿影响因素的特征重要性
利用LightGBM模型对所有样本进行回归,得出个人层面和城市层面的特征重要性如图3。
以隐私权的发展历程为例,在古典的隐私权时期,隐私权往往被归之于宪法上的基本权利,在以宪法作为新兴权利的保护依据的同时往往将宪法上的基本权利与自然法上的权利混在一起。基本权利与民事权利也可以相互转化[15]。
总体而言,在城市居住时间长短是影响流动人口定居意愿的最重要因素。除此之外个人层面定居意愿的选择更多是成本导向型,每月住房支出、每月总支出、每月食品支出都在定居意愿的决定中发挥了较为重要的作用。在城市层面的影响因素中,人均GDP、流入地与流出地的收入水平差是影响定居意愿的最重要因素,前者代表了流入地的“拉力”,后者则既能表示流入地的“拉力”,又能代表流出地的“推力”,这符推拉理论[16]。
(二)不同受教育程度流动人口定居意愿
假设二:经济发展水平、城市规模、习俗、医疗设施、教育条件等诸多城市层面的因素影响流动人口对其偏好。
本文基于数据挖掘与机器学习,使用逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树分类模型,以及LightGBM模型共计5种机器学习模型进行建模和评估分析,最后选出效果最好的LightGBM模型对流动人口的定居意愿作进一步的研究。基于本文假设,通过计算模型的重要性特征值,本文有以下三个发现。
表3 不同受教育程度分组的模型评估情况
分别从个人层面和城市层面来分析影响定居意愿的各项指标,选取其中重要性特征值较大的因素可得到图4和图5。
图4 个人层面特征重要性排名
图5 城市层面特征重要性排名
从表1描述性统计中可以看出,剔除回答“没想好”的样本后,超过80%的流动人口愿意在流入地定居。
上述5种模型的ROC曲线如图2所示。
本文通过回顾日本职业教育中的产学合作教学发展史,希望获得其发展的经验,得到启示,为产业和学校真正结合起来提供建议。
高学历的流动人口对城市的产业结构更加敏感。产业结构代表着一个城市的长远发展规划与产业发展趋势。深层次来看,改革开放初期,由于中国内部有效需求不足,生产的大量产品,不能被内部消化掉,所以出口到国外,以外汇的方式进行储存。且当时人口结构以壮年劳动力为主,社会剩余产品的生产能力较强,因此发展出口导向型经济,借助发达国家商品和金融市场实现现期生产能力向未来消费能力的跨时期转移。这一时期,出口导向型经济充分调动了我国资源禀赋优势,取得巨大成功。但这种经济的高增长,是靠廉价劳动力、廉价资本加廉价资源高投入支撑的,它具有内在的不可持续性,近年来这种迹象越来越明显。随着人口红利的消失,中国正在经历产业转型与产业升级,原来沿海城市的低端制造业等低附加值、劳动密集型产业被转移到了内地或者东南亚,转而发展高端制造业或者高端服务业,过去简单、重复的工作正在逐渐被被工业机器人、服务机器人、智能装备等替代,从而产生低端劳动力的过剩和高端劳动力的缺口。未来这种缺口引致出对高学历劳动者巨大的需求,因此,高学历者在考虑是否在城市定居时,会更多的考虑一个城市的未来规划、产业结构等因素。
城市层面的因素中,对定居意愿影响程度较大的是流入地与流出地收入水平差额、流入地房价水平、流入地人均GDP以及流入地的产业结构。
从城市层面的特征来看,随着学历的增加,流入地与流出地的收入差距对定居意愿的影响呈现出“V”型的变化趋势,也就是说,根据推拉理论,最低学历与最高学历者,受到发达城市高人均收入的“拉力”更明显。结合前文对个体层面影响因素的分析,低学历者对个人收入相对不敏感而对流入地与流出地收入水平差较敏感,唯一的解释是这些低学历者来大城市的目的是找一份工作,他们认为越发达的城市蕴含的工作机会越多。初中、高中等学历人口大多数从事高机械性、高重复性的车间工作,这些工作会涉及到对鼠标的简单操作或是对机器、文字以及符号的识别,对于小学及以下的流动人口,可能无法胜任大多数制造业车间的工作。他们中男性多在工地等基建领域劳动,女性则多从事保姆、清洁等工作。这些工作由于无正规劳动协议的保障,常常处于不稳定状态,其与产业关系并不密切,而对城市的规模较为敏感。因此更发达的城市蕴藏着更多的低学历流动人口的工作机会。学历最高的是以来发达城市获得高收入为目的,他们认为越发达的城市未来能够实现的收入越多。
随着学历的增加,年龄对定居意愿的影响逐渐减小,这可以用生命周期理论来解释,当预期收入随着年龄增长,年龄就变得不那么重要。
五、结论与建议
(一)结论
年初召开专题部署会议,各委室结合自身特点和履职重点确定年度议题,明确预期目标和实现举措;工作推进中,各委室积极走上去对接、走出去学习、走下去调研,专门科室定期调度、组织开展情况交流,推动各项工作做精做细做实;年底,对委室探索情况和经验材料进行分析汇总,对相关成果结集出版。各委室积极探索实践,在深度调研、专题询问、流程规范、借助外脑等方面形成了一批可复制、可推广的经验做法,有效带动了机关整体工作水平的提升。
刘金平[7]等建立空气源热泵热水器变工况性能仿真计算模型。研究表明,储热式热泵热水器储水箱水温的升高和环境温度降低都会导致系统能效的下降;长江以南典型地区空气源热泵热水器的年供热系数大于3.25,应予以推广。
第一,LightGBM作为当前机器学习领域最为前沿的算法,可以被应用于流动人口定居意愿的研究领域,通过对数据进行机器学习,可以取得比传统Logit回归更精确可靠的计算结果,这为以后的研究提供了新的思路。
第二,在流入地定居时间长短是影响偏好的最重要因素,除此之外,定居意愿更多的受到收入成本的约束。
第三,不同学历的流动人口其定居意愿对各影响因素的敏感程度不同,影响最高和最低学历的流动人口定居意愿最重要的因素均为流入地与流出地的收入水平差距,他们有着充足的动力逃离家乡,但背后原因不尽相同,低学历者是为了寻求工作机会,高学历者是为了获得更多收入。
(二)建议
基于上述结论,本文提出如下建议。
又是一个月底报表,管理科的几名女员工又要加班到深夜,她们是没有加班费的。她们有的要在十来平的小屋里统计着电脑上面传来的数据,再汇总成表格,再传到北京。这几年,化工产品涨落的幅度较大,一夜之间几千元的差价,也是有过的事。她们的工作严细认真,来不得半点马虎,去年,大庆石化公司盈利30多亿,正是像她们这样千万名石化人努力的结果。
自2002年启动引江济太以来,实践证明,将长江清水引入太湖,并向太湖周边及下游地区增加供水,可增加流域水资源有效供给,加快河湖水体流动,提高水体自净能力,改善太湖及地区河网水质。同时,作为流域供水安全应急保障的重要手段,引江济太在应对2003年黄浦江上游燃油水污染事故、2007年无锡市供水危机过程中发挥了重要作用。2010年,为保障青草沙原水系统切换期间供水安全而实施的引江济太应急调水的成功实践进一步表明,引江济太对保障流域供水安全作用明显。
首先,降低低收入者生活成本,建立更加丰富的税收体系,合理降低低收入者的税负成本。建立立体、多元化的补贴制度,例如针对低学历、低收入者的食品、住房补贴。
贵冶智能工厂的建设是根据贵冶对应用系统功能的需求,结合贵冶生产管理现状、信息化建设现状、两化融合现状为基本出发点,从总体架构和具体实现上进行整体设计,搭建出可实施落地的、符合贵冶的智能工厂框架。
其次,加强职业教育培训,让流动人口适应经济社会对劳动力需求的发展与变化,随着经济转型升级,让更多的劳动力提高自身素质,从而从事更高附加值的工作,提高经济运转效率的同时增加他们的收入。
最后,提高流动人口尤其是高学历流动人口在城市的归属感和舒适感,例如降低他们的落户门槛,解决家属的就业、就医,解决子女的教育问题,以更多地吸引高学历人才,适应经济发展由“量”到“质”的转变。
[参考文献]
[1] 陆铭,向宽虎.破解效率与平衡的冲突——论中国的区域发展战略[J].经济社会体制比较,2014(04).
[2] 童玉芬, 王莹莹. 中国流动人口的选择:为何北上广如此受青睐?——基于个体成本收益分析[J]. 人口研究, 2015(04).
[3] 王玉君.农民工城市定居意愿研究——基于十二个城市问卷调查的实证分析[J].人口研究,2013(04).
[4] 王伟, 陈杰, 艾玮依.新生代农民工在三四线城市定居意愿及其影响机制研究——基于2014年长三角地区流动人口动态监测数据的考察[J]. 华东师范大学学报(哲学社会科学版), 2016(04).
[5] Fokkema T, Haas H D. Pre-and Post-Migration Determinants of Socio-Cultural Integration of African Immigrants in Italy and Spain[J]. International Migration, 2011, 53(06):3-26.
[6] 李振刚.社会融合视角下的新生代农民工居留意愿研究[J]. 社会发展研究, 2014(03).
[7] 刘于琪, 刘晔, 李志刚.中国城市新移民的定居意愿及其影响机制[J]. 地理科学, 2014(07).
[8] 卜庆国.新型城镇化背景下郑州市新生代农民工城市定居意愿影响因素研究[J]. 中国农业资源与区划, 2017(10).
[9] 郭云贵, 张丽华, 刘睿.流动人口就业状况、歧视知觉对定居意愿的影响——基于2013年全国流动人口动态监测数据的分析[J]. 北京交通大学学报(社会科学版), 2017(01).
[10] Newbold K B. Return and Onward Migrations in Canada, 1976—1981: An Explanation Based on Personal and Ecological Variables[J]. Can Geogr, 2010, 39(01):16-30.
[11] 侯慧丽. 产业疏解能带动人口疏解吗?——基于北京市流动人口定居意愿的视角[J]. 北京社会科学, 2016(07).
[12] 蔡翼飞, 张车伟. 地区差距的新视角:人口与产业分布不匹配研究[J].中国工业经济, 2012(05).
[13] 马银坡, 陈体标, 史清华. 人口流动:就业与收入的区域差异[J].农业经济问题, 2018(05).
[14] 巫锡炜, 郭静, 段成荣. 地区发展、经济机会、收入回报与省际人口流动[J].南方人口, 2013(06).
[15] 马小红, 段成荣, 郭静. 四类流动人口的比较研究[J].中国人口科学, 2014(05).
[16] 李强. 影响中国城乡流动人口的推力与拉力因素分析[J].中国社会科学, 2003(01).
[17] 马岩, 杨军, 蔡金阳,等. 我国城乡流动人口教育回报率研究[J].人口学刊, 2012(02).
[中图分类号] C922
[文献标识码] A
[文章编号] 1003-1154(2019)03-0081-06
[基金项目] 国家自然科学基金项目(71673186)。
DOI: 10.19634/j.cnki.11-1403/c.2019.03.020
标签:流动人口论文; 定居意愿论文; 数据挖掘论文; 上海交通大学安泰经济与管理学院论文;