基于决策树ID3算法的人才留汉吸引政策研究论文

基于决策树ID3算法的人才留汉吸引政策研究

陈 茜1,马向平1,贾承丰2,张 节1

(1.中国地质大学 公共管理学院,湖北 武汉 430070;2.武汉理工大学 理学院,湖北 武汉 430070)

摘 要: 近年来人才已经成为各地竞争的资源,各地政府关于吸引人才的政策层出不穷,涵盖社会的方方面面。由于主客观因素对人才吸引的影响力度不同,导致这些因素相互之间对人才能否留下的决策有着错综复杂的关系。为了揭示这种非线性关系,预测人才留下与否的决策关键,在调查分析人才留在某二线城市和留在武汉主客观因素的吸引力数据基础上,使用Python编程语言,运用机器学习中的ID3算法,对样本进行了分析,构造出决策树模型。进而从宏观、微观角度对不同因素吸引力的强弱进行分析,得出了影响人才留汉发展的各种政策变量的重要性程度的分析结果。对比武汉市现有人才留汉政策,分析了现有人才留汉的政策存在的不足,并提出了相应的对策建议。

关键词: 人才引进;政策研究;决策树;ID3算法;影响因素

在十二届全国人大五次会议后,各地纷纷响应国家号召,相继开展“双创引才计划”“百人计划”“千人计划”等。因此如何设计及实施吸引人才的政策就成为了各地人才政策的重中之重。随着中部崛起战略的实施,武汉作为千湖之省,九省通衢,具有优势的地理位置,与此同时也正在将区位优势转化为经济优势。但武汉在保持经济平稳较快增长过程中,要进一步发挥中部地区比较优势,增强对全国发展的支撑能力,就必须有充足的、高素质的人才作为保障。这就要求武汉在实施吸引人才的政策上必须考虑人才的实际需求,实施健全的人才体制,增强政策的吸引力。

1 国内人才引进政策研究

从国内来看,对人才引进政策的研究方法主要有公共政策分析理论、层次分析法、因子分析法、文本分析法等。如倪海东等[1]运用公共政策分析理论,对我国目前的海外高层次人才引进和服务政策进行研究,分析现行政策的不足,进而提出了人才引进与服务政策的建议;刘玉雅等[2]采用层次分析法构建人才政策的评价体系,定义了人才引进标准的量化指标,从发展性和福利性角度出发,提出健全相关法律体系和增强人才队伍建设的建议;孟华等[3]利用因子分析法测量客观吸引力与政策的绝对吸引力,进而将各省级政府政策的绝对吸引力与客观吸引力进行比较,获得各省高层次人才政策的相对吸引力评价结果;李良成等[4]以广东省的人才政策文本为样本进行分析,认为应加快形成以创新为主要引领和支撑的经济体系和发展模式,进一步优化科技创新人才政策体系,促进政策之间的协同,形成创新人才高地。

综上可知,关于国内人才引进政策的研究可分为基于理解形势政策的理论分析法和基于量化指标的数值分析方法两类,但两种方法均存在一定的局限性。如前者多停留在定性分析上,从公共管理理论的角度进行论证,难以体现政策带来的客观影响。而后者虽然能通过定量分析来研究政策对人才引进的影响,但方法选择多为因子分析、逻辑回归、最小二乘法等线性统计方法[5],不能揭示多因素之间的交互关系及这种交互关系给决策量带来的影响。而对于多个人才引进政策而言,政策之间也会有交互的、非线性的关系,且不同类型的政策对于决策量的影响程度也不尽相同。因此,笔者针对个体城市(武汉)的人才引进政策,利用机器学习理论中的ID3决策树算法,解决多因素决策的非线性交互问题。

2 模型构建及问卷分析

2.1 模型构建

通过对千人人才网上湖北省2009—2017年出台的大小政策进行归纳和整理,总结出政策涉及到的16个方面因素,分别对应于马斯洛需求层次理论的3个阶段:初级阶段、中级阶段和高级阶段。初级阶段是指生理需求和安全需求,包括人基本的水、食物、人身安全、工作保障和财产保障等方面,因此包括薪资、饮食、住房资助、户籍政策、交通、空气质量;中级阶段是指人的社交需求和尊重需求,包括家庭归属感、自我尊重等方面,所对应的影响因素有子女教育、研究资助、创业资助、工作环境、休闲娱乐;高级阶段是指自我需求,包括人的创造力及成就奖励等方面,所对应的影响因素有优秀人才奖励政策、优秀成果奖励、未来提升与发展空间、股权激励。不同阶段所涉及到的方面都属于人才吸引相关政策所涉及到的内容,因此构建了人才吸引相关政策所涉及的主观影响因素模型,如图1所示,将该模型作为问卷设计的基础。

本文旨在研究互联网金融的发展对商业银行盈利的影响,需要从互联网金融的总体发展和第三方支付、网络融资、互联网货币基金方向选取相应指标作为解释变量.通过借鉴国内著名学者的研究结果,定义互联网金融指数、第三方支付交易规模增长率、P2P网贷增长率为解释变量.由于互联网货币基金多依托于第三方支付平台进行交易,为避免数据重复,将其纳入第三方支付进行研究.

溪荪鸢尾萌芽早,为多年生宿根花卉,花大艳丽,花叶兼赏,有很高的观赏价值。病虫害少,繁殖容易,管理粗放[4],有较强的抗寒、耐湿、抗病能力,适应性强,是北方园林绿化不可或缺的重要材料。

2.2 问卷设计及结果分析

5:利用信息增益,从属性集A 中选择最优划分属性a *;

图1 人才吸引相关政策所涉及的主观影响因素模型

表1 影响人才留在某二线城市主观因素的吸引力所占比例 %

表2 影响人才留在武汉主观因素的吸引力所占比例 %

吸引力大小是根据所得分占5项总分的比例进行划分的。在主观因素的问卷调查中,“1~5”分代表重要程度和吸引力程度“由弱到强”。为了直观观察受访者最关心的政策和最不关心的政策,以四分位数为标准进行相应的分析。

对于表1来说,在(1+2)项中,最大四分位数为18.75%。故认为(1+2)项数值大于18.75%的为吸引力弱的项,即吸引力弱的因素包括风险补偿、科技专项、交流支持、人才优先推荐。在(4+5)项中,最大四分位数为70.165%。故认为(4+5)项数值大于70.165%的为吸引力强的项,即吸引力强的因素包括薪资待遇、交通情况、教育支持、工作环境。

对于表2来说,同样利用最大四分位数的方法,可得到吸引力弱的因素为薪资待遇、空气质量、风险补偿、交流支持,吸引力强的因素为户籍便利、交通情况、子女教育和教育支持。通过与某二线城市的政策吸引力对比可以发现,人才留汉的影响因素既有与某二线城市一样的普适性,又有武汉地区的独特性。

3 研究方法构建及分析

3.1 决策树的构建

通过收集影响人才留在某二线城市和留在武汉的主客观因素的数据,使用Python编程语言,运用ID3算法来构造决策树模型。对样本进行分析后,构建出两棵决策树。算法的伪代码为:

过程:函数TreeGenerate (D ,A )。

输入:训练集D ={(x 1,y 1),(x 2,y 2),…,(x m ,y m )}。其中x i 为第i 个样本对所有政策态度的选项,x i ∈X ;y i 为该样本是否愿意留在武汉,y i ∈Y 。属性集A =(a 1,a 2,…,a d ),其中a 为对应的政策,A 为所有政策的集合。

1:生成节点node;

2:ifD 中样本同属于一类别C

3:将node标记为C 类节点;

4:end if

本次调查时间为2018年10月至11月,采取线上和线下相结合的方法,共发出问卷230份,回收问卷185份。经过初步处理(除去回答信息有问题的样本),最终得到有效问卷176份。调查范围为中国地质大学(武汉)、武汉大学、武汉理工大学、中南民族大学的学生群体及社会上各类人才。调查问卷涉及到吸引人才的主客观因素的问题共计23项,客观因素包括性别、学校、学历、专业及工作状态;主观因素包括薪资待遇、饮食健康条件、住房资助、户籍便利、交通情况、空气质量、子女教育、教育支持力度、科研支持力度、创业就业资助、风险补偿政策、工作环境、休闲娱乐情况、人才奖励政策、科技专项支持、优秀成果奖励、学术与技术交流支持、人才优先推荐等方面。其中主观因素在调查问卷中分为两个方面:①针对人才留在某二线城市的影响因素;②针对人才留汉的影响因素。根据影响人才留在某二线城市吸引力强弱的因素与现有武汉市人才吸引政策的侧重点进行交叉分析,找到影响人才留下的重要因素及人才不留汉发展的影响因素,进而优化和健全武汉市现有的人才吸引政策。根据问卷的调查结果进行数据汇总,结果如表1和表2所示。

6:fora *的每一个值

6)除果袋时间不规范。红富士苹果在袋内一定要长够110~120天,除袋过早会使苹果着色慢,先着色,后褪色,返为绿色,出现“绿腔”现象;除袋过晚则会不着色,如红富士苹果应于9月下旬末或10月初除袋,若延迟到10月下旬至11月初除袋,则着色缓慢,也会出现苹果发黄不上色的现象。中熟苹果品种如嘎拉、珊夏等,如与晚熟红富士同时除袋,也会出现发黄不上色现象。

其中,V 为该属性的所有取值的集合,如对于薪资待遇而言,有1到5五个选项,就有|V |=5。 计算总体信息熵与属性a 划分信息熵的差值,就能得到信息增益。一般而言,信息增益越大,意味着使用属性a 来进行划分所获得的“纯度提升”越大。因此,最优属性a *=argmaxGain (D ,a )就是样本D 中最优划分属性。

8:ifD v 为空

Python语言是默认为用数字代表选项,故在对客观因素“工作状态”进行划分时,用1代表为别人工作的人才,如在职的人;2代表学生;3代表为自己工作的人才,如创业者;4代表其他,但实际问卷中选择此项的人才占比不高,不具有代表性和可参考性,因此后文不做讨论。而在分析主观因素吸引力时采用评价制,“1~5”分代表重要程度和吸引力程度“由弱到强”。

运输结构不断优化,珠江水运综合优势进一步突显。珠航局坚决落实国家关于推进运输结构调整的决策部署,充分发挥珠江水运成本低、运量大、低碳环保的优势,在打好污染防治攻坚战的同时,也能更好地服务沿江地区的经济发展。

11:将TreeGenerate (D v ,A\ <FounderNode name ="@盒"value =""/>(〗a *})作为分支节点

12:end if

我要拴住王鲶鱼,就必须怀上孕。王鲶鱼女人不少,但都没给他生儿,我想给他生儿,王鲶鱼说只要生儿,就带我出国定居。我之所以要嫁给王鲶鱼,就是想跟着他出国定居,现在的有钱人,老婆孩子不都在国外生活吗?

推荐理由:作者曾获以色列布伦纳奖、以色列总理奖、美国犹太图书奖等奖项,这部小说被他视为自己创作成熟的标志。中文译本首次出版。小说讲述了1930年代巴勒斯坦的一个小村庄里,朱迪斯与她的三个爱慕者之间发生的故事。作者从宗教故事和神话传说中汲取灵感,并融入犹太乡村的风土人情,用魔幻现实主义的高超技法,将这个《雅歌》般的传奇娓娓道来。

13:end for

输出:以node为根节点的一棵决策树

对于所有的受访者的调查问卷集合D ,已知各个样本的属性x i ,即每个人对于政策的态度和自身的主观因素;也知道各个样本的标签y i ,即每个人是否留在武汉。以此来构建决策树,也就是在每一层的样本中,找到对该层样本区分度最大的属性。例如:对于所有人而言,“工作状态”这个属性最能区分是否留在武汉;对于在职的人而言,“薪资待遇”对是否留在武汉的影响最大。而如何定义和量化当前条件下影响最大的因素是构建决策树的关键,即伪代码中的第5步。

信息论中有熵(entropy)的概念,表示状态的混乱程度,熵越大状态越混乱。熵的变化可以看作是信息增益,决策树ID3算法的核心思想是以信息增益度量属性选择,选择分裂后信息增益最大的属性进行分裂。D 代表留在武汉和不留在武汉的总样本,设D 为用(输出)类别对训练元组进行的划分,且总样本D 中第k 类样本所占比例为P k (k =1,2,…,|Y |),则D 的熵可表示为:

在调查问卷数据中一共有176个样本,用来预测人才是否留在武汉。显然,|Y |=2。在决策树学习开始时,根节点包含D 中所有的样例,其中留在武汉的记为正例,即有不留在武汉的记为负例,则有于是可以得到根节点的信息熵为:

10:else

在计算得到样本总体信息熵之后,为了得到最优的划分属性a *,需要进行信息增益(information gain)的计算,使得在该属性下正例样本和负例样本的区分度最大。每一个属性a 对于样本D 的信息增益为 :

7:为node生成一个分支;令D v 表示D 在a *上取值为的样本子集;

在协同集聚路径的中介作用检验方面,由模型11可知文化与旅游业融合能对产业协同集聚产生显著正向影响;同时,模型12中文化与旅游产业融合的估计系数也小于基准模型3中的系数值,意味着协同集聚路径发挥了部分中介作用,理论假说3获得支持。但值得深思的是,中介效应仅占总效应的3%,表明文化与旅游业融合借助协同集聚效应来促进旅游产业升级的作用程度较为有限,这也侧面印证了我国文化与旅游产业的协同集聚度较低,Jacobs外部性收益尚未充分释放。

此时得出能够最大限度划分不同类别的属性及其取值,即能够区分出留下与否两者之间最大的影响因素。ID3决策树算法在每次分裂时选择信息增益最大的属性,作为本次分裂属性。每次分裂就会使得树长高一层,这样逐步生产下去,就可以构建一棵决策树。而信息增益最大的属性也就是客观决定人才留下与否的最大因素。

为了避免“过拟合”情况的产生,通过主动去掉一些分支来降低过拟合的风险[6]。剪枝后的决策过程分别如图2和图3所示。

图2 影响人才留在某二线城市的主客观因素决策树

图3 影响人才不留汉的主客观因素决策树

3.2 决策树ID3 算法结果分析

9:将分支节点标记为叶子结点,类别标记为D 中样本最多的类;

由图2和图3可知,影响人才留在某二线城市或武汉区分度最大的因素“职业状态”,基于根节点和决策树子节点的影响因素,讨论分别在3种职业情况下,子节点所对应的哪些因素会影响到人才是否留在这个城市。

自从我国经济进入“新常态”时期以后,企业更加注重可持续化的发展和持续的经济增长,很多程度上推动了财务公司的快速发展。产业链金融作为财务公司现阶段重要的金融服务,能够对企业集团的资源进行科学地整合与配置,同时还能够根据企业集团的运营特点来拓展运营的业务范围,进一步延长和拓宽企业集团运营相关的产业链,有利于企业集团提高整体的竞争能力同时为集团企业战略发展提供条件。财务公司应当加强对产业链金融的研究并明确产业链金融的服务定位和细节,通过科学的产业链金融服务来帮助企业集团和上下游企业的完成融资和适当的发展计划制定,提高企业集团的资源利用效率并推动企业集团更高水平地发展。

(1)由图2可知:①对于为别人工作的人才(工作状态≤1.5)来说,当子节点薪资待遇≤1.5时,意味着这个因素的吸引力较小时,能留下人才的关键因素是科研支持力度。当薪资待遇≤1.5为“否”时,代表着该因素的吸引力较大。在该节点下,当住房资助、年薪吸引力一般时,只有通过满足子女教育、交通和空气质量的需求才有可能留下人才。对于有孩子的家庭而言,需尽最大可能满足子女教育、交通和空气质量的需求;对于没有孩子的家庭而言,需尽力提供在学术或技术上交流机会和资金支持。与此同时,发现男性对休闲娱乐环境及年薪有一定要求。②对于为自己工作的人才和学生(工作状态>1.5)来说,当科研支持≤3.5时,初始阶段的创业者更需要的是技术交流支持、创业资金支持和风险补偿支持。当创业者的企业步入稳定阶段时,吸引力更大的是科研支持、企业收入及人才推荐政策。当科研支持≤3.5为否时,若年薪满足不了人才需求,则保证教育和交通情况的吸引力较大,会增大人才留在这个城市的可能性。

其中L表示半采样延期近似度。如果K是小波消失矩的阶数,并且L是控制半采样延期近似值的参数,则有以下的设计方程,即想要揭示最小长度的滤波器h和:

(2)由图3可知:①对于为别人工作的人才(工作状态≤1.5)来说,当子女教育、科技重大专项支持、人才奖励及推荐、相关政策吸引力不足时会导致他们不留在武汉。当性别不一样时影响因素会有差异,女性对空气质量、住房补助等因素都有一定的要求,男性则更关注休闲娱乐环境方面。②对于为自己工作的人才和学生(工作状态>1.5)来说,当风险补偿≤2.5时,根据所经过的影响因素可以观察出,武汉现有政策中吸引力不足的因素有风险补偿政策和创就业资助。在专业≤1.5节点下,根据专业的不同,年薪和交通情况也会导致他们选择不留在武汉。在风险补偿≤2.5为“否”时,可看出除了考虑创业支持外,武汉现在对他们的吸引力都不足。当年薪≤6.5万时,可以观察出有孩子的家庭还会考虑政府对子女教育支持力度程度。而当年薪≤6.5万为“否”时,没有孩子的人会认为现有政策中的住房资助、户籍便利、福利待遇还需要增强吸引力。

4 结论与建议

4.1 主要结论

基于影响人才留在某二线城市和留在武汉主客观因素的分析,得出以下结论:

(1)武汉在住房资助因素方面的吸引力不足,住房优惠政策未达到吸引人才的应有效果。结合武汉相关政策内容分析认为,武汉市政府计划在5年内达到满足20万人租住需求的人才公寓及“人才住房券”等政策,虽支持力度较大,但宣传力度不足。

(2)职业分类的针对性不足。决策树分析显示,人才是否留汉的首要决定因素为职业状态,其次才是综合考虑其他因素。

(3)财政对人才发展和城市建设支持的重点不突出。分析显示,对留汉人才吸引力较大的因素共计7项:薪资待遇、住房资助、交通情况、空气质量、子女教育、教育支持、奖励政策。也就是说,主观影响因素的需求更多集中在初级阶段和中级阶段。而实际财政支出中未能体现出对这两个阶段的侧重点。例如未充分考虑人才对交通、空气质量和休闲娱乐环境等的需求,也没有对学术或技术交流的渴望有所侧重,而且对于短期留才和人才长期发展的政策支持缺少区分[7]

我们使用两个公开数据集MobiAct[11]和SisFall[12]对算法性能进行评估。MobiAct数据集利用智能手机内置的加速度计,陀螺仪和方向计采集人体运动过程中的信号,手机被随机放置于志愿者任意一侧的裤袋中,且不规定手机放置的方向。而SisFall数据集利用固定在志愿者腰部的嵌入式设备采集加速度计和陀螺仪信号。为保证运动类型的完善,两个数据集都采集了多种跌倒与非跌倒运动类型的数据。

4.2 优化和健全人才留汉政策的建议

基于以上研究,笔者提出以下建议,以优化和健全人才留汉政策。

积极强化市场开发制度建设,构建长效发展的组织,才能充分发挥优秀个体的专业性和积极性,也才能为烟草企业的发展提供持续性的支持。积极推动市场开发制度建设,立足于构建长效发展的市场开发工作体系,将部门内部的各个工作环节、各项工作内容组织串联起来,将各个点串联成完整的工作链,并在这个过程中积极总结过去的工作经验,在市场开发过程中积极尝试新的想法、做法[4]。用稳固的制度保障农村市场开发各项工作的有序化进行。

靖边县牛玉琴治沙基地是全县正在建设的集农业旅游观光为一体的现代化农业示范基地,基地总面积2.5万亩,其中育苗基地安装有全自动节水灌溉系统,可实现自动化无人定时定量上水、灌溉。

(1)强化人才政策的宣传力度。在宣传方式上,可利用多媒体渠道及依靠自身优势平台优势,多渠道去宣传政策的优惠性。在宣传范围上,既要加强针对湖北省内的宣传,又要加强对省外甚至海外的宣传。可通过校友会、华人会等人际联系范围广泛的组织来进行宣传,进而加大宣传范围,吸引多样化的人才[8]

(2)提升政策职业分类的针对性。首先,完善不同职业人才的吸引政策,既要有吸引所有人才的一般性政策,又要有吸引不同群体人才的重点政策,不能片面追求高层次、高学历人才,以免造成人才浪费和人才成本的增加。其次,可加大不同职业人才关注点的吸引力,采取比例制,在政策中细化分类标准和条件,让不同情况的人自行选择,既不增加财政支出,又能让财政支出得到最大程度的使用。

(3)优化人才发展环境,提供宜居环境。首先,构建多样化人才交流平台,如建立交流沟通的组织平台,定期开展交流活动;设立人才建言献策公众号,广泛听取意见和建议。其次,完善城市建设,逐步有计划有规律地完善交通体系、改善空气质量环境及完善娱乐配套措施。

参考文献:

[1] 倪海东,杨晓波.我国海外高层次人才引进与服务政策协调研究[J].中国行政管理,2014,12(6):110-113.

[2] 刘玉雅,李红艳.京沪粤苏浙地区人才政策比较[J].中国管理科学,2016,24(S1):733-739.

[3] 孟华,刘娣,苏娇妮.我国省级政府高层次人才引进政策的吸引力评价[J].中国人力资源开发,2017,34(1):116-123.

[4] 李良成,于超.基于内容分析法的广东省科技创新人才开发政策研究[J].科技管理研究,2018,38(5):49-56.

[5] 周志华.机器学习[M].北京:清华大学出版社,2016:73-94.

[6] 张冬梅,闫蓓.对话周志华教授:关于人工智能和机器学习[J].科学通报,2017,62(33):3800-3801.

[7] 熊缨,西楠.中加人才引进与流动管理政策的比较研究[J].中国人力资源开发,2014,23(13):77-83.

[8] 曹俐,雷岁江.江苏省延揽海内外高层次人才政策现状与对策探讨[J].中国人才,2010,25(21):52-54.

Policy Research on Talents Staying in Wuhan Based on Decision Tree ID 3Algorithm

CHEN Xi ,MA Xiangping ,JIA Chengfeng ,ZHANG Jie

Abstract :In recent years, talents have become a source of competition in various places, and the government′s policies on attracting talents are endless, covering all aspects of society. Because the influence of subjective and objective factors on the attraction of talents is different, these factors have a complicated relationship with each other. In order to reveal this non-linear relationship and the key to predicting the talents left or not, the impact of the survey analyzes the attractiveness of the subjective and objective factors of talent retention in a second-tier city and in Wuhan and the attractive data base that affects the talents without objective factors. On the other hand, using the Python programming language, using the ID3 algorithm in machine learning, the sample is analyzed and the decision tree model is constructed. Furthermore, from the macro and micro perspectives, the strength of the attraction of different factors is cross-analyzed, and the analysis results of the importance degree of various policy variables affecting the development of talents in Wuhan are obtained. Comparing the existing talent retention policy in Wuhan, this paper analyzes the shortcomings of the existing talents′ policy of staying in China and puts forward corresponding countermeasures and suggestions.

Key words :talent introduction; policy research; decision tree; ID3 algorithm; influencing factors

文章编号: 2095-3852(2019)02-0148-06

文献标志码: A

中图分类号: C934

DOI: 10.3963/j.issn.2095-3852.2019.02.007

收稿日期: 2018-11-10.

作者简介: 陈茜 (1993-),女,湖北武汉人,中国地质大学(武汉)公共管理学院硕士研究生,主要研究方向为公共政策分析.

通讯作者: 马向平(1964-),女,山东安丘人,中国地质大学(武汉)公共管理学院教授,主要研究方向为公共政策分析.

基金项目: 国家自然科学基金项目(71402172).

CHEN Xi: Postgraduate; School of Public Administration, China University of Geosciences (Wuhan), Wuhan 430070, China.

标签:;  ;  ;  ;  ;  ;  ;  

基于决策树ID3算法的人才留汉吸引政策研究论文
下载Doc文档

猜你喜欢