(山东科技大学,山东,济南 25000)
摘要:在不同年、月的职业需求数据和不同的教育水平的中国学生通过相关系数判断预测精度,经多元线性回归方程求解职业需求与教育背景的线性部分,再由 BP 神经网络对非线性部分实现阴影匹配。其次, 在职业需求数量序列标准化后,通过马氏链对相关系数权重进行排序,权衡职业需求程度。最后,利用基于ARIMA 对非线性部分在当前情形下未来三年的就业需求进行预测。
关键词:BP 神经网络、马尔可夫链、系统聚类、差分整合移动平均自回归模型(ARIMA) 一、数据整理
首先,整理出不同年、月的职业需求和中国学生不同学历水平的数据,对我国学生的职业需求和受教育程度进行分类。
r是就业需求与教育背景之间的相关系数
R是就业总需求
x是不同教育背景下的员工人数
n是表达式中的变量数
Rx表示变量的算术平均值
?R?x表示变量的均方差
由 SPSS 统计数据经相关性分析后得到如下表一所示:
部分回归方程曲线拟合图示意图:
图二职业需求与高中拟合图图三职业需求与初中拟合图
简要性分析:从上图二和图三可以直观地看出,就业需求与高中教育和初中教育背景之间的相关性在线性拟合程度较 高。因此,由高中及初中学历程度去衡量可以更好地反映当前人才需求状况,在一定程度上除一线城市外,初中教育和中学教育背景是普通城市的主要职业需求。
四、基于BP 神经网络与马氏链的优化建模
BP 神经网络的建立及激活
“作为一种并行计算模型,当对象的结构和参数未知时,神经网络可以通过样本训练自适应地获取输入 和输出之间的非线性映射关系。” [1] 本文采用三层多输入和具有隐藏层的单输出 BP 网络用于建立预测模型。对于培训样本,处理后的职业岗位和需求数量数据文件被导入到 Python 程序中。职业岗位每列都作为数据集的训练层,每行代表神经元的数量。用于预测未来三年中三行业的就业需求。
输入层向量:
线性激活函数 Sigmoid 被 f’(x)=x’ 函数代替,由于 Sigmoid 函数的输出范围太,输出仅控制在 0 和 1 之间, 并且回归模型的输出范围更大。当训练样本的最大允许平方误差方值小于最大允许平方误差平方值时,停止训练,每次迭代都会更新权重和偏差;
图六 序列图
基于 ARIMA 的人才需求非线性预测模型建立
通过对多元线性回归方程和BP 神经网络的分析,得出部分人才需求市场的线性变化,部分人才需求为非线性变化。而实际人才需求是非线性变化。ARIMA 模型的非线性部分的回归模型为:
4.5 预测结论
未来三年就业需求的预测结论如下:基于马氏链及 ARIMA 预测模型及时间序列模型的人才需求非线性预测模型,结论为销售管理、技术工作、计算机软件、运营行业将成为较为热门的需求行业。
参考文献:
Menghua W,Employment Situation of China ’ s Provinces and Cities Based on Principal Component Analysis,Market Weekly,volume number:134-136,2018.
Huanhai.Y ,Intelligent Modeling and Simulation Analysis for Talent DemandForecasting[J]Computer Simulation,253-254,20
作者简介:
杨博文,山东科技大学信息管理与信息系统 2016 级学生。
论文作者:杨博文
论文发表刊物:《科技新时代》2019年3期
论文发表时间:2019/5/9
标签:需求论文; 模型论文; 神经网络论文; 职业论文; 线性论文; 人才需求论文; 数据论文; 《科技新时代》2019年3期论文;