在线数据揭示预期薪金的影响因素论文



在线数据揭示预期薪金的影响因素

王 军1*,高 见1,2,杨 枭1,3,刘金虎1,周 涛1,2

(1. 电子科技大学大数据研究中心 成都 611731;2. 成都新经济发展研究院 成都 610094; 3. 电子科技大学数学科学学院 成都 611731)

【摘要】数据资源的丰富和分析方法的创新,促使社会经济学逐渐转变为数据驱动的定量化学科。作为定量化人力资源的组成部分,薪金研究对社会经济发展有重要意义。然而,以往研究大多基于规模有限的普查数据,对不同经济和文化背景的考虑也不足。本文基于中国人力资源网站获取的大规模简历数据,分析了多种因素对求职者预期薪金的影响,结果发现身高、工作经验和教育程度等因素影响预期薪金,并且男女存在显著的差异。其中,女性平均预期低于男性,相比男性差大约五年工作经验或一个教育学位。最后,多变量回归方法验证了分析结果的鲁棒性。

关 键 词 大数据; 计算社会经济学; 数据驱动; 多变量回归; 预期薪金

数据资源和分析方法的创新为社会经济和人力资源管理等相关领域的定量化分析提供了新思路[1]。一方面,在线信息平台广泛收集和存储了大量的社会经济数据[2]。另一方面,跨学科交叉研究催生了很多新的分析工具[3]。利用这些新工具定量分析在线数据,能够揭示社会经济状态[4]、绘制全球贫穷地图[5]、刻画产业结构[6-7]、感知城市发展不平衡[8]、制定经济发展策略[9-10]、推断个体财富状况[11]和预测个体失业率[12-13]等。在定量化人力资源方面,不仅升职和离职对员工的发展很重要[14],薪金水平更加直接影响到员工的生活水平和工作热情,也进一步影响组织的工作效率[15]

薪金对社会经济发展有非常重要的作用,能够配置劳动力资源。反过来,薪金也受很多社会经济因素影响。在身高因素上,文献[16]发现薪金与身高呈非线性关系,高于平均身高的员工有明显的薪金优势;文献[17]发现增加10 cm身高能分别增加男性8%和女性13%的薪金;文献[18]发现身高对女性预期薪金的影响大于男性。在教育因素上,文献[19]发现受教育水平对收入有显著正向的影响;文献[20]发现我国教育水平和薪金收入总体上呈正相关关系;文献[21]发现高等教育率和教育公平对于改善收入平等性至关重要。在工作经验方面,文献[22]发现技术工人的企业任职和工作经验对薪金收入有正面作用;文献[23]发现有15~20年企业工作经验的、自然科学专业毕业的女博士拥有最高的薪金收入。

虽然已经有一些针对薪金影响因素的分析,但这些研究一般基于规模有限的问卷和普查数据[1],且大多关注单一变量的影响,针对中国背景下的研究也不足。中国虽然近些年经济发展快、经济复杂性高[24],但发展不平衡,直接影响不同地区的薪金水平。更为重要的是,以往的研究一般使用实际薪金数据,无法剔除职场中普遍存在的身高和性别歧视对薪金的影响[18]。如今,得益于互联网和信息技术的发展,已经能够获得非干预的大规模数据,可以全面分析预期薪金的影响因素。

本文基于人力资源网站收集的14余万求职者简历数据,分析了影响中国求职者预期薪金的核心因素。结果发现,预期薪金存在明显的性别差异,男性的平均预期薪金高于女性;求职者的身高、以往工作经验、受教育程度和期望工作地的经济发展水平对预期薪金有显著影响;最后,本文使用多变量回归验证了分析结果的鲁棒性。

1 数据与方法

1.1 数据描述

本文的简历数据来源于中国的两大人力资源服务商,即前程无忧网站(http://www.51job.com)和中华英才网站(http://www.chinahr.com)。求职者在使用人力资源服务平台寻找工作时,需要在线提交求职简历,公开个人基本信息和预期薪金,HR根据这些公开信息筛选合适的求职者。本文于2014年从这两大招聘网站上爬取公开的简历信息,涵盖来自中国大陆31个省份的142 190位求职者。

综上所述,采用棋盘格角点标定的方法对图像像素率进行求解,然后对SV与Harris两种算法进行结合,可以识别出像平面实际坐标,为以后的识别奠定良好基础。在不同的图像处理算法当中,采用分段线性函数进行转换可以很好地保留细节,采用改进以后的平滑滤波能起到最佳的效果,并且在多种边缘检测算法当中,以Sobel的吻合度为最高。

对于文明旅游,这些年,年年讲,依然有不文明现象屡屡发生:在景区文物上刻字、公共场所大声喧哗、因航班问题大闹机场;一些中国游客常常把国内的“不拘小节”带出国门,比如随处抛垃圾、在路边长椅上脱鞋脱袜子、走累了随处蹲下等;比如一些人我行我素,在国外一些公共场所,经常会有中文书写的“请勿大声喧哗”等警示牌,但仍有人大声说话;比如一些国人对于外国的文化和规定不以为然等。

为了保障样本数量中有足够的合理预期薪金的普通求职者,本文通过限定求职者的身高和预期薪金来筛选数据,剔除不符合限定的数据。其中,男性的身高范围限定为[160, 185] cm,女性的身高范围限定为[150, 175] cm;预期薪金的范围限定为[1 000, 50 000]元/月。如表1所示,使用数据涵盖141 064人,包括78 413位男性和62 651位女性;男性平均身高高于女性;男性的平均工龄和年龄都大于女性;男性的平均教育水平高于女性,男性毕业于更好的学校、取得更高的学位;男性的平均预期薪金为8 039元/月,明显高于女性的5 017元/月。

表1 简历数据的统计信息

注:学校和学位为向量化后的数值。

在对预期薪金进行自然对数运算之后,男性和女性的预期薪金呈现正态分布。也就是说,自然对数的预期薪金width=49.95,height=15服从以width=11,height=12为平均值、width=11,height=10为标准差的正态分布width=99,height=17。如图1所示,自然对数运算之后的预期薪金,可以很好地被正态分布拟合(width=63,height=17);男性的平均预期薪金(width=39,height=15)高于女性的平均值(width=39,height=15);男性的预期薪金分布更宽广(width=40,height=13),女性的预期薪金分布更集中(width=40,height=13)。

width=195.15,height=171.4

width=195.15,height=171.4

图1 预期薪金的分布(条形图表示频率分布,实线为正态拟合曲线)

预期薪金显著受到获得学位的影响。如图4b所示,随着学位的增加,平均预期薪金增加。女性的预期薪金比男性相差一个学位,如:女性硕士(master)与男性本科(bachelor)的预期薪金相当,女性博士(PhD)与男性硕士(master)的预期薪金相当。事实上,毕业院校和获得学位共同影响预期薪金。如图4c和图4d所示,工作经验对男女的影响有显著差异,男性预期薪金普遍高于女性。其中,“985”工程院校毕业的女性博士与“211工程”院校毕业的男性硕士有相近的预期薪金。

1.2 分析方法

在回归方程中,将女性width=39,height=15作为虚拟变量,其他解释变量与width=31.95,height=13形成交叉项(interaction term),所估计的回归方程如下:

整合结果表明:大多数护生在实习过程中有因欠缺沟通交流技巧而陷入尴尬境地的经历。建议实习院校一方面将“人际沟通”纳入必修课程,采用案例分析、情景模拟、角色扮演、情景剧表演等多元化教学手段,帮助护生有效掌握沟通内涵;另一方面增加实践课比重,切实锻炼护生临床沟通能力[29-30]。在带教过程中,带教老师应有意识地向护生讲授护患沟通经验,如明确回答病人询问内容、避开敏感话题、注意倾听病人家属意见、分享自身经验等[27];利用病史采集、健康宣教等机会引导护生与病人主动交流,让护生在实践中成长。

近十年来,世界经济的发展刺激了铜矿山产能不断扩张和铜冶炼技术能力的提升,铜冶炼产能飞速攀升。有数据显示2008年金融危机之后,中国精炼铜年产量从380万t提升至目前的1 015余万吨。目前,较大规模铜冶炼企业主要采用氧气顶吹+PS转炉吹炼、闪速熔炼+PS转炉吹炼以及闪速熔炼+闪速吹炼(简称“双闪”工艺)等火法冶炼工艺组合。

多变量分析方法采用普通最小二乘(ordinary least square, OLS)回归模型,被解释变量为预期薪金width=48,height=15,解释变量为影响预期薪金的各个变量。由于教育水平中的width=31,height=13width=31.95,height=15都是分类变量,所以将他们作为虚拟变量(dummy variable)引入回归模型。为了比较解释变量对于男性和女性预期薪金的影响,分析男性和女性回归结果的截距和斜率差异,本文在混合样本(pooled sample)上进行回归,控制男性和女性在回归分析中的残差变化一致。

在挖掘预期薪金的核心影响因素方面,首先采用统计分析方法,分析单个或同一类变量对预期薪金width=48,height=15的影响,包括身高(width=31,height=15)、工作经验(width=18,height=12width=40,height=15)、教育程度(width=31,height=13width=31.95,height=15)和地理经济(width=35,height=15)等相关变量。然后,使用多变量回归分析方法验证结果的鲁棒性,并比较各个变量对预期薪金影响的性别差异。

1.4 数据处理 调查数据采用Excel、SPSS统计软件进行数据的录入、管理与统计分析。统计分析采用描述性统计分析[11]。

width=171,height=114.95

预期薪金与地理经济状况紧密相关。一般而言,期望工作地的经济发展水平越高,求职者的预期薪金越高。如图5a和图5b所示,不论对于男性还是女性,他们的平均预期薪金都随着期望工作地人均GDP的增加而增加,即两者存在显著的正相关。其中,男性的皮尔森相关系数(width=51,height=13)大于女性的皮尔森相关系数(width=51,height=13),说明男性预期薪金与期望工作地经济发展水平更加相关。线性拟合的结果显示,男性拟合直线的斜率(width=70,height=15)大于女性拟合直线的斜率(width=70,height=15),说明期望工作地的经济水平对男性预期薪金的影响大于女性。

2.3.5 发表偏倚分析 本文采用了漏斗图来检测研究是否存在潜在偏倚。漏斗图未发现明显不对称,表明研究未存在明显的发表偏倚。见图6。

2 实验结果

实验中首先依次分析身高、工作经验、教育水平和经济地理对男女预期薪金的影响,考虑单个或同一类变量的作用。然后,利用多变量回归模型,验证分析结果的鲁棒性,定量刻画和比较男女预期薪金影响因素的不同,侧重于性别差异。

2.1 身高的影响

首先,考虑男性和女性求职者的身高分布。如图2a和图2b所示,男女的身高频率分布都可以很好地通过正态分布拟合width=72,height=17,但男性和女性的身高分布存在明显差异。具体而言,男性的平均身高width=56,height=15显著高于女性的平均身高width=56,height=15;男性身高的分布更宽广width=47,height=15,而女性身高的分布更狭窄width=47,height=15

width=221.75,height=173.5

width=221.75,height=173.5

width=221.75,height=173.5

width=221.75,height=173.5

图2 身高对预期薪金的影响(a、b中条形图为概率分布,实线为正态拟合曲线;c、d中条形图为平均值,误差线为标准误,实线为拟合直线)

然后,分析身高对预期薪金的影响。如图2c和图2d所示,平均预期薪金与平均身高呈现线性关系(男性:width=65,height=17,女性:width=65,height=17)。不论对于男女,求职者的平均身高越高,平均预期薪金越高,存在Height Premium现象[25-26]。女性拟合直线的斜率(width=64,height=15)显著高于男性拟合直线的斜率(width=65,height=15),说明身高对女性预期薪金的影响大于身高对于男性预期薪金的影响。

简历数据主要是求职者主动公开的个人信息,包括性别(gender)、出生日期、身高(height)、工作经历、毕业院校(school)、获得学位(degree)、求职省份和预期薪金(salary)。根据出生日期,计算得到年龄(age);根据工作经历,计算得到工龄(seniority)。毕业院校根据教育部文件分为4类进行数值化:4代表“985工程”院校(985 PRG),3代表“211工程”院校(211 PRG),2代表普通高等院校(college),1代表其他院校(others)。获得学位分为4类,同样进行数值化:4代表博士学位(PhD),3代表硕士学位(master),2代表学士学位(bachelor),1代表其他学位(others)。求职省份涵盖31个中国大陆的省份、直辖市和自治区,省份名称和缩写见文献[18]。

2.2 工作经验的影响

通过年龄和工龄(width=18,height=12width=40,height=15)来近似估计求职者的工作经验,两者数值越大,则代表工作经验越丰富。如图3a所示,随着平均年龄的增加,平均预期薪金增加,男女预期薪金的差异也增大。其中,21~25岁男性平均预期薪金与26~30岁女性相当,31~35岁男性平均预期薪金与41~45岁女性相当。如图3b所示,以37岁左右为界,预期薪金首先随着年龄的增加而线性增长,然后稳中有增。

width=200.75,height=164.4

width=202.85,height=163.7

width=200.75,height=164.4

width=202.85,height=163.7

图3 工作经验对预期薪金的影响(误差线表示标准误,竖直虚线对应曲线拐点处的年龄和工龄)

工龄同样显著影响预期薪金。如图3c所示,随着平均工龄的增加,平均预期薪金增加,男女的差异基本保持一致。如果男女要有相近的预期薪金,那么女性比男性要增加5年以上的工龄。其中,1~5年工龄男性平均预期薪金与6~10年工龄女性相当,6~10年工龄男性平均预期薪金与11~15年工龄女性相当。如图3d所示,以15年工龄为界,预期薪金首先随着工龄则增加而线性增长,然后基本保持平稳。

2.3 教育程度的影响

通过毕业院校width=38,height=15和获得学位width=38,height=15来估计求职者的教育程度,分析预期薪金受教育程度的影响。如图4a所示,求职者的毕业院校越好,平均预期薪金越高。毕业院校对男女预期薪金的影响存在显著差异,普通高校(college)毕业的男性与“985工程”院校(985PRG)毕业的女性有相近的预期薪金,其他院校(others)毕业的男性与“211工程”院校(211PRG)毕业的女性有相近的预期薪金。

除了简历数据,后续分析还使用了省份的经济发展数据,来源于《中国统计年鉴-2015》,由国家统计局(http://www.stats.gov.cn)编纂,发布全国31个省份在2014年的人均生产总值(GDPpc)数据。

width=164.4,height=134.35

width=164.4,height=134.35

width=183.25,height=165.1

width=183.25,height=163.7

图4 教育水平对预期薪金的影响(a、b中条形图表示平均值,误差线表示标准误)

2.4 地理经济的影响

式中,width=48,height=13对应于基准的男性组;width=11,height=15为解释变量对于男性预期薪金的回归系数;width=10,height=13为相应解释变量在男女回归系数上的差异;width=28,height=13.95为学校的虚拟变量;width=28,height=13.95为学位的虚拟变量;width=9,height=10为误差项。

心智行动悖境在心智行动中形成,在主体实际的客观互动中,同样会出现悖境。互动是主体根据彼此的关系行动,其中也包含心智行动的因素⑥。正如冯·诺依曼(John von Neumann)和摩根斯坦(Oskar Morgenstern)所指出的,对某个事件的信念是可以测度的,因为该信念是导致相应行动的基础⑦。一个互动状态要求主体的决策和行动一致,决策是内在的,个体决策的程序依赖于个体的心智意向。由于信念的驱动和动机的召唤,个体愿意去参与群体行动。

width=164.4,height=134.35

width=164.4,height=134.35

width=175.55,height=134.35

width=175.55,height=134.35

图5 地理经济对预期薪金的影响(a、b中实线为拟合直线,数据标签为省份缩写;c、d中期望工作地人均GDP从高到低等分为4段:Top、Upper、Lower和Bottom;条形图表示平均值,误差线为标准误)

为了更加细致地分析期望工作地的经济发展水平对求职者预期薪金的影响,将预期工作地按照人均GDP从高到低等分为4段,计算相应期望工作地的平均预期薪金。如图4c和图4d所示,男性和女性的结果有同样的规律。具体而言,求职者在经济发展水平后50%的期望工作地(即Lower和Bottom)有相同的预期薪金,随着期望工作地经济发展水平提高到前50%(即Upper和Top),预期薪金显著增加。

2.5 结果鲁棒性检验

为了检验分析结果的鲁棒性,定量对比解释变量对男性和女性预期薪金影响上的差异,在男女混合样本上采用多变量回归模型。回归分析中的被解释变量为预期薪金width=48,height=15,解释变量包括身高(width=31,height=15)、工作经验(width=18,height=12width=40,height=15)、教育程度(width=31,height=13width=31.95,height=15)和地理经济(width=35,height=15)。其中,width=31,height=13width=31.95,height=15作为虚拟变量引入回归方程。

表格1总结了回归分析结果。在没有控制任何其他变量时,从表格第1列看到,身高对于男性预期薪金有显著正向的影响(width=57,height=16),身高对女性的影响显著高于男性(width=55,height=16),女性的平均预期薪金显著低于男性(width=60,height=16)。当只考虑工作经验的影响时,从表格第2列看到,年龄对男性有显著正向影响(width=57,height=16)的同时,工龄有显著负向影响(width=57,height=16);年龄对女性的影响显著小于男性(width=62,height=16)。当同时考虑身高和工作经验的影响时,如表格第3列所示,男女的平均预期薪金没有显著差异。当增加考虑教育程度时,从表格第4列看到,身高的影响降低,男女差异不显著;年龄的影响降低,工龄的影响增加但男女差异不显著。

表2 预期薪金的最小二乘法回归分析结果

变量OLS Regression Model with Dependent Variable: log(salary) (1)(2)(3)(4)(5)(6)(7)(8) female-1.243 1***0.018 2-0.151 40.019 5-3.469 6***-3.628 0***-3.145 5***-1.718 0*** (0.128 1)(0.026 5)(0.118 1)(0.173 9)(0.084 5)(0.142 3)(0.193 2)(0.178 6) height0.007 2***0.011 6***0.009 2***0.005 4***0.003 0***0.007 5*** (0.000 5)(0.000 4)(0.000 4)(0.000 5)(0.000 4)(0.000 4) female·height0.005 7***0.002 0***0.000 30.002 2***0.001 0-0.002 1*** (0.000 8)(0.000 7)(0.000 7)(0.000 8)(0.000 7)(0.000 6) age0.070 6***0.071 1***0.048 1***0.048 2*** (0.000 6)(0.000 6)(0.000 7)(0.000 7) female·age-0.009 9***-0.010 4***-0.008 3***-0.010 5*** (0.001 0)(0.001 0)(0.001 1)(0.001 1) seniority-0.003 0***-0.002 6***0.020 5***0.020 9*** (0.000 7)(0.000 7)(0.000 7)(0.000 7) female·seniority-0.002 2*-0.002 3**-0.001 4-0.000 2 (0.001 2)(0.001 2)(0.001 2)(0.001 2)

(续表)

注:回归分析在男女混合样本上使用基于最小二乘的多变量回归模型,female=0对应于基准的男性组。DschoolDdegree分别表示毕业院校和获得学位的虚拟变量。如果标记为YES,则表示考虑在回归分析中;如果标记为NO,则表示没有考虑在回归分析中。表格中是变量的回归系数,括号中是标准误。统计显著性水平为:*p<0.1,**p<0.05,***p<0.01。

当仅考虑期望工作地经济发展水平时,如表格第5列所示,人均GDP显著正向影响平均预期薪金(width=55,height=16),对于女性的影响程度显著高于对于男性的影响程度(width=56,height=16)。当增加考虑身高和教育水平的影响时,这些结果得到保持(见表格第6列和第7列)。当考虑所有解释变量的影响时,如表格第8列所示,女性的预期薪金显著低于男性(width=62,height=16);身高、年龄、工龄和经济地理都对预期薪金有显著正向影响。其中,身高和年龄对女性影响小于男性,工龄对男女的影响没有显著差异,经济地理对女性影响大于男性。所有的解释变量在一起,能够最大程度的解释预期薪金,解释能力可以达到width=78,height=17,即所有变量可以解释37.62%的预期薪金的变化。

《水上飞机》一文中有这么一句话:“在茫茫的大海上,小海鸥发现了一条奇怪的大船:白色船体的两边长了两个大翅膀。”

3 结束语

本文基于求职者简历数据对预期薪金的影响因素进行了全面的分析。结果发现,性别、身高、工作经验、教育程度和地理经济等因素显著影响求职者的预期薪金。具体而言,男性的平均预期薪金高于女性;身高与平均预期薪金正相关,身高对女性的影响大于男性;平均预期薪金随年龄和工龄的增加而增加,但达到37岁年龄和15年工龄之后保持稳定;毕业院校越好、获得学位越高,预期薪金越高,并且女性预期薪金与男性相比相差一个学位;期望工作地经济发展水平越高,求职者预期薪金越高。多变量回归分析结果显示,性别对预期薪金的影响显著,身高和年龄对女性影响小于男性,工龄的影响没有显著差异,经济地理对女性影响大于男性。

单变量以及回归分析结果显示,男性和女性在预期薪金上存在显著差异。如果男性和女性要达到相近的预期薪金,在工作经验上,女性需要比男性要增加5年以上的工龄,如:有6~10年工龄的女性与有1~5年工龄的男性有相近的预期薪金;在教育程度上,女性需要比男性多读一个学位,如:女性硕士与男性学士有相当的预期薪金。

性别不平等问题一直是社会关注的热点之一。本文的分析结果也揭露出职场中潜在存在的性别不平等现象[27]。在呼吁社会共同努力消除男女不平等的同时,更希望女性同胞增加职场自信。在性别和身高等先天条件不能改变的情况下,通过增加工作经验和教育经历来提升自身能力,更加自信和主动地争取职场平等待遇。

参 考 文 献

[1] Einav L, Levin J. Economics in the age of big data[J]. Science, 2014, 346(6210): 1243089.

[2] Pentland A. Social physics: How social networks can make us smarter[M]. London: Penguin, 2015.

[3] Barabási A L. Network science[M]. New York: Cambridge University Press, 2016.

[4] 高见, 周涛. 大数据揭示经济发展状况[J]. 电子科技大学学报, 2016, 45(4): 625-633.

GAO Jian, ZHOU Tao. Big data reveal the status of economic development[J]. Journal of University of Electronic Science and Technology of China, 2016, 45(4): 625-633.

[5] Blumenstock J, Cadamuro G, On R. Predicting poverty and wealth from mobile phone metadata[J]. Science, 2015, 350(6264): 1073-1076.

[6] Hidalgo C A, Klinger B, Barabási A L, et al. The product space conditions the development of nations[J]. Science, 2007, 317(5837): 482-487.

[7] Gao J, Jun B, Pentland A, et al. Collective learning in China's regional economic development[EB/OL]. (2017- 03-04). http://arxiv.org/abs/1703.01369.

[8] SALESSES P, SCHECHTNER K, HIDALGO C A. The collaborative image of the city: Mapping the inequality of urban perception[J]. PLoS One, 2013, 8(7): e68400.

[9] Alshamsi A, Pinheiro F L, Hidalgo C A. Optimal diversification strategies in the networks of related products and of related research areas[J]. Nature Communications, 2018, 9(1): 1328.

[10] Gao J. Maximizing the collective learning effects in regional economic development[C]//2017 14th International Computer Conference on Wavelet Active Media Technology and Information Processing (ICCWAMTIP). Chengdu, China: IEEE, 2017: 337-341.

[11] Luo S, Morone F, Sarraute C, et al. Inferring personal economic status from social network location[J]. Nature Communications, 2017, 8: 15227.

[12] YUAN J, ZHANG Q M, GAO J, et al. Promotion and resignation in employee networks[J]. Physica A, 2016, 444: 442-447.

[13] Llorente A, Garcia-Herranz M, Cebrian M, et al. Social media fingerprints of unemployment[J]. PLoS One, 2015, 10: e0128692.

[14] 高见, 张琳艳, 张千明, 等. 大数据人力资源: 基于雇员网络的绩效分析与升离职预测[M]//刘怡君. 社会物理学: 社会治理. 北京: 科学出版社, 2014: 38-56.

GAO Jian, ZHANG Lin-yan, ZHANG Qian-ming, et al. Big data human resources: Performance analysis and promotion resignation in employee networks[M]//LIU Yi-jun. Social Physics: Social Governance, Beijing: Science Press. 2014: 38-56.

[15] Pfeffer J, Langton N. The effect of wage dispersion on satisfaction, productivity, and working collaboratively: Evidence from college and university faculty[J]. Administrative Science Quarterly, 1993, 38(3): 382-407.

[16] Hübler O. The nonlinear link between height and wages in Germany, 1985-2004[J]. Economics and Human Biology, 2009, 7(2): 191-199.

[17] Sohn K. The height premium in Indonesia[J]. Economics and Human Biology, 2015, 16: 1-15.

[18] Yang X, Gao J, Liu J H, et al. Height conditions salary expectations: Evidence from large-scale data in China[J]. Physica A, 2018, 501: 86-97.

[19] WEI X, TSANG M C, XU W, et al. Education and earnings in rural China[J]. Education Economics, 1999, 7(2): 167-187.

[20] 马范文. 教育程度与工资收入相关性的中外比较[J]. 广州大学学报: 社会科学版. 2002, 1(4): 90-93.

MA Fan-wen. Correlation between education and salary abroad and in China: a comparative study[J]. Journal of Guangzhou University (Social Science Edition), 2002, 1(4): 90-93.

[21] Gregorio J D, Lee J W. Education and income inequality: New evidence from cross-country data[J]. Review of Income and Wealth, 2002, 48(3): 395-416.

[22] Dustmann C, Meghir C. Wages, experience and seniority[J]. The Review of Economic Studies, 2005, 72(1): 77-108.

[23] Alsulami H. The effect of education and experience on wages: the case study of Saudi Arabia[J]. American Journal of Industrial and Business Management, 2018, 8(1): 129-142.

[24] Gao J, Zhou T. Quantifying China’s regional economic complexity[J]. Physica A, 2018, 492: 1591-1603.

[25] HEINECK G. Up in the skies? The relationship between body height and earnings in Germany[J]. Labour, 2005, 19(3): 469-489.

[26] KIM T H, HAN E. Height premium for job performance[J]. Economics and Human Biology, 2017, 26: 13-20.

[27] Ding W W, Murray F, Stuart T E. Gender differences in patenting in the academic life sciences[J]. Science, 2006, 313(5787): 665-667.

Online Data Reveal Key Factors on Salary Expectation

WANG Jun1*, GAO Jian1,2, YANG Xiao1,3, LIU Jin-hu1, and ZHOU Tao1,2

(1.Big Data Research Center, University of Electronic Science and Technology of China Chengdu 611731; 2. Institution of New Economic Development Chengdu 610094; 3. School of Mathematical Sciences, University of Electronic Science and Technology of China Chengdu 611731)

AbstractThe enrichment of data resources and the innovation of analytic methods are gradually facilitating the transformation of socioeconomics into a data-driven and quantitative discipline. As a part of quantitative human resources, the investigation of salary has a significant role on social and economic development. However, previous studies are mainly based on census data with limited sizes and lack of considerations in a different economic and cultural background. Based on large-scale resume data that were crawled from websites of Chinese human resource service providers, this paper analyzes key factors on job seekers’ salary expectation. Results suggest that height, working experiences, and educational degree affect salary expectation, and there are significant gender differences. In particular, females have lower salary expectation on average and lag behind males for five years’ working experience or one educational degree. Finally, the robustness of the analytical results is checked using the multivariate regression method.

Key words big data; computational socioeconomics; data-driven; multivariate regression; salary expectation

中图分类号TP391

文献标志码A

doi:10.3969/j.issn.1001-0548.2019.02.023

收稿日期:2018 – 05 – 10;

修回日期:2018 – 08 – 30

基金项目:国家自然科学基金(61703074, 61673086)

作者简介:王军(1988- ),男,博士生,主要从事大数据分析等方面的研究. E-mail:junwang31@gmail.com

编 辑 蒋 晓

标签:;  ;  ;  ;  ;  ;  ;  ;  

在线数据揭示预期薪金的影响因素论文
下载Doc文档

猜你喜欢