健康对非农就业及其工资决定的影响,本文主要内容关键词为:非农论文,工资论文,健康论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、健康与收入关系研究的简要综述
在中国,健康被视为个人的事情,只有全国性的公共卫生事业才是政府的责任。而在城镇就业者中实行的健康保障制度长期以来更被视为社会福利事业的一部分。正因为如此,健康对就业乃至收入的作用长期以来被人们所忽视。
与公共卫生管理专家以及健康社会学家不同,经济学家对健康的认识来自人力资本学派的理论。在该理论中,健康与教育、培训、迁徙一起构成人力资本的四大部件。基于这样的认识,国外关于健康与就业和收入的实证研究在劳动经济学和健康经济学中一直占据着重要的地位。
随着计量经济学的发展,研究健康与收入关系的方法也在不断进步,从早期简单的OLS分析(Luft,1975;Bartel & Taubman,1979;Benham & Benham,1982)发展到后来的联立方程估计(Lee,1982;Ettner et al,1997)以及Heckman两阶段估计模型(Chiricos & Nestal,1985;Baldwin & Johnson,1994;Stern,1996)等,得到的结论大多有力地支持了健康对就业或收入的影响。但他们所使用的健康指标随研究内容的差异而有所不同,而且即便是同样类型的研究,所使用的指标仍然或多或少地存在这样或那样的差异,因此,尽管此类实证研究很多,但还无法清晰地给出健康对就业以及收入影响的全貌。换言之,这是一个正有待于研究者进行不断探索的领域。
与其他经济学分析一样,健康与收入关系的研究最初大多集中在工业化国家,相对而言,对于发展中国家和转型国家健康和就业以及收入间关系的研究还比较少。针对发展中国家和转型国家进行的研究又存在两种研究思路。一种以家庭农业和种植业作为研究对象,使用家庭生产函数进行分析(Strauss,1986)。国内第一篇、也是此前国内唯一一篇研究健康与收入关系的文章(张车伟,2003)就沿袭了这样的研究思路。该文章采用多种健康指标,利用家庭生产函数对贫困地区的种植业进行分析,得出健康对种植业生产具有显著影响的结论。另一种研究思路则着重于工资(收入)函数的研究,主要对工资性就业及其收入进行研究。上述对工业化国家进行的研究大多采用了这样的分析手段。当然,它同样适用于发展中国家和转型国家的研究,如Schultz与Tansel(1997)对科特迪瓦和加纳的研究,以及Ivaschenko(2003)对乌克兰的研究等,但在对中国的相关研究中,尚没有出现此类分析。
与张车伟(2003)的研究不同,本文以我国农村居民非农就业参与和工资决定作为研究对象,很自然地,将采用工资函数的分析方法。考虑到可能出现的选择性偏误,本文使用Heckman模型而不是联立方程模型。本文的结构如下:第二部分对本文所使用的数据及其实证分析方法进行介绍;第三部分是本文的主体部分,对健康变量的生成、健康对非农就业参与的影响以及对工资决定的影响进行实证分析,并在此基础上进行一些讨论;最后是一些强力检验和本文的总结。
二、数据及方法
1.数据简介和研究对象的选择
本研究所使用的数据来自中国预防科学研究院营养与食品卫生研究所进行的“中国经济、人口、营养与健康调查”(以下简称“营养调查”)。该调查始于1989年,以后又分别在1991年、1993年、1997年各进行了一次。本调查尽可能选取同样的样本户,覆盖了全国8个省区的城市和农村地区。我们从中选取1993年的农村数据作为本研究的基本数据。
该调查的抽样方法始于1989年的第一次调查,其最初的抽样方法如下:在全国抽取8个省区——辽宁、江苏、山东、河南、湖北、湖南、广西和贵州,覆盖了东中西三类地区的农村;在每个省区选择4个县——1个高收入县,2个中等收入县,1个低收入县;在每个县抽选1个县城镇和3个非县城镇的村落,3个村落又分别代表了该县的高中低三种收入情况,调查共覆盖32个县城镇和96个村庄;在每个村庄抽取20户作为调查对象。1989年—1997年农村调查的全部样本户大体保持在2560户左右。其中1993年的调查样本包括了9978条个人数据,其中16岁以上的人口为7241条,占全部样本的72.6%;16—65岁的人口为6683条,约占全部样本的67%。根据以上描述,我们认为该调查基本上代表了全国农村的情况。
由于中国的农业生产具有以一家一户为单位的特征,并且没有清晰的退休年限,因此有一些60岁以上的农村居民仍然从事农业或其他生产活动,也有极少数未成年的儿童参与了农业生产,一些残疾人口也同样参与劳动。根据中国农村的义务教育情况,我们初步设定以16—65岁年龄段的人口作为考察对象,而将所有汇报了非农就业收入的个人作为工资方程的考察对象。样本描述性统计见表1。
表1 样本描述性统计
┌────────────┬─────┬──────┐
││全部样本 │农业人口│
├────────────┼─────┼──────┤
│样本数 │6683 │ 5054 │
├────────────┼─────┼──────┤
│非农劳动参与人数│1461 │
588 │
├────────────┼─────┼──────┤
│非农就业人员月工资(元)│
241.22 │ 218.19│
├────────────┼─────┼──────┤
│生理因子│
0.077 │
0.087│
├────────────┼─────┼──────┤
│心理因子│
0.013 │
0.017│
├────────────┼─────┼──────┤
│男性│
0.506 │
0.501│
├────────────┼─────┼──────┤
│非农户口│
0.241 ││
├────────────┼─────┼──────┤
│少数民族│
0.152 │
0.166│
├────────────┼─────┼──────┤
│年龄│
35.97 │
35.44│
├────────────┼─────┼──────┤
│在婚人口│
0.704 │
0.701│
├────────────┼─────┼──────┤
│教育年限│
5.984 │
5.549│
└────────────┴─────┴──────┘
2.实证分析方法
在本文的实证分析中,健康被视为一个复合的概念,无法通过观测直接获得。根据本文研究的需要,健康状况通过对一系列指标进行因子分析获得,从而本文所使用的健康测度为多维的连续变量。在国外的同类研究中,使用因子分析提取健康指标的方法也被广泛使用(Baldwin & Johnson,1994;Van de Ven & Hooijmans,1991)。
由于非农就业很可能存在选择性偏误(Selection-Bias)问题,本文采用了Heckman两阶段估计模型进行分析,具体方法表述如下。
当对劳动供给、工资及收入等进行估计时,最为直接的方法是普通最小二乘法(OLS),设
其中Y[,i]为观测到的劳动供给、工资和收入等,(注:本文采用了它们的对数形式。)X[,i]为解释变量,如教育、经验和健康等。但由于所观测到的参与者并非样本总体的随机选择,因此这种选择可能导致有偏的系数估计,即出现“选择性偏误”。Heckman注意到在OLS估计中样本选择问题可能导致系数估计值存在偏差,在一篇影响很大的论文(Heckman,1979)中他提出了自己的解决方案。这种新的模型估计被称为Heckman备择模型(Heckman Selection Model),该模型的估计分为两个阶段进行。
首先以“是否参与非农个人劳动”作为第一阶段估计的被解释变量,使用全部参数对16—65岁全部人口进行Probit估计,以确定参与非农劳动的决定因素。
其中,为某事件发生的概率,它可以由一系列因素解释,Z[,i]为解释变量,γ为待估参数,u[,i]为随机扰动项。
其次,考虑到在OLS估计中可能存在选择性偏误,所以需要从Probit估计式中得到转换比率(Inverse Mills Ratio)λ,作为第二阶段的修正参数。λ由以下公式获得:
其中φ(·)为标准正态分布的密度函数,Φ(·)为相应的累积分布函数。
最后,利用OLS方法对方程进行估计,使用λ作为方程估计的一个额外的变量以纠正选择性偏误,即
其中α为待估系数。如果该系数是显著的,则证明选择性偏误是存在的;反之,则表明选择性偏误不存在,在这种情况下,就可以认为OLS估计是有效的。(注:根据笔者初步检索的资料,国内使用Heckman模型进行估计的文献不算很多,较早的应用见于朱玲和蒋中一(1994),近期的研究如都阳(2001)。)
基于人力资本模型出发,本研究使用年龄作为经验的代表,以受教育年限作为人力资本的一个变量,以获得的健康因子作为人力资本的另一个变量,即在经典的Mincer方程中加入健康变量。由于中国劳动力市场的情况千差万别,本研究加入了其他一些控制变量以获得对劳动工资决定更为准确的估计,这些控制变量包括性别、户籍身份(注:本研究数据包括了部分县城的居民,所以存在一部分非农户籍人口。)及所在地区等。而在劳动参与估计方程中,我们进一步加入民族、婚姻、家庭中儿童数量以及家庭经营占用时间作为解释变量。
最后需要说明的是,本研究的统计分析使用了STATA软件。
三、实证分析及其解释
1.健康的测度
由于缺乏直接可用的测度标准,健康指标的客观性始终困扰着健康经济学家们。如同能力评价的偏差一样,在健康经济学研究中,健康测度的偏差最终会导致研究结果的偏差。因而在所有的健康经济学研究中,首先要解决的问题是健康的测度问题。
由于健康测度的复杂性,所有健康经济学研究不可避免地要对所使用的健康指标进行说明,本文也不例外。正如前文提到的,健康经济学研究中使用的健康指标林林总总,归纳起来大体包括这样一些指标:死亡率和儿童死亡率、寿命和预期寿命、健康自评(SRHS或SRH、SSH)、健康(赋权)得分、因病损失的工作时间、工作受限、残疾、疾病种类以及本文使用的健康因子等。
运用因子分析的方法进行多维健康指数的构造有这样一些优势:比起所谓的客观指标,如因病离开等,它较为综合,也更接近健康的内涵;同健康评价等主观指标相比,它又是一个连续变量;同时,它避免了赋权的主观性,从而更加客观。但它也具有自身无法克服的问题:首先,由于因子提取来自数据本身,因而同样的健康因子在不同的研究之间不具有可比性;其次,该研究的成功与否首先取决于能否提取合理的、尽可能少的健康因子;另外,对健康因子的估计系数不够直观,而且缺乏量化的实际意义,从而在政策研究方面缺乏优势。
为比较不同健康指标的敏感性,本文根据问卷调查的指标体系,采用了多种健康指标:健康自评、健康因子测度、健康测度打分以及健康受限天数等。本文将以健康因子作为主要的分析变量,而将基于其他健康指标的估计结果用于强力检验。
1993年的营养调查设计了有关个人健康状况的6个问题,这6个问题又分别涉及了生理和心理方面的功能,具体为:“心肺和腹部功能”、“上肢、肩部、后背和颈部功能”、“下肢和脊髓功能”、“听说和视力功能”、“大小便是否失禁”、“精神和心理是否存在问题”等。答案分为四级,从1至4分别为:“正常”、“偶尔失能(无需他人帮助)”、“经常失能(需要他人帮助)”、“功能完全丧失”。
根据上面的测度可知,所有变量的变化都是同方向的,但这些变量数值越大,则健康状况就越差。为了符合多数人的习惯,更好地代表健康状况,使健康因子与健康状况同方向变化,本文对所有答案重新进行了标准化,即1—4按顺序分别为“功能完全丧失”、“经常失能”、“偶尔失能”、“正常”。本文在此基础上进行了因子分析工作,根据因子提取的一般原则,提取两个特征值超过1的因子作为健康因子。为更好地分离并强化各因子的作用,本文又使用了Varimax旋转方法对因子矩阵进行正交化旋转,进而得到旋转后的因子矩阵(见表2)。
表2 旋转后的因子矩阵
┌───────────┬──────┬──────┐
│ │
Health1 │
Health2 │
├───────────┼──────┼──────┤
│心肺和腹部│
0.5710
│
0.0055
│
│上肢、肩部、后背和颈部│
0.7820
│
0.0080
│
│下肢和脊髓│
0.7660
│
0.0284
│
│听说和视力│
0.5360
│
0.3160
│
│大小便失禁情况│
0.0237
│
0.7280
│
│精神和心理问题│
0.0594
│
0.6960
│
└───────────┴──────┴──────┘
从表2中可以发现,在6个构筑健康测度指标体系的变量中,5个变量的系数明显地两极分化了,这为两个健康指数的解释提供了方便。其中“心肺和腹部功能”、“上肢、肩部、后背和颈部功能”、“下肢和脊髓功能”3个变量对于Health1的影响比较大,并且方向一致,可以合理地将Health1解释为与行动有关的健康指数,本文称之为“生理因子”。“大小便失禁情况”和“精神及心理问题”这2个变量对Health2的解释力较强,并且方向一致,可以合理地将Health2解释为与精神和神经系统有关的因子,本文称之为“心理因子”。而“听说和视力功能”这个指标既可能对行动产生影响又大多由神经系统的问题导致,因而本身就与两者都存在关系。由于进行了重新标准化的工作,所以因子得分越高,表明健康状况越好。
2.非农就业参与率的研究
基于Heckman模型第一阶段估计的方法,我们使用Probit模型分别对全体样本以及农业户籍人口的非农就业参与进行估计。所使用的解释变量为:1=参与非农就业,0=不参与非农就业。所得结果见表3。
表3 非农就业参与方程的系数估计
┌─────────┬───────────┬───────────┐
│ │
全体样本
│ 农业户籍人口│
├─────────┼─────┬─────┼─────┬─────┤
│ │
系数
│
t值│
系数
│
t值│
├─────────┼─────┼─────┼─────┼─────┤
│生理因子 │
0.164 │
4.43
│
0.197 │
3.36
│
│心理因子 │
0.030 │
1.07
│
0.030 │
0.59
│
│男性 │
0.262 │
5.58
│
0.201 │
3.35
│
│非农户口 │
0.870 │ 16.93
│ │ │
│少数民族 │ -0.374 │ -4.53
│ -0.372 │ -3.56
│
│年龄 │
0.181 │ 12.33
│
0.105 │
5.56
│
│在婚 │
0.093 │
1.15
│
0.089 │
0.87
│
│受教育年限│
0.097 │ 11.71
│
0.102 │
9.40
│
│年龄平方 │ -0.002 │ -12.90
│ -0.001 │ -5.52
│
│15岁以下儿童数量 │ -0.092 │ -3.32
│ -0.079 │ -2.40
│
│家庭经营时间 │ -0.032 │ -21.47
│ -0.030 │ -18.09
│
│省虚拟变量(略) │ │ │ │ │
│常数项│ -4.357 │ -17.67
│ -3.124 │ -10.23
│
│样本量│6006 │ │4478 │ │
│X[2]检验值│2500 │ │ 947 │ │
│X[2]显著性│
0.000 │ │
0.000 │ │
│最大似然率│
-2332 │ │
-1625 │ │
│虚拟R[2] │ 0.3489 │ │ 0.2257 │ │
└─────────┴─────┴─────┴─────┴─────┘
从表3中可以看出,在各解释变量中,只有婚姻和心理因子两项不显著。在婚状态对于非农就业参与的影响并不显著,这在很大程度上与非农就业者相对年轻有关。另外,心理因子的系数不显著也是比较合理的,因为在一个劳动力市场上,生理因子是比较容易识别的,如是否残疾、是否身体单薄、甚至身体高度等,但心理因素就不那么容易识别,除一些明显的精神类疾病外,即便那些间歇性的精神类疾病也是很难被识别的。
在各主要的解释变量中,教育对非农就业起到了明显的正向作用,即在劳动力市场需求中,教育对就业的影响变得显著,较高的教育年限意味着较多的非农就业机会。同时,生理因子的作用变得更强,系数也增大了。综合这两个因素,笔者认为在非农就业问题上,人力资本确实起到了重要的作用。
另一个发生明显变化的是制度变量——户籍身份。我们看到,在方程中,非农户口的系数为正,不仅系数很大而且相当显著。这表明,在广义的农村(注:广义的农村指县及县以下的地区,其居民既包括农业户口的人口也包括非农户口的人口。)中,在非农就业市场上,二元结构依然清晰可见,拥有城镇户口的居民比没有城镇户口的居民有更多的机会参与非农就业。
在传统的农业社会中,性别对于劳动参与的影响一般是比较显著的,即男性作为主要的劳动力参与农业生产,而社会分工决定了女性较多地负担无经济收入的家务劳动,从而较少参与农业生产活动。在非农就业问题上,性别依旧是一个显著的因素,这是由劳动力市场需求决定的。1993年,服务业还不是很发达,非农的劳动力市场对农村劳动力的需求主要集中在一些重体力劳动领域,如制造业和建筑业,这些对身体素质要求较高的行业决定了男性在劳动力市场上的重要地位,男性因此具有了比女性更多的就业机会。当时的非农就业的行业特征也有助于解释生理因子在劳动参与方程估计中的显著性。
民族因素在非农就业中呈现出显著的负相关关系,即少数民族在非农劳动力市场中处于弱势地位,这和少数民族的居住地以及文化差异有关。少数民族居住的地区大多远离中心城市,这些地区本身很少有非农就业的机会,而交通因素对外出打工的影响是比较显著的。另外,对于一个试图外出寻找工作的少数民族个体而言,语言差异可能使他们望而却步。这与我们的观察结果相一致。
作为个人经验变量的年龄因素,与其他一些参与模型的结果基本一致,即非农就业机会随年龄增长先增加后减少。
作为家庭因素的家庭未成年子女数,与非农就业机会成负相关关系,即家庭中子女越多,打工的机会越少,该结论也同样比较显著。而考虑非农就业与家庭经营之间替代效应,家庭经营时间同样与非农就业机会呈负相关关系,即打工和家庭经营之间的替代效应是存在的。
除心理因素外,另一个在方程中不显著的变量为婚姻状态,在劳动经济学中这是一个典型的劳动供给的决定因素。
现在,让我们再重新审视一下非农就业参与估计方程。我们发现所有对劳动力需求起作用的限制条件大多是显著的,如个人的年龄、文化程度、健康状况以及代表制度因素的户籍身份等等。而那些不显著的变量,有些本身在劳动力市场中就是隐性的,如生理因素;有些则是劳动力供给方的因素。这一发现使我们更加相信,农村的非农就业劳动力市场在当时(当然现在也很可能一样)主要是一个“买方市场”。
在以农业户籍身份人口为研究对象的参与方程中,我们发现除系数大小略有差异外,所有待估系数的符号完全一致;而在系数估计的显著性方面,同样表现出惊人的一致性。
作为与非农就业的对照,笔者选取了家庭经营中最具代表性、参与人数最多的种植业来进行劳动参与率研究(见附表1)。该估计方程与非农就业参与估计方程相比,最大的差异表现在代表人力资本的健康和教育变量,所有健康因子的系数都变得不显著,而教育的系数则变为显著的负值。这表明健康并非参与种植业的决定因素,而受教育程度越高的人越倾向于从事种植业以外的工作。
附表1 种植业劳动参与的决定因素分析
方程(1) 方程(2) 方程(3)
方程(4)
系数
t值 系数t值 系数 t值 系数t值
常数项 -1.622 -8.63
-0.554 -2.54
-1.725
-8.80
-1.623 -8.63
生理因子0.034 1.37
-0.007 -0.230.0301.13
心理因子0.006 0.28
-0.026 -0.920.0230.93
男性0.163 4.050.064
1.430.0882.120.1644.08
非农户口
-2.040-32.11
-1.967 -26.50-2.042 -32.15
少数民族0.215 3.470.196
2.850.1762.690.2183.52
年龄0.150 13.360.095
7.200.160
13.630.151
13.40
在婚0.210 3.280.116
1.600.2423.680.2113.30
受教育年限 -0.047 -6.56
-0.040 -5.00
-0.061
-8.16
-0.046
-6.51
年龄平方
-0.002-13.90
-0.001 -7.05
-0.002 -14.04
-0.002 -14.01
15岁以下儿童数量
-0.027 -1.23
-0.015 -0.61
-0.022
-1.01
-0.027
-1.24
上周种植业以外的就业时间
-0.016-15.99
-0.019 -18.19
-0.009 -10.27
-0.016 -15.95
样本量
6427
54054930 6427
X[2]检验值3272.362702.99 791.72 3270.37
X[2]显著性 0.0000 0.0000 0.0000
0.0000
最大似然率
-2792.92
-2237.33-2623.29 -2793.91
虚拟R[2]
0.3694 0.3766 0.1311
0.3692
3.对工资决定方程的估计
和非农劳动参与估计方程一样,对工资决定方程的估计也分别针对全体人群以及农业户籍人口进行。该方程基于著名的Mincer方程构建,增加了健康变量以扩大人力资本的维度,并适当增加性别、户籍身份以及省虚拟变量作为控制变量。方程中的被解释变量为工资的对数。其中的工资由调查中询问的月工资与月津贴及奖金加总而来。结果见表4。
表4 对全体劳动力和农业人口分别进行的Heckman方程估计
┌─────────┬─────────────┬─────────────┐
│ │ 全体样本 │ 农业人口 │
├─────────┼──────┬──────┼──────┬──────┤
│ │系数│t值 │系数│t值 │
├─────────┼──────┼──────┼──────┼──────┤
│ 生理因子│0.001
│0.03│0.056
│0.83│
│ 心理因子│0.022
│1.16│0.104
│1.72│
│ 男性│0.143
│3.82│0.234
│3.87│
│ 非农户口│
-0.151
│
-2.92│││
│ 年龄│0.042
│3.94│0.044
│3.10│
│ 受教育年限 │
-0.002
│
-0.30│
-0.020
│
-1.68│
│ 年龄平方│
-0.000
│
-3.34│
-0.001
│
-3.08│
│ 省虚拟变量(略)│││││
│ 常数项 │4.440
│
16.86│4.560
│
14.56│
│ 逆米尔斯比率│
-0.164
│
-2.94│
-0.186
│
-2.78│
│ 样本数 │ 6006
││ 4478
││
│ 删失样本数 │ 4599
││ 3919
││
│ 未删失样本数│ 1407
││ 559
││
│ X[2]值 │ 966.880
││
312.52
││
│ X[2]检验│0.000
││0.000
││
└─────────┴──────┴──────┴──────┴──────┘
首先看一下全体人群的估计方程。我们看到多数的估计系数与其他类似的研究是一致的,最大的不同在于教育变量的待估系数出现了不显著的很小的负值,这意味着教育对工资的决定作用基本不存在,或者可以认为,教育对工资的回报率可能仅仅在0附近。
另外一个与一般印象不一致的系数估计来自户籍身份变量,非农人口身份对工资的作用为负值而且显著。根据Heckman备择模型,这种情况的发生主要有这样两种可能:第一,那些当前未就业的非农人口如果进入非农就业市场将得到较低的工资;第二,那些未能进入非农就业的个人如果进入劳动力市场将得到较高的工资。我们认为前者的作用是存在的,由于制度性因素,非农户籍人口中一些已就业的个人得到了比其实际能力更高的工资,而那些还可能就业的个人的加入将导致这一群体的收入下降;而农业户籍人口受到制度的限制较多,一些合格的劳动力未能进入劳动力市场,这些劳动力的加入将至少不降低其工资水平。
估计系数比较显著的变量还包括年龄和性别,其系数与一般的估计方程类似,只是这里是考虑选择过程以后得到的结果。
但在工资决定方程中,代表健康资本的生理因子和心理因子都变得不显著,比较一下前面的非农劳动参与估计方程,这样的结果多少有点令人吃惊。
农业人口工资率决定方程的估计系数与全体人口方向基本一致,但显著性有所不同,坏消息是教育的系数仍为负值但变得很显著,好消息则在于健康因子中心理因子的系数变得比较显著,且比全体人口的估计系数大得多。生理因子的系数为不显著的正值。同全部人口的工资方程相比,生理因子和心理因子的作用增强了。我们注意到,在第一阶段的估计中,心理因子的系数不显著,这意味着在挑选非农就业参与者的过程中,心理因子并没有起到明显的作用,而在加入就业者行列后,心理因子的影响开始显现。受教育年限较为显著的负系数可能与一些合格的劳动力未进入非农就业市场有关。我们看到,农业人口中未参与非农就业的群体与参与非农就业的群体在教育程度方面不存在显著的差异。
农业人口工资决定方程中的其他估计系数与全体人群的Heckman模型的估计结果基本相同,如性别因素的系数为正数而且显著。但值得一提的是,在对农业人口的估计中,性别的作用进一步增强了。另外,工资随年龄增加而边际递减的趋势依然显著存在,而且两个方程的估计系数没有显著性差异。
最后还有两点需要做进一步说明。首先,显著的逆米尔斯比率说明,中国农村的非农就业中存在选择性偏误问题,也表明在本研究中使用Heckman备择模型是合适的;而负的逆米尔斯比率表明,那些未进入非农就业市场的劳动力其保留工资高于他们进入非农就业市场可能获得的工资,这就验证了保留工资理论在中国农村非农就业市场上的有效性。
另外,在非农劳动参与方程估计中,生理因子的系数都在1%水平上显著;在工资决定方程中,所有健康因子的估计系数都不显著或不够显著,这说明健康对非农劳动就业参与的影响大于其对工资决定的影响。
4.对实证分析结果的一些讨论
通过上述对工资率的Heckman最大似然估计,我们得到以下一些主要发现。
(1)尽管大多数情况下健康因子的系数并不显著,但综合两个健康因子,我们可以初步认为健康因子与工资存在一定的正相关关系。但必须承认,健康对工资的影响并不显著,这意味着对于劳动年龄人口而言,当他们进入非农就业市场后,健康对工资并不发生影响,我们认为这很可能是由于进入时严格的筛选机制所致。
在工资决定方面本文得到的结果比较接近于Schultz和Tansel(1997)的研究。在他们的研究中,只有对科特迪瓦男性工资收入者进行分析时,健康的估计系数才显著为正;而对加纳男性、两国男性和女性的研究中都没有得到显著的估计系数。但我们的研究与樊明(2002)的研究具有较大的差异,在樊明的研究中,几乎所有的估计方程均得到了显著的负系数(注:樊明的健康测度标准是,数值越大,健康状况越差。所以其负估计系数相当于我们的正估计系数。)。但他的估计方程中,唯一不显著的恰好是在劳动力市场上一般被认为倍受歧视的黑人,樊明援引Luft的解释认为“白人由于受过较好的教育,从而较高的收入能够使他们更换到适合他们健康状况的工作。而黑人就没有这么灵活,在选择新工作时发现可供他们选择的工作较少”。这就是说,黑人在进入劳动力市场时需要经历一个较为严格的筛选机制,这一点与中国农村的情况比较相似。应当注意到,获得工资的行为是经过选择的过程,健康(特别是生理因子)在第一阶段中的作用依然表现为显著的正系数。而对于农民而言,进入工资较高的就业领域似乎更重要。
(2)教育对非农就业者工资的回报率比较低,甚至为负值。特别是在农业人口中,教育的估计系数为较为显著(10%水平)的负值。这是一个与传统人力资本理论发生冲突的结论。因为在Schultz和Tansel(1993)的研究中,几乎所有教育变量的估计系数都显著为正,只有两国女性的估计方程得到了不很显著(10%水平)的负数;在樊明(2002)的研究中,所有对教育回报的估计方程无一例外地得到了显著的正估计系数。然而在国内的一些研究中,常见的结果是教育回报的系数较低乃至为负值,如张车伟(2003)对贫困地区种植业劳动的研究中,教育的系数为非常不显著的正数;而使用同样的数据,都阳(2001)在对非农就业的研究中同样使用Heckman两阶段估计方程,对于教育变量也得到了和我们一样的显著的负系数。对此,他的解释为:(ⅰ)非农活动对教育水平的要求不显著,而教育所要付出的成本对收益有负的影响;(ⅱ)教育的作用在于发现和识别劳动力市场的信息,在教育水平比较低的情况下,教育对提高劳动生产率没有什么影响;(ⅲ)教育可能培养人的各种不同能力,但对于贫困地区的劳动力市场而言,并非所有的能力都对提高劳动的边际生产率有帮助。但我们认为,都阳的三个理由只能解释不显著的教育估计系数,而不能保证得到显著的负系数。教育的负系数可能来自另外的原因:它很可能是过分强调经验的结果,以经验解释了一些应当由教育解释的问题;另外,与发达国家甚至一些发展中国家不同,中国正处于一个快速发展的阶段,受到较多教育的人群是比较年轻的人群,他们的工资通常会低于他们的长辈,从而得到了教育回报率较低、甚至为负的估计系数。
(3)经验的作用非常强,而且在估计方程中是仅有的两个显著变量之一。这与都阳(2001)的研究比较相似,在他对非农就业工资的研究中,只有经验和技能对工资产生显著的影响。当然在其他人的研究中,经验大多也是非常显著的,如樊明(2002)和Schultz和Tansel(1997)。对于中国这样一个处在转型与发展过程中的国家而言,这一估计结果应当是比较合理的。
(4)在进行选择性过程矫正以后,制度变量户籍身份对工资具有负面影响,这个结论与一般的研究结果不同。这是因为,在现有的参与者中,制度因素是十分重要的正向因素,但经过选择性过程矫正后,制度因素已经被充分考虑,于是非农户籍身份对工资的贡献为负值。而在同时进行的OLS估计中,这一变量的系数估计值为显著的正数。另外,这也可能是使用横截面数据所致。
(5)工资决定的性别歧视明显存在。在我们所有的估计方程中,性别始终是除经验以外唯一显著的变量,无论是对样本总体还是农业或非农居民,得到的结果是一致的。而且无论是否控制了其他变量,不同性别之间的工资差别都显著地存在。这意味着,即便在劳动力进行非农就业参与选择后,性别仍然是工资决定的重要因素。(注:因为性别在参与率决定方程中就具有显著的正系数。)这个结论与都阳(2001)的研究略有差异,在他的研究中性别变量并不显著。
四、强力检验及主要结论
1.关于健康测度选择的重新考察
由于健康测度的困难,所以有必要对健康测度指标的选择进行重新考察,通常的做法是,选择其他一些健康测度指标进行同样的分析,以检验分析结果的准确性,这种检验通常称作强力检验。
本文进行的强力检验选择了这样一些指标:健康自评、健康简单算术得分、健康的加权得分、健康受限天数。其中,除健康自评为离散变量外,其余三个健康指标都是连续变量。健康自评来自问卷中对一般健康状况的询问“你如何评价你的健康状况?”答案为“很好、好、一般、差、很差”五级,(注:新的趋势是,健康自评同样被认为是一个不可观察的连续潜变量,需要通过方程估计获得。但作为一种检验手段,我们认为直接使用离散变量是可以接受的。)而健康的得分和加权得分基于与本研究同样的问题。樊明(2001)的研究中就采用了类似的打分法,即根据不同问题的不同回答规定不同的分数。由于此前中国没有相关的研究,我们只能凭借主观印象进行评判。为此我们粗略地构建了这两种健康指数:简单算术得分——将每项功能正常定义为0,存在轻微问题定义为1,严重问题为2,完全失能为3,然后对每项得分进行加总得到最终的总得分;健康的加权得分——将每项功能正常定义为0,存在轻微问题定义为2,严重问题为5,完全失能为10,再加总各项得分得到最终的总得分。健康受限天数直接取自调查前3个月的健康受限天数指标。
使用这些健康指数,我们对健康与劳动力市场的关系进行重新估计,估计结果与使用生理和心理因子分析的结果基本一致。其中健康自评、平均得分和加权得分与生理因子的估计结果更为相似,即在劳动参与估计中表现为非常显著的负数,在对工资决定进行的二阶段估计中为不显著的负数。(注:由于所使用的指标为健康的负指数,即得分越高健康状况越差,因此估计方程中打分法得到的正估计系数对应着因子法得到的负估计系数,反之亦然。)而在使用健康受限天数进行的估计中,无论在一阶段还是在二阶段健康的估计系数都不显著。值得一提的是,在以上所有的研究中,逆米尔斯比率都是显著的。
总结以上的结果我们发现,即便选择不同的健康测度指标,得到的结论也基本是一致的:健康的身体倾向于容易获得非农就业机会,而健康对劳动工资决定缺乏显著的影响,而且在非农就业市场中,选择性偏误明显存在。
2.本研究的主要结论
作为国内非农就业与健康间关系研究的首次尝试,本研究的主要贡献表现在以下几个方面。
首先,通过加入健康变量,本文在一个更多维的人力资本概念下,对非农就业参与和工资决定的影响因素进行探讨。另外,本文使用因子分析方法成功提取了生理和心理因子,也扩大了对健康考察的维度。
其次,本文发现,健康对劳动参与和非农就业参与具有显著的作用,但它对于种植业参与并没有什么显著的作用,甚至可以说没有一点作用。我们的研究还发现,在1993年,面向农村的劳动力市场基本上是一个买方市场。而在分别对全体人口和农业人口的估计中,我们同样发现健康资本对劳动参与产生明显的影响。
然而,即便在一个广义的农村概念下,农业户籍人口和非农户籍人口在非农就业的劳动参与率方面仍然存在巨大的差距,因而二元结构在这里还是存在的。但我们的研究发现,提高健康资本存量对于农民获得非农就业机会具有重要的作用。我们知道,非农收入既有助于提高农民的经济生活水平,又有利于缩小城乡二元经济的差距,因而健康还具有更为重要和深远的意义。
再次,在工资决定方面,健康并没有表现出显著的影响。由于存在强的选择过程,不仅仅是健康,而且所有的人力资本变量在我们的估计方程中对非农就业劳动力市场表现的影响基本消失。
最后,无论是在非农劳动参与还是在劳动工资决定方面,在广大农村地区,性别歧视明显存在;经验在劳动力市场表现方面的作用异常显著。与健康一样,教育对于非农劳动参与的作用强于其对工资决定的作用。另外,仅仅从横截面分析的角度,户籍身份并不是受歧视的原因,但如果从更深层次探究原因,则不同户籍身份人口之间非农就业机会的明显差异已经说明了一切。
由于中国的发展速度很快,很多情况发生了巨大的变化,因而本研究仅仅适用于20世纪90年代初期的情况。当时,城市地区对外来劳动力务工的限制仍相对严格。随着这种限制的放松,农民拥有了更多的非农就业机会,因而在新的条件下,健康对非农就业和工资决定的影响这一课题还有待于基于更新的数据进行的更深广的研究。