产业对收入的影响:基于多层线性模型的分析_收入差距论文

行业是如何影响收入的——基于多层线性模型的分析,本文主要内容关键词为:线性论文,多层论文,模型论文,收入论文,行业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

收入分配一直以来都是社会分层研究中的热点问题,近年来中国收入分配的状况更是引起学界广泛关注。自改革开放以来的这30年中,中国社会已经发生了翻天覆地的变化。在取得了令人瞩目的经济发展成果的同时,社会收入不平等状况也日益突出。①

对此,学者们开始探索其背后的发生机制。越来越多的人注意到,即使条件相同的个人,可能也有着巨大的收入差距。这样的社会分化并非仅仅由个人层次的因素造成,制度性与结构性的因素也是其中不可忽视甚至更为重要的原因。我们可以观察到的一个极为明显的结构性因素就是行业。一系列不同时间点的实证研究都显示了行业间的收入存在着巨大差异,并且这一行业间的收入差异一直都在进一步扩大。②

已有研究给出了一个总体的行业间收入差异的情形。但是,在我们看来,行业对于收入分配的影响作用至少有以下两种截然不同的过程与机制:一是,不同的行业特征直接导致不同行业间整体收入水平的差异;二是,不同的行业特征导致不同的个人特征对收入的回报率在不同行业间的差异。这两种机制的影响逻辑与影响路径并不相同,前者直接造成了不同行业间平均收入的差异,而后者则造成不同行业间同样的个人特征对收入的影响受制于其所处的行业特征,并形成了这些个人特征收入回报率在行业间的差异。

本文使用经过特殊对接处理的两个数据,并使用多层回归模型来分析这一数据,进一步探讨行业对于收入分配的影响,以期理解制度性与结构性因素对于个人收入分配的影响过程与机制,以及当前中国社会结构的分化过程。

二、收入分配中的结构性因素分析与行业的影响作用

(一)社会分层研究中的结构性因素

社会分层结构是由社会集团与群体构成的多层级垂直的社会关系模式。而行业正是划分社会集团、导致社会分化、形成与维护分层模式的结构性因素之一。

1.新结构主义研究

近几十年来的社会分层研究从制度与结构视角出发,被称为“新结构主义”。该派理论强调在社会分层过程中制度与结构比个人特征更重要;同时认为个人特征的影响作用受到制度性与结构性因素约束。在众多的新结构主义理论中,“分割的劳动力市场”理论直接认为劳动力市场被分为两个几乎完全不同的市场:初级市场(primary market)与次级市场(secondary market)。③ 这两个市场在包括个人回报的诸多方面都有着天壤之别。进入这两个不同市场的决定因素往往并不是个人的劳动技能与生产能力,而是与其他社会结构和制度特征高度相关(例如种族、肤色、口音以及性别等)。只有在厘清市场结构特征之后,个人特征才能够显现出对于收入分配的影响作用。后来的实证研究也证实了这样的理论假设。另一个更具社会学味道的研究传统专注于对组织特征影响作用的挖掘。拜仁和毕尔比倡导把公司组织概念化为工作的结构性单位,提出应当以公司组织作为社会分层研究最为重要的研究单位。通过考察企业组织中工作是如何被实际安排的,从而看出对其成员收入分配的影响。④ 拜仁和毕尔比的研究也开创了一个崭新的研究领域。⑤

不论是从劳动力市场的分割还是从企业组织角度出发,上述研究的一个共同点就是强调结构性因素对于个人收入不平等产生的关键影响。制度性与结构性因素在决定个人收入的过程中,比个体特征“更重要并在逻辑上更早”。

2.关于中国的研究

在一些研究中,人们也发现制度性与结构性因素对收入分配有着显著的影响作用。但是在中国,结构性的分割所呈现出来的影响更为复杂多样。总结起来,中国社会影响收入的主要制度性与结构性因素包括所有制、地区、行业与工作单位等。⑥

林南和边燕杰指出,社会主义经济中的劳动力市场同样存在制度性与结构性的分割。他们认为工作单位的所有制制度是影响1990年代以前中国城市个人收入的最重要因素。⑦ 后来的研究更加细致地讨论了工作单位的特征(包括单位所有制、行政层级、规模等)对于个人收入的影响。谢宇和韩怡梅的研究发现,区域间的收入差距明显,并指出“区域异质性”是分析中国居民收入不平等中必须考虑的重要因素之一。⑧ 后来也有研究再次证实了这一结论。⑨ 王天夫和王丰的研究则系统地讨论了四种不同的结构性因素所起的作用。⑩ 他们发现,这些社会集团类别产生于社会主义时期,但在转型时期对个人的经济收益依然有着深刻的作用。收入不平等所表现出来的特征就是集团间的分化快速增大,但集团内收入的平均趋势在一定程度上得以维持。集团间收入差异的增长远远超过了集团内差异的增长。到了1990年代中期,大约一半的收入差异增长能够为这些社会集团因素所解释。这无疑成为中国社会收入差距快速拉大的重要原因之一。

以往研究关注的重点,更多的在于结构性因素对于此类结构单位(如单位组织与区域)的平均收入水平有怎样的影响以及什么样的特征造成这样的差异。但是,对于这些结构性因素是怎样约束个人特征的影响过程的具体研究还相当少见。

(二)行业间收入差距研究

行业一直以来都被认为是一个影响收入的重要结构性因素。早期有研究表明行业间的收入差距在各个国家、各个时代以及不同的工人之间都显示出了显著的相似性,这样的行业工资差异也直接表明了劳动力市场并不具有完全自由竞争的特征。(11) 但是,对于行业收入差异,社会学领域中更多的是概念上的讨论,而甚少直接的经验研究;更多的研究来源于经济学领域。

1.逐步扩大的行业间收入差距

以行业间个人收入差异为研究主题的传统显示,中国城市行业收入差异增长从1980年代后期开始一直持续到现在,并出现了潜在的两极分化趋势。(12)

而这样的行业收入差距更多地体现在以下几个对比之中:(13) 一是垄断行业与非垄断行业之间,(14) 二是新兴行业与传统行业之间,(15) 三是知识密集型行业与劳动密集型行业之间,(16) 四是市场分配机制行业与非市场分配机制行业之间。

通常以分配过程中机会是否公平与差距是否合理为标准,行业间收入差距又被分为合理与不合理两种类型。垄断行业的高收入通常被认为是不合理的;而新兴行业与知识密集型行业的高收入由于从业人员的高投入,被认为是正常与合理的。(17) 垄断行业又可以细分为由市场竞争形成的自然垄断与由行政干预形成的行政支持性垄断,而后者带来的高收入尤其为人所诟病。(18)

2.行业间收入差距的成因讨论

通常,那些资本—劳动比率更高、垄断能力以及赢利能力更强的行业工资收入更高。(19) 但是,中国在行业间的制度设置与结构模式显然又使得个人收入的行业差距显得更加复杂。总结起来,中国行业收入差距的成因有以下四个方面:(20) (1)行业本身的差别与行业竞争。这与行业结构的调整紧密相关。有些新兴行业知识密集,资本密集,劳动力生产率高,自然就获得了超过行业平均利润的赢利能力,行业工资高于其他行业。(2)自然竞争导致的行业自然垄断。这与市场竞争过程中利用市场规则而逐渐出现规模大、市场占有率高、市场集中率高的行业有关。这样的行业获得了超额利润。(3)市场机制不完善导致的资本与劳动力不能自由流动。资本与劳动力的自由流动将导致平均行业利润。但是,转型时期存在着劳动力因为身份、档案以及户口等因素不能自由流动;而民营资本也被限制无法进入某些行业。这使得行业间的利润水平差距明显,进而导致个人收入的行业差异。(4)行政支持的行业垄断。有些行业得到了政府在投资、信贷、税收甚至是直接的经营活动方面的支持。这样的垄断行业将其获得的部分超额利润以工资或是福利的形式分配给个人,使得这些行业的收入大大高于其他行业。

罗楚亮和李实的研究首次使用了全国性的数据来分析行业对于收入的影响。(21) 他们对企业之间、行业之间平均收入的差距给予了全面描述。他们发现行业之间的收入差距相当惊人(5倍的差距),同时也认为形成行业收入差异的过程中,行业垄断比赢利能力有着更重要的影响作用。傅娟深入挖掘垄断行业高收入情况,发现这些行业并不仅仅是在平均工资上比其他行业高,行业的收入分布整体上(各个收入十分位)也高于其他行业。傅娟还发现造成垄断行业如此高收入的主要原因与市场竞争形成的自然垄断关系不大,而与行政支持的垄断联系紧密。(22)

类似研究一致认为当前中国存在行业收入差距,并且正在逐步扩大。同时,这些研究十分强调行政支持下的垄断是导致行业收入差距的最重要原因。任重与周云波的研究甚至指出政府支持的垄断对于行业收入差距的贡献率超过了60%。(23)

(三)对行业影响收入的进一步讨论

1.行业平均收入与行业间的个人特征收入回报率

以往研究显示,行业特征(诸如垄断地位、集中率、平均教育水平、资金密集程度等)与个人特征(年龄、性别、教育水平等)都对个人收入有着重要影响。从上述的理论讨论中,我们也了解到,在影响个人收入的过程中,结构性因素给出了约束框架,个人特征正是在这样的结构框架下影响个人收入的。但是,在以往的研究中几乎没有出现行业的结构性特征是如何具体影响个人特征在行业间的收入回报率的。

因此,在我们看来,当前对于行业影响个人收入的研究有待进一步深入。以往研究更多专注诸如“行业间整体上的平均收入是否存在着显著的不平等”、“行业性特征对行业平均收入是否产生显著影响”以及“垄断行业的收入水平到底有多高”等问题。而对于诸如“在行业间的收入差距和行业内的差距各占多大的比例”、“行业特征影响个人收入的具体过程是怎样的”以及“相同个人特征在行业间的收入回报率是否具有不变性”等问题则没有深入挖掘或没有涉及。

在一定程度上,以上的局限性在于将制度性、结构性因素和个人性因素的影响作用过于区别看待。行业被看作一种类似“黑箱”的东西,它所产生出来的是整体性的收入差距。我们能看到的也仅仅是各个行业在平均收入上的巨大差别。但事实上,结构性因素与个人因素对于收入的影响作用是相互纠缠的。行业特征对于收入的影响作用,并非仅仅限于对于行业整体平均收入的影响,同时还有对于个人层次资源收入回报率的限制性影响作用。因此,行业对于个人收入的影响作用至少有以下两种可以叠加的影响机制:不同行业间的行业平均收入并不相同;同时,不同行业间个人层次资源对于收入的回报率可能也不相同。因此在我们看来,挖掘行业特征的具体影响机制与影响途径应该成为该类收入分配研究中的一个新思路。这既是一个认清实际情况的问题,也是一个厘清理论脉络的问题。

2.分析工具与数据的约束

遗憾的是,当前仍缺乏深入探讨行业特征对于个人特征收入回报率具体影响过程的研究。究其原因,也有分析工具与数据的约束。罗楚亮与李实的研究使用了行业特征变量,讨论了行业特征对于行业平均收入的影响。但他们的数据中没有个人层次的内容,因此无法讨论行业特征对于个人层次资源回报率的差异问题。(24) 傅娟分析了个人层次的抽样数据,但是数据中没有详细的行业特征的测量内容。因而,其只好使用了垄断行业与非垄断行业这样简单的分类。(25)

当前社会研究中鲜见以行业(或是企业组织)作为基本抽样单位的大规模抽样数据,而在以个人为最终抽样单位的调查中也甚少有关行业特征的调查内容。这样的数据至少给研究带来两个方面的不足:(1)无法分割行业层次与个人层次分别对于个人收入的独立影响;(2)无法讨论行业特征对于个人层次特征收入回报率的结构性调整。本文将两个数据巧妙地对接起来,使用多层线性回归模型来克服以前的困难,以达成这两个分析目的。

(四)研究假设

为了用数据来检验上述讨论的行业特征对于个人收入的两种可以“分割”的影响过程与机制,下面给出一系列可供检验的假设。假设分为两类:一是关于行业间平均收入因为行业特征的变化而变化的假设(A),二是关于个人层次特征对收入的影响随着行业特征的变化而变化的假设(B)。其中,A类假设在以往研究中多有涉及,将其纳入分析当中不仅仅是使用另一个对接处理过的数据来重新证实它们,同时也可以旁证当前数据的有效性。而B类假设则是以往研究中几乎没有涉及的关于个人特征收入回报率在行业间的差异性问题。

1.行业间收入差异

我们首先要关注的是行业间是否存在着显著的收入差距。这一点在以往的研究中已经被屡次证实,(26) 但作为研究的必要步骤,仍然需要检验。因此我们提出:

假设:行业间确实存在着显著的平均收入差距。

对于行业间平均收入究竟由怎样的行业特征造成的,以往研究中有不同的探讨。一般的关注点主要集中于垄断层面,即认为:垄断性行业与非垄断性行业之间职工的收入差距过大,垄断性行业职工的收入远远高于非垄断性行业职工的收入。(27) 另外,也有研究提到新兴行业职工的收入水平高、增长快;知识和资金密集型行业比劳动密集型行业职工收入高。(28) 因此,我们建立如下假设:

假设:垄断性行业(能源、交通、金融等)的平均收入更高。

假设:新兴行业收入水平更高。

假设:从业人员平均教育水平较高的行业,收入水平更高。

在以往的企业组织研究中,规模都是一个重要的变量。(29) 一个重要的原因是规模大的企业占有市场优势地位。但在大规模行业中,个体企业并不一定占有优势。相反,大规模行业更多情况下是成熟行业,而非新兴行业,所以其从业人员的工资并不一定占有优势。

假设:行业规模对于收入没有影响。

2.行业间个人特征收入回报率的差异

如上讨论,我们更关注行业特征对个人特征的收入回报的影响。我们认为,正是由于行业特征的不同,使得个人特征的收入回报率在不同的行业之间呈现出了差异性。

通常意义上个人层次的资源特征包括先赋与后致两种:男女性别、年龄大小、党员身份、教育水平等。对于性别,王天夫等人的研究发现,国有单位内的平均主义取向对于女性与男性收入差距有一个平衡作用。(30) 另外,行业规模对性别收入差距也具有减缓作用。因此,我们提出:

假设:行业内国有单位的比例越高,性别收入差距越小。

假设:行业规模越大,性别收入差距越小。

收入的年龄回报率被认为遵循向下开口的抛物线形状。个人收入会先随着年龄增加,然后在临近退休时开始下降。(31) 然而,年龄往往作为反映个人资历的一个重要指标,而资历在较年轻的行业里对收入的影响并不明显。但在国有化程度较高和大规模成熟的行业里,年龄的收入回报则更加明显。因为在这些行业中,往往对资历有相当程度的重视,因而年龄的收入回报会有所增加。资历的这一作用,通常又与其他因素(例如年轻人的知识结构更新,更符合技术发展潮流等)纠缠在一起,使得年龄对于收入的提高效应变得不明显。因此,有如下假设:

假设:年龄的收入回报率在不同国有化程度的行业中没有差异。

假设:年龄的收入回报率在不同规模的行业中没有差异。

假设:年龄的收入回报率在新兴程度更高的行业中更低。

教育水平一向是决定收入的重要变量。以往的研究给出了较为复杂的结论。(32) 知识密集型行业总体上的教育回报率应该更高。(33) 同时,国有单位的平均主义取向则有可能使得教育水平的决定作用并不明显。(34) 因此,有如下假设:

假设:从业人员平均教育水平越高的行业,教育回报率越高。

假设:国有单位比例对于教育回报率没有影响。

从政治权威的持续性来讲,党员身份应当与收入之间存在正向关系。(35) 以往研究仅限于个人层次的分析,同时显示了极为强烈的一致性。在我们看来,这样的政治身份对于收入的影响应该是跨行业的、一致的。因此,我们有:

假设:党员身份的收入回报率在行业间不存在差异。

三、分析工具与数据

在前面的讨论中,我们反复强调行业对于收入的影响作用包含了两个层次的含义:一是对于各个行业平均收入的影响,二是个人层次特征对收入回报率在行业层次上的结构性调整。显然,这里面包含了对于收入的两个层次的影响:个人层次与行业层次。要分清这两个层次的影响作用及其复杂关系,需要有着特殊结构的数据,并引入新的分析工具。(36)

(一)分析工具

为了达到分析目的,在本研究中将使用多层线性回归模型(Hierarchical Linear Models,HLM)。在社会研究中,经常涉及分层数据结构。这类数据往往是以一个层级的数据嵌套在另一层级中的形式出现。例如,在教育研究的数据样本中通常包含了若干个学校,若干个班级嵌套于同一个学校当中,若干个学生又嵌套于同一个班级当中——这样就构成了一个学生—班级—学校的三层数据。此类分层数据结构往往包含了更多信息。以我们的研究为例,个人层次和行业层次的特征是我们的关注点,需要同时对两个层面进行分析。传统的线性回归分析(Classic Linear Regression)的基本先决条件是线性、正态、方差齐性以及独立分布。但对于分层的数据而言,方差齐性和独立分布这两点并不成立,这给估计带来相当大的难度。而HLM正是为了应对此类数据而产生的,并在近年来的应用中愈发成熟,使研究者可以估计各层面上的变化,以及各层面变量之间的关系。这些特征正好符合我们的研究目的,因此本文将使用HLM模型来分析数据。

(二)数据

本文将两个数据对接成一个分层级的数据。第一个数据是从《中国经济普查年鉴2004》中抽取的数据。(37) 2004年的经济普查是我国进行的第一次全国性经济普查。普查的对象包括在我国境内从事第二产业、第三产业的全部法人单位、产业活动单位和个体经营户,共计516.9万个法人单位,个体经营户3921.6万户。经济普查数据中包含了关于各个行业的详细信息。另一个是2003年全国综合社会调查(CGSS2003)资料的城镇部分。(38) 该数据以第五次人口普查数据为抽样框,在全国28个省、市、自治区的城市、城镇范围内采用PPS与分层设计的抽样方法共抽取了5900位城镇居民,实际完成样本5894个访谈个案,它们分属101个行业。CGSS2003调查了受访人详细的个人收入情况。以两个数据中的行业为连接变量将它们对接起来,我们将得到一个个人—行业的两层数据。

之所以选用这两个数据,与本文的研究目的密切相关。首先,我们需要个人层面的详尽信息,包括个人收入及诸如性别、年龄、教育、党员身份等其他个人特征。CGSS2003是一个全国范围内的抽样调查,因此比较好地满足了这一要求。并且,该调查也访问了受访人工作所属的行业。而中国经济普查则包含了行业层面的非常详尽的信息。因此,这两个数据能够比较丰富地提供本文所需要的各层面数据。值得注意的是,CGSS2003是在2003年完成的,而《中国经济普查年鉴2004》是在2004年调查了截止2003年底的数据。两者的调查时间非常接近,因此我们完全可以认为它们反映了同一时间的情况,而将这两个数据放在一起处理。

数据必须先进行初步的处理使其能进行建模和分析,我们做了如下处理。

第一步,要对两个数据中的行业进行统一分类,这一行业变量是对接这两个数据的关键。在2004年中国经济普查中,按照行业中的类区分一共有19个类别93个具体的行业。而在CGSS2003当中,可分辨出来的行业共有101个。所有这些行业并非都适合进入分析当中。因此,我们先对这些行业进行重新归类,使它们能够进行分析。

我们在分类工作中主要考虑三个原则。一是相近性质的行业分为一类,这是因为相近行业各方面的特征都比较接近,如果单独进入分析会使结果出现较大偏差。二是至少要有20个以上的行业,来保证我们在多层回归分析中第二层数据(即行业层次)的变化。三是多层线性模型要求每个行业内包含有合理的个案(即CGSS2003中的个人)。我们力争在分类中保留尽可能多的个案,并且在最后删除有缺损值的个案后,再次检验每一个行业大类中是否有足够的个案数。由于多层线性模型的需要,我们希望每个行业大类中至少有20个以上的个案能最终保留下来。特别需要指出的是,对于2004年经济普查和CGSS2003我们都按照统一的行业区分标准来分类,这样使两个数据在进入多层线性模型分析的时候,可以有相同的对接变量(即ID变量)。

第二步,要整理CGSS2003数据,以达到分析的要求。在CGSS2003中,我们先删除一些无法识别行业类别的个案(n=165),“不适用、不回答、不便分类及其他”这几类行业相关的个案(n=779),以及一些特殊的行业,它们个案数较少(n=20)并且很难归类到其他行业中。接下来,我们删除了因变量(年收入)和各自变量(变量列表见表1)有缺损的个案(n=426)。之后,我们进一步删除了年收入不合理的情况。我们认定年收入小于600元为不合理数据(即平均每月收入不到50元),并删除了相应的个案(n=461)。这样处理过后剩下4043个个案,按26个行业大类排序,每个行业有24—483个个案,符合最初设定的要求。

经济普查数据是以行业为单位进行的统计,除了在对应CGSS2003行业合并归类过程中删除的类别之外,没有其他需要整理的工作。

第三步,在两个层面分别生成分析使用的变量。在个人层面(层级一),使用的变量包括对数化年收入(因变量)、性别(女性=1)、年龄、年龄平方/100、(39) 教育程度、(40) 是否在职工作、党员身份(党员=1);在行业层面(层级二),使用的变量包括行业年龄(1996年及以后成立单位比例)、行业规模(对数化从业人数)、高学历比例(本科及以上人员比例)、国有单位比例。(41) 在行业层面我们还使用以下两个特别的虚拟变量:金融房地产、石油交通传输及供应。这两个虚拟变量将只放在平均收入的分析中,目的是检验垄断行业是否获得了高于平均数的行业收入。在我们看来,“金融房地产”代表资本投资,“石油交通传输及供应”代表资源性垄断行业。

第四步,我们将这两个处理完毕的数据代入HLM数据处理软件中生成一个分层数据。描述性统计量参见表1。

四、模型及分析结果

(一)各行业的平均收入差距

我们首先计算了26个行业的平均收入(见表2)。从表2中的数据可以看出,各个行业的平均年收入从7000余元到18000余元,差距明显。收入较少的是农业、采矿业等行业,而收入较高的是传输业、房地产业、金融业等。

(二)收入差距的分解

使用HLM的一个优势是它可以将收入的整体差异分解到不同层级里,并给出一个定量的指标来表示不同层级所导致的收入差异占总差异的份额。

我们使用HLM的零模型(null model)来分解收入差异,具体模型如下:

从表3中可以看出截距收入(对数形式)的平均数为9.069。在方差成分中我们看到,组内方差为0.581,而组间则为0.090,值为630.024,在25个自由度下p-值远远接近于0,证明行业间的收入差异十分显著(证实假设)。更进一步,根据HLM给出的方差成分在两个层级的分布,我们可以算出,行业间的效应比例为13.4%,行业内的效应比例为86.6%。换言之,因为行业的不同造成了个人收入的差异,而这部分差异占到了个人收入整体差异的13.4%。

(三)行业特征的影响机制

现在,我们讨论行业特征对于收入的两个影响机制与路径:一是对平均收入的直接影响作用,二是对个人特征影响收入的结构性调整作用。我们建立一个在两个层次都加入了自变量的多层线性回归模型。

第一层模型:(42)

第二层模型的最后一个方程中,我们没有代入任何解释变量,但保留了随机项。如果结果中随机项十分显著的话,就表明党员身份的收入回报率在行业间确实有显著差异,我们应当进一步研究考察其机制。而如果随机项不显著,则表明党员身份的收入回报率在行业间没有显著差异。

行业特征影响收入的机制与途径显得相当复杂(参见表4)。表4可以分成上下两个部分:固定部分与随机效应。前者表示引入到模型中层级一与层级二的自变量对于收入的影响效应,而后者则表示模型中的这些自变量所没有解释掉的收入差异。表4的最左端列出的自变量分为两个层级,其中层级一的个人特征自变量用黑体字显示,而嵌在相应的层级一变量下的层级二的自变量用缩进格式表示。需要特别注意的是,所有层级一自变量下的截距项的回归系数表示的是个人特征对于收入的影响效应,而其余的层级二自变量的回归系数表示的是行业特征对于个人特征影响收入效应的结构性调整。下面,我们将分步骤讨论行业特征的复杂影响效应。

1.行业间的平均收入

对于平均收入项,我们发现,新兴行业的从业人员并没有获得相对更高的收入(不能证实),(44) 而行业规模对收入水平基本上也没有影响(证实假设)。并不意外的是,行业的高学历比例越高,从业人员的收入就越高(证实假设)。模型中两个表示特定垄断行业的虚拟变量都相当显著,表示金融、房地产、能源、交通及供应等行业的从业人员的平均工资要远远高于其他行业的从业人员(证实假设)。(45) 这一结论也符合通常的社会观感。

2.个人特征对于收入的影响

前面提到,层级一自变量下的截距项的回归系数就是该个人特征对于收入的影响效应。结果显示,所有的截距项都具有统计显著性,由此可见个人层面的特征(包括性别、年龄、教育年限、党员身份)对收入获得都具有显著的影响作用。具体地,女性的收入比男性更少(性别截距项回归系数小于0),收入随着年龄的增加而增加(年龄截距项回归系数大于0),但其增加的速度随着年龄的增加而减缓(年龄平方截距项回归系数小于0),收入随着教育水平的提高而增加(教育截距项回归系数大于0),在职人员的收入显著高于不在职人员,党员身份提高了收入(党员截距项回归系数大于0)。这些结果与以前的研究结论一致。

3.行业特征调整个人特征的收入回报率

对于我们来讲,更重要的是,多层线性模型可以描述个人特征(层级一)对于收入的影响是如何随着行业特征的不同而变化的。这样的结果是由模型中(参见表4)嵌套于层级一自变量下的层级二自变量的回归系数来显示的。

在层级一变量性别项下,相对于其他行业,国有单位较多的行业里男女性别收入的差距要小一些(证实假设)。从数值上来讲,在国有单位比例更高的行业里的女性,如果这一比例每增加10个百分点,她们相对于同行业男性的工资增加2.5个百分点。(46) 这一结论与以往研究一致。但是,行业规模对性别收入差距的弥补作用接近于0(不能证实假设)。

在层级一年龄项下,前面提到了年龄的回归系数(正)与年龄平方项的回归系数(负)导致了年龄对收入的回报率呈现一个向下开口的抛物线。这表明,个人收入先随着年龄增加,然后在临近退休时开始下降。我们注意到,层级二变量行业年龄和行业规模都对年龄的收入回报率产生了显著影响,而且都是负向的影响。在年龄项,行业年龄和行业规模分别使年龄对收入的系数减少0.134和0.014;而在年龄平方项,二者又分别使年龄平方对收入的系数减少0.122和0.014。这样的结果显示,与其他更为成熟的行业或是规模更小的行业相比,在较为新兴的行业和规模较大的行业中,随着年龄增加,收入的增加速度要小得多。换言之,在新兴行业与大规模行业中,年龄对于收入的正向回报率更低(不能证实假设;证实假设)。(47) 相对而言,行业年龄比行业规模更能够产生影响,是决定年龄收入回报的更重要因素。另外,行业中国有单位比例对于年龄的回报率并不产生任何影响(证实假设)。

在层级一变量教育项下,在人力资本水平较高的行业中,对于教育的重视程度也越高,这反映在高人力资本行业对于教育的收入回报率的回归系数为0.201,(48) 且在统计意义上显著(证实假设)。从数值上看,比较两个行业,如果A行业的高学历比例比B行业高出10个百分点,那么每增加1年的教育水平,在B行业中个人收入增加8.5个百分点[exp(0.082)-1=0.0854],但在A行业中这一增加量近10.8个百分点[exp(0.082+0.201/10)-1=0.1075]。(49) 换言之,在A行业中,因为其整体的教育水平更高,因此对于教育的回报率更高。在控制了行业教育水平之后,这一教育回报率的促进作用在国有单位比例较高的行业中则不存在(证实假设)。

为了更直观地显示层级二行业特征变量如何调整层级一个人特征变量对于收入的影响作用,我们回到年龄对于收入的回报率的讨论中,并给出如下两个图形(参见图1)。纵轴表示收入,横轴表示年龄。随着年龄增长,收入有一个向上的增长过程,但是到达一定年龄后,又有下降或是持平的趋势(向下开口的抛物线)。虽然两个图形中的曲线趋势一致,但形状上相去甚远。与成熟行业与小规模行业相比,新兴行业与大规模行业的曲线上升幅度要小一些,这是因为这些行业特征从结构上降低了年龄对于收入的回报率。所以,行业作为一个制度性与结构性因素,它通过调整个人层次特征对于收入的影响作用,形成了对于收入的间接影响机制与途径。

图1 不同行业中年龄对于收入的不同回报率比较

4.随机效应

从随机效应表中,我们看到,在代入相应变量后,只有截距的随机效应仍然十分显著,因此还需要进一步寻找其他变量来解释它们的变差。而对于性别、年龄、教育年限、党员身份这四个变量而言,它们在行业层面上的变异得到了很好解释,无需进一步寻找另外的解释因素。作为控制变量代入模型的是否在职变量,其随机效应只显示了边缘性的显著水平。

需要特别指出的是,党员身份的方程中没有加入任何层级二自变量,但是其随机效应的检验显示为不显著。这表明,党员身份在行业间没有收入差异(证实假设)。

五、讨论与结语

行业作为国民经济生产过程中的分工体系,它影响了行业间收入分配的模式,导致了不同行业从业人员个人收入的差异,形成了一个带有鲜明行业特色的收入分层结构,因而成为制造社会分化过程的结构性因素,也成为收入分配研究中的重要主题。

本文延续了收入分配研究中新近兴起的强调制度性与结构性因素的传统,深入挖掘了行业影响个人收入的两个途径与机制:一是,行业特征直接导致行业间个人收入的差异;二是,行业特征也导致了个人特征收入回报率的差异。以往较多的经济学研究反复证实了前者,而后者则是本文细致求证的重要理论假设。本文的分析结果显示了行业间的平均收入存在着显著不平等,也显示出行业性特征对行业平均收入产生了显著影响。更重要的是,本文的结果还揭示了行业特征影响个人收入的双重逻辑与过程,并指出相同的个人特征在行业间的收入回报率并不具有不变性。

本文的分析结果显示出,行业之间的确存在着显著的收入差异,显示收入分配绝不仅仅是个人层次的因素在起作用,其他结构性因素——例如行业——在收入分配中也至关重要。特别在某些垄断行业——诸如金融房地产、能源交通传输及供应等行业,其整体个人收入高于其他行业。因此,我们可以看到,在当前的收入分配中,国家依然有着强烈影响。同时,其他行业特征也影响着行业的平均收入。行业中从业人员受教育的平均水平与收入的平均水平显示了较强的正相关关系。

在具体数量上,行业间的收入差异占到总体个人收入差异的13%以上。这已经是一个相当高的比例。这表明,个人能力强并不一定能够保证更高的收入,进入一个好的行业在很大程度上也决定着收入的高低。

我们更进一步地看到,以往对行业影响收入的研究对影响机制与途径挖掘得不够深入。虽然个人特征(包括性别、年龄、教育水平等)对于收入的决定作用相当显著,但它们的这些决定作用往往都受到了行业特征的约束与调整。分析结果显示,行业特征对于个人层次特征的收入回报率的影响方向可能并不相同且显得复杂多样。例如,国有比例较高的行业对于性别造成的收入差异具有减缓的效应;而人力资本水平较高的行业对于教育的回报系数有进一步加强的作用。还有的行业特征并不是简单地减缓或加强个人特征的收入回报率,而是改变其效应曲线。例如,对年龄而言,在新兴行业与大规模行业中,年龄的收入回报曲线变得更为平缓。由此可见,这些行业层面的因素对于收入的影响绝不仅仅是在不同行业导致不同的平均收入这一个方面,它同时还改变了个人层次因素的回报方式,从而起到对收入分配的多重影响作用。

我们的分析目的较为特别,因此也需要我们使用特别的分析方法与数据。本文将两个数据对接起来,得到一个社会调查中少见的多层嵌套结构的数据,实现了对收入决定因素跨层级的分析。在我们看来,这样的做法不仅完成了对于本文涉及的理论问题的讨论,同时也为分析收入分配中制度性与结构性因素的相关研究提供了一个新思路。

毋庸置疑,本文的结果有助于我们理解行业作为结构性因素是怎样影响收入分配的。在理清了行业在两个层次对于收入分配的影响逻辑与途径之外,对照社会现实,本文的结果也给出了一个多少有些悲观的前景。研究收入分配机制的一个重要目标就是找出其决定机制,并且以此为出发点找出应对不平等的方案。但是,本文的研究结果显示,这会面临巨大困难。因为我们的结果直接指明,行业这样的结构性因素对于收入分配有着极大的影响作用,同时其影响机制与途径还非常复杂。垄断行业的高收入不仅仅是市场竞争的问题,也是市场如何建立起来的问题。另外,以工作资历为例,由于工作年限(年龄)的增加导致的人力资本的累积,仅是因为在不同行业里就可能带来完全不同的收入回报。在有些情况下,个人层次的资源累积是可以实现的(例如工作经验、教育等),但结构性的影响是个人无法控制的。显然,单纯谈论工作资历累积对于收入分配格局的变化影响是不够的,因为工作资历对收入的影响本身就受到行业特征的影响。如何面对这个问题,是今后不平等研究中需要特别关注的。

注释:

① 有学者测算,中国的基尼系数在1980年代后期已经超过0.3,1990年代超过了0.4,而到2005年左右有关估计认为已经超过了0.5。参见李强:《中国贫富差距的现状与趋势》,《中国与世界观察》2006年第1期。

② 奈特、宋丽娜:《中国城市工资差异的原因》,赵人伟、格里芬主编:《中国居民收入分配》,北京:中国社会科学出版社,1994年;李实、赵人伟:《中国居民收入分配再研究》,《经济研究》1999年第4期;蔡昉、都阳、王美艳:《中国劳动力市场转型与发育》,北京:商务印书馆,2005年;顾严、冯银虎:《我国行业收入分配发生两极分化了吗?——来自非参数Kernel密度估计的证据》,《经济评论》2008年第4期。

③ 参见综述性文章Arne Kalleberg and Aage Sorensen,“The Sociology of Labor Markets,”Annual Review of Sociology,vol.5,1979,pp.351-379.

④ James N.Baron and William T.Bielby,“Bringing the Firms Back in:Stratification,Segmentation,and the Organization of Work,” American Sociological Review,vol.45,no.5,1980,pp.737-765.

⑤ Arne L.Kalleberg,“Comparative Perspectives on Work Structures and Inequality,” Annual Review of Sociology,vol.14,1988,pp.203-225.

⑥ 王天夫、王丰:《中国城市收入分配中的集团因素:1986—1995》,《社会学研究》2005年第3期。

⑦ Nan Lin and Yanjie Bian,“Getting Ahead in Urban China,” American Journal of Sociology,vol.97,no.3,1991,pp.657-688.

⑧ Yu Xie and Emily Hannum,“Regional Variation in Earnings Inequality in Reform-Era Urban China,” American Journal of Sociology,vol.101,no.4,1996,pp.950-992.

⑨ 郝大海、李路路:《区域差异改革中的国家垄断与收入不平等——基于2003年全国综合社会调查资料》,《中国社会科学》2006年第2期。

⑩ 王天夫、王丰:《中国城市收入分配中的集团因素:1986—1995》,《社会学研究》2005年第3期。

(11) Alan Krueger and Lawrence Summers,“Reflections on the Inter-Industry Wage Structure,” NBER Working Paper,no.1968,1986.

(12) 例如,蔡昉、都阳、王美艳:《中国劳动力市场转型与发育》;顾严、冯银虎:《我国行业收入分配发生两极分化了吗?——来自非参数Kernel密度估计的证据》,《经济评论》2008年第4期。

(13) 更多总结性讨论见魏军:《中国行业收入差距研究综述》,《湖南文理学院学报(社会科学版)》2006年第2期。

(14) 信卫平:《当前我国行业收入差距的现状与特征》,《工会理论与实践》2004年第6期;蔡昉、都阳、王美艳:《中国劳动力市场转型与发育》;傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期;任重、周云波:《垄断对我国行业收入差距的影响到底有多大?》,《经济理论与经济管理》2009年第4期。

(15) 钟春平:《创造性破坏与收入差距的振荡扩大:基于中国行业工资的经验分析》,《上海经济研究》2004年第2期。

(16) 罗楚亮、李实:《人力资本、行业特征与收入差距——基于第一次全国经济普查资料的经验研究》,《管理世界》2007年第10期。

(17) 姚芳、姚萍、孙林岩:《我国行业间工资合理比例关系研究》,《山西财经大学学报》2004年第3期。

(18) 傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期;任重、周云波:《垄断对我国行业收入差距的影响到底有多大?》,《经济理论与经济管理》2009年第4期。

(19) Alan Krueger and Lawrence Summers,“Reflections on the Inter-Industry Wage Structure”.

(20) 魏军:《中国行业收入差距研究综述》,《湖南文理学院学报(社会科学版)》2006年第2期。

(21) 罗楚亮、李实:《人力资本、行业特征与收入差距——基于第一次全国经济普查资料的经验研究》,《管理世界》2007年第10期。

(22) 傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期。

(23) 任重、周云波:《垄断对我国行业收入差距的影响到底有多大?》,《经济理论与经济管理》2009年第4期。

(24) 罗楚亮、李实:《人力资本、行业特征与收入差距——基于第一次全国经济普查资料的经验研究》,《管理世界》2007年第10期。

(25) 傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期。

(26) 蔡昉、都阳、王美艳:《中国劳动力市场转型与发育》;顾严、冯银虎:《我国行业收入分配发生两极分化了吗?——来自非参数Kernel密度估计的证据》,《经济评论》2008年第4期。

(27) 傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期;任重、周云波:《垄断对我国行业收入差距的影响到底有多大?》,《经济理论与经济管理》2009年第4期。

(28) 罗楚亮、李实:《人力资本、行业特征与收入差距——基于第一次全国经济普查资料的经验研究》,《管理世界》2007年第10期。

(29) Ross Stolzenberg,“Bringing the Boss Back in:Employer Size,Employee Schooling,and Socioeconomic Achievement,”American Sociological Review,vol.43,no.6,1978,pp.813-828.

(30) 王天夫、赖扬恩、李博柏:《城市性别收入差异及其演变:1995—2003》,《社会学研究》2008年第2期。

(31) 王天夫、赖扬恩、李博柏:《城市性别收入差异及其演变:1995—2003》,《社会学研究》2008年第2期。

(32) 郝大海、李路路:《区域差异改革中的国家垄断与收入不平等——基于2003年全国综合社会调查资料》,《中国社会科学》2006年第2期。

(33) 罗楚亮、李实:《人力资本、行业特征与收入差距——基于第一次全国经济普查资料的经验研究》,《管理世界》2007年第10期。

(34) 王天夫、赖扬恩、李博柏:《城市性别收入差异及其演变:1995—2003》,《社会学研究》2008年第2期。

(35) 王天夫、王丰:《中国城市收入分配中的集团因素:1986—1995》,《社会学研究》2005年第3期;郝大海、李路路:《区域差异改革中的国家垄断与收入不平等——基于2003年全国综合社会调查资料》,《中国社会科学》2006年第2期;王天夫、赖扬恩、李博柏:《城市性别收入差异及其演变:1995—2003》,《社会学研究》2008年第2期。

(36) 需要指出的是,在上述Ross Stolzenberg与王天夫、赖扬恩、李博柏的文章中,他们挖掘了企业组织对于个人特征对收入影响作用的调整,使用的是经典回归模型中的交互效应。但是,他们的数据结构是非嵌套的,因而其本身也不支持HLM分析,也无法厘清不同层次的变量对于收入的影响份额。

(37) 详情及相关资料见国务院第一次全国经济普查领导小组办公室编:《中国经济普查年鉴2004》(综合卷),北京:中国统计出版社,2006年;以及http://www.stats.gov.cn/ZGjjpc网。

(38) CGSS2003是由中国人民大学社会学系和香港科技大学社会调查中心合作主持的问卷调查项目,南京大学、南开大学、吉林大学、兰州大学、武汉大学、上海社会科学院的社会学系、所合作参与了部分调查工作。本次调查以第五次人口普查数据为抽样框,在全国28个省、市、自治区的城市、城镇范围内采用PPS与分层设计的抽样方法共抽取了5900位城镇居民,实际完成样本5894个。详细抽样设计及相关资料可访问:http://www.chinagss.org.

本文分析中仅使用了CGSS2003的城镇样本,而全国经济普查包含了城乡经济实体。但是,本文所涉及的行业部分绝大多数应该集中在城镇,因此两个数据的对接是合适的。

在职与不在职的人员都进入了后面的分析当中,是基于以下三点考虑:一从理论上讲,不在职人员在退休之后的收入(也有继续做临时工的收入)在很大程度上是由他们以往的工作经历(从事的行业、职业或技能)所决定的,将他们包括到分析中来可以反映出行业的差异;二从统计模型的使用上讲,排除不在职人员之后个案数变得太少,使得模型无法正常运行;三从实际结果上讲,在代入是否在职的虚拟变量之后,整个模型的结果并没有什么变化,所有结论依然成立,显示包括不在职人员在模型中是合适的(感谢匿名评审人提醒我们对包括不在职人员的分析方案的再思考)。

(39) 这样的处理没有别的原因,仅为了提高分析结果的可读性。

(40) 通常主要有两类处理办法:一是将它处理成定序变量;二是将它处理成“教育年限”的定距变量。本文选择后一种处理办法。最主要的理由是,在实际运用中,进入HLM模型中的变量数越少,模型就越稳定。而第一种处理方法会一次性将多个二分变量代入模型,将使模型变得不稳定。另一个原因是,选择定距变量的处理办法可以使得原始数据的信息得到尽可能多的保留。因为无论如何进行分类,总免不了将一些接近的教育水平分到一类当中,但这样一来会使它们之间的差异被忽略。具体处理如下:小学未毕业教育程度=1,小学毕业教育程度=6,初中教育程度=9,高中教育程度=12,中专及职高教育程度=13,大专教育程度=15,大学本科教育程度=17,研究生及以上教育程度=20。

(41) 在第二层数据中,只有该变量不是来自中国经济普查年鉴。我们在CGSS2003中,按26类行业分别计算各行业中国有性质单位所占比例,生成该变量并放在第二层使用。之所以使用国有单位的比例,原因有二:第一,比起个人层面,所有制更应当作为一个结构层面的单位来使用。第二,在本研究中,由于结构层面所使用的单位是行业,我们显然无法说某个行业是“国有”、“集体所有”,还是“私有”。因此使用一个行业中的国有制单位的比例来代替,以描述该行业的所有制分布。

(42) 其中,因变量为年收入的对数形式,为各自变量的回归系数。这些自变量分别是:gender-性别、age-年龄、agesq-年龄平方(除以100以提高可阅读程度)、edu-教育年限、party-党员身份、working-是否在职工作,r为随机项。是否在职工作的变量是作为一个控制变量进入模型的,这样可以更多地保留整个研究中的样本数目。我们有充足的理由认为,退休人员与再就业(临时或是非全日制)退休人员的工作在很大程度上得益于他们以往工作的情况(包括行业、技能、经验等)。所以他们之间的工资收入差异也反映出退休前的工作差异。

(43) 其中,这些解释变量分别是:new-行业年龄、scale-行业规模、state-国有单位比例、eduhigh-行业高学历比例;行业虚拟变量为:indul-金融房地产、indu2-石油交通传输及供应。

(44) 在一系列的建模尝试中,我们发现如果不考虑行业高学历比例,则新兴行业变量的效应变为显著的正值,显示了新兴行业的高收入更有可能是建立在其行业本身对于人力资本的更高需求之上。

(45) 在其他建模尝试中,另有两个行业——科学教育、卫生文化及机关事业单位——收入也比其他行业更高。但在控制行业高学历比例后,这两个行业的收入趋于平均,表明了这两个行业的高收入在很大程度上是因为行业本身对人力资本具有更高的需求(感谢匿名评审人对这一结论的提醒)。

(46) 国有单位比例的取值范围是0.15—0.95,该变量对于女性收入的补偿作用(正向的;从0变成100%增加100个百分点)为[exp(0.226)-1]-0.254,经过折算得到这一结果。

(47) 不同规模行业中的年龄回报率的显著水平极为接近0.05。

(48) 这是增加100个百分点的效应。

(49) 这里高学历比例的取值范围是0.01-0.28。

标签:;  ;  ;  ;  ;  ;  ;  ;  

产业对收入的影响:基于多层线性模型的分析_收入差距论文
下载Doc文档

猜你喜欢