垄断行业高收入问题探讨,本文主要内容关键词为:高收入论文,垄断行业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
垄断行业高收入是社会各界普遍关注的对象,人们对垄断行业高收入的不满,可能源于以下四个原因。第一,垄断行业的工资收入明显高于其他行业,而且被认为超出了合理的界限。垄断行业的收入究竟有多高?这一点依赖于垄断行业以及与之比较行业的选择,同时也受收入范围的影响。劳动和社会保障部副部长步正发援引国家统计局数据显示,①按细行业分组,2000年工资最高的航空运输业为21342元,最低的木材及竹材采运业为4535元,两者相差4.71倍。2004年工资最高的证券业为50529元,最低的林业为6718元,两者相差7.52倍。这里使用的国家统计局的统计资料仅包括工资,而没有包括工资外收入和职工福利待遇。如果包括这两项的话,收入差距可能更大。第二,垄断行业的高收入主要来源于政府保护下该行业对市场的垄断,而不是这些行业在市场上成功竞争的结果,因此是不公平的。第三, 目前受政府保护的垄断行业主要由国有企业组成,作为全民财产的国有企业本应把一般消费者福利放在首位,但实际上并非都如此。垄断企业提供的产品和服务,其大部分与居民日常生活有着密切的关系,价格水平的高低直接关系到居民日常生活消费支出的大小,实际上,垄断行业高收入往往以一般消费者的福利损失为代价。第四,行业垄断已经成为目前我国收入不平等,尤其是城镇职工收入差距的重要成因之一。
行业垄断对我国目前收入不平等的贡献度究竟有多大?泰尔指数按人群组分解可以回答这个问题。②对我们界定的垄断行业和竞争行业进行泰尔指数分解的结果显示,③行业垄断对职工收入差距的贡献度为8.2%。如果以超过50%为标准来判定某一因素是收入差距的决定性因素,那么行业垄断不是城镇职工收入差距的决定性因素。但是现实中,很难找到一个对整体收入差距的贡献度超过50%的因素,因此不能判定行业垄断对收入差距的贡献不重要。判断行业垄断对收入差距贡献度的大小,可能需要把它与其他因素进行比较,④观察是否存在其他因素,其对收入差距的贡献度超过行业垄断。这里,我们按职工学历、年龄、性别以及是否是农民工等影响职工收入的主要因素对泰尔指数进行了分解,其贡献度超出行业垄断的只有教育。按职工学历进行泰尔指数分解时,组间差距为31.0%,超过了行业垄断,但按本文中其他因素分解得到的组间差距均小于行业垄断。⑤由此可见,在我们的研究范围内,行业垄断虽然不是导致职工收入差距的最主要因素,但也是仅次于教育的第二重要因素。
某一行业职工的高收入本身并不是问题,关键在于导致收入差距的原因是否合理。如果劳动力在不同行业之间能够自由流动,行业间工资差主要取决于职工在文化程度、年龄等个人属性上的差异,由此产生的收入差异应当视为合理的。如果垄断行业职工的受教育程度平均高于其他行业,或其职工多处于高收入年龄段,那么垄断行业职工的高收入并不一定是不合理的,至少可以说,并不是高收入的全部都是不合理的。因此,把垄断行业高收入区分为合理与不合理部分,观察其中不合理部分的比重,对于正确判断垄断行业高收入在多大程度上是合理的,至关重要。⑥这正是本文的目的。
本文以下部分的安排是:第一节界定垄断行业的范围以及与之比较的竞争行业;第二节交代实证方法、数据来源以及收入指标等;第三节给出并讨论实证结果;第四节进行稳定性检验;第五节是本文的主要结论。
一、何谓垄断行业
何谓垄断行业?或者说,垄断行业应当包括哪些行业?尽管人们对垄断行业高收入给予极大的关注,但不难发现,人们对垄断行业并没有一个明确的定义,通常把一些行业列举为垄断行业,但是被列举的行业却因人而异,有时仅涉及一个行业(如电力),有时则涉及几个行业。如何界定垄断行业,是包括本文在内的所有国内垄断行业研究面临的难题之一。
简而言之,垄断指由一个或者少数几个企业操纵的市场状态,是相对于完全竞争而言的。完全竞争的市场状态是指市场由无数生产者组成,每一生产者提供的产品数量都是微不足道的,从而对产品的价格没有任何影响。或者说,在完全竞争的市场状态下,市场价格对每一个生产者来说都是给定的。现实的市场状态与上述纯理论的假设不同,当市场上只有少数生产者或消费者,市场的进入和退出(尤其是进入)又有一定的限制,生产者或消费者对价格就有了一定的控制能力。因此,就生产的供给而言,某一行业企业个数的多少,企业是否能够自由地进入和退出该行业,个别企业是否对价格具有控制能力,或是否存在价格的管制,就成为衡量该行业市场竞争是否充分,以致是否存在垄断现象的重要标准。不完全竞争条件下的这些标准,也是我们下面界定垄断行业和与之比较的竞争行业时的重要依据。
导致垄断的原因主要有三个。第一,企业合谋会导致垄断。某个行业的几个大企业可以通过不正当合约来操纵产品的产量和价格,以此赢得不正当的高利润。第二,规模经济可以导致垄断,由规模经济导致的垄断叫做自然垄断。一些行业的生产技术决定该行业的企业在开始生产之前必须进行大量的投资,这种投入即固定成本。由于固定成本的存在,企业开始生产之后的单位成本随产品产量的增加而降低。对于存在规模经济的行业,其产品往往由单一企业供应时成本最低,最有效率。但是,这时无法避免企业抬高产品价格以损害消费者利益。电力和通信行业是规模经济的代表性行业。对于自然垄断行业,为了充分发挥其规模经济效益,同时避免自然垄断对消费者福利的损害,各国政府均施加管制,而管制方式无非有两种,一种是政府直接经营,另一种是在民营情况下对产品价格加以限制。第三,行政管制也是导致垄断的重要原因。出于某种特殊的需要或者由于某种特殊的原因,政府对某个或某些行业进行管制是常见现象。例如,银行业是各国政府普遍管制的行业,主要因为该行业具有很强的外部性,即使个别银行的经营不善,也会导致整个银行业甚至整个国民经济不稳定。因此,各国政府均通过设定行业准入标准、限定银行的业务范围以及限制存贷款利率等方式对该行业进行管制。再如,各国政府对电力行业的普遍管制,在防止自然垄断的同时充分发挥规模经济的效率。政府对某些行业的行政管制,是政府干预经济的方式之一,为了解决市场失灵,有效的行业干预能够改善经济效率。但是,作为行政干预的副产品,或者因为干预不当以及缺少有效干预手段等原因,行政干预往往会妨碍被干预行业的竞争,最终出现行政垄断。
在行业垄断的上述三个方面,各国具有共性。但是,与其他国家尤其是发达国家相比,我国行业垄断具有明显的特征,其主要形式是行政垄断。在对付自然垄断上,我国的行政管制不仅没有达到预期效果,反而保护了行业垄断,使潜在的自然垄断变成现实的行政垄断。
下面讨论如何具体界定垄断行业和与之比较的竞争行业。统计上通常用集中率(concentration ratio)衡量不完全竞争条件下垄断的程度。某一行业的集中率,通常定义为该行业销售额最大的几个企业(例如4个最大的企业)的市场占有率。在各国的实践中,分行业的集中率通常由本国反垄断当局计算和公布。我国由于没有行业集中率统计可以利用,因此通过集中率来界定垄断行业的做法是不可行的。⑦在这种情况下,本研究在界定垄断行业时考虑了行业中企业的个数、是否有进入和退出的限制以及产品或服务价格是否存在管制等因素,并参照了公众讨论中作为垄断行业列举的行业,最终把金融、电力、电信、烟草、石油、石化、运输、邮电等行业(详见表1上半部分)列入范围。⑧这些行业均具有以下几个特征。第一,这些行业内的企业个数都很少,这是企业操纵市场价格的必要条件。第二,国有企业或者国有控股企业在这些行业中占支配地位,与我国目前行业垄断主要是行政垄断的现实相吻合。⑨第三,这些行业中农民工的从业比重低,说明这些行业并没有通过参与竞争性劳动力市场,以降低劳动成本,而这恰恰是这些行业从业人员尤其是一般工人高收入得以维持的前提。⑩
垄断行业界定之后,需要选择与之比较的行业。当人们非议垄断行业高收入时,通常选择收入最低的其他行业与之比较,以突出垄断行业的高收入。这样的行业选择是可行的,但不是必需的。我国垄断行业高收入的原因主要在于政府对这些行业的保护,因此,作为与垄断行业相比较的其他行业,与其选择收入最低的行业,不如选择市场竞争较充分、政府管制较弱的行业,更能突出由行政垄断导致的垄断行业高收入的不合理性。那么,哪些行业的市场竞争最充分呢?鉴于上述行业集中率统计的缺失,这里遇到与界定垄断行业时相同的困难。我们把某个行业内相互竞争的企业个数众多且没有明显的证据表明一个或者少数几个企业占据该行业市场,作为评定该行业竞争充分的可行性客观标准。此外,从业人员总数中农民工的比重也是我们考察竞争行业的重要指标。虽然这与该行业产品市场的竞争程度(因而是否存在垄断)没有必然联系,但与该行业从业人员的工资水平是否接近竞争性劳动力市场有着直接关系。在城镇就业市场上,农民工是一个工资低、劳动保障条件差、雇佣和解聘较容易的群体,是城镇中最廉价的劳动力。如果某个行业农民工从业比重较高,说明该行业参与了竞争性劳动力市场,而不应该出现不合理的高工资收入。在选择竞争性行业时,应当选择那些农民工从业比重较高的行业。根据企业个数和农民工从业比重两个标准,我们最终把制造业中的轻工业、建筑业、批发和零售业、住宿和餐饮业、居民服务和其他服务业列为竞争行业(表1下半部分)。这些行业不仅企业个数多,而且农民工在行业从业人员总数的比重也是最高的(40.0%)。与竞争行业相比,垄断行业从业人员中农民工的比重是非常低的(3.1%)。从整个行业中,选择那些垄断程度较强的行业与市场竞争较为充分的行业进行比较,可以缩小行业界定对分析结果的影响。
二、实证方法、数据来源及其他
(一)实证方法
本文的目的在于测量垄断行业高收入中不合理部分的比重。具体的做法是,把垄断行业平均工资和竞争行业平均工资之差分解为合理部分和不合理部分,由此确定平均工资差距中不合理部分的比重。能够满足本研究需要的实证方法是劳动经济学中常用的Oaxaca-Blinder分解法。(11)该方法最初是为了解释性别工资差距而提出的,但是其后被应用到任何两组人群之间收入差距的分析中。Oaxaca-Blinder分解的对象是两组人群平均工资的差异,并且以回归分析结果为基础实现的。
以下以垄断行业和竞争行业为例,介绍Oaxaca-Blinder分解方法。该分解方法包括两个步骤。第一步是对考察对象的两组人群,分别估计收入方程式,此时使用相同的解释变量。用公式表示如下:
这里,“-”表示平均值;“^”表示收入方程式中参数估计值。该等式最右边的第一项表示回归方程常数项对工资差距的贡献;第二项是职工个人属性(教育、年龄等)差异的贡献;最后一项表示(对个人属性)回报率的贡献。这三项分别代表工资差异的不同决定要素,因此具有不同的含义和解释。第二项代表工资差距中由个人属性差异说明的部分,通常称为工资差异中的被解释部分(explained portion of the differential),这部分差异被认为是合理的。除第二项之外的其他两项,表示由个人属性之外的因素所导致的工资差异,通常称为工资差距中的未解释部分(unexplained portion of the differential)。由于这部分差异不是由教育、年龄等从业人员个人属性所导致的,是由歧视(discrimination)造成的,因此通常被认为是不合理的。
}
这种分解方式称为逆向分解(reverse decomposition)。标准分解和逆向分解的结果通常是不完全相同的,其中哪一个更能准确地估计收入差距的合理与不合理部分,取决于两组人群中哪一组的回报率估计值更接近竞争性劳动力市场的回报率。对于本文考察的垄断行业和竞争行业两组人群来说,竞争行业的劳动力市场可能更接近竞争性劳动力市场,因此基于竞争行业回报率的逆向分解可能更理想。在解释分解结果时,为了验证分解结果的稳定性,多数研究同时给出按两种分解方式的分解结果。本文亦遵循这一惯例。
由于使用不同的回报率和个人属性均值,标准分解和逆向分解的结果通常是不等的,有时相差相当大,这通常称为指数问题。Oaxaca-Blinder分解方法出现之后,研究者在解决指数问题上付出了极大的努力,其中最有代表性的是Cotton和Neumark的研究。(12)除了Oaxaca-Blinder分解之外,本文还尝试了Cotton分解和Neumark分解。在垄断行业高收入不合理部分估计值上,三种方法的分解结果基本一致。考虑到读者对Oaxaca-Blinder分解较为熟悉,因此本文第四、五节解释分解结果时只给出Oaxaca-Blinder分解结果。
(二)数据来源
本研究所用数据来源于2005年全国1%人口抽样调查,其样本量为996588户和2585481人,样本人数占该年全国总人口的比重超过2‰(0.00204=2585481/1265830000)。在分析行业工资差距上,该数据有以下几个优点。(1)样本量大。(2)行业分类细分到我国国民经济行业分类中的大类(共95个行业)。与此不同,绝大多数其他统计调查的行业分类均为门类,由于分类过粗,因此无法精确地界定垄断行业或者竞争行业。例如,无法把石油和天然气开采业从采掘业区分出来;无法把烟草制品业以及石油加工、炼焦及核燃料加工业从制造业中区分开来。(3)有收入数据可以利用。世界上绝大多数人口普查或者人口抽样调查均不收集有关收入的信息,我国以往的人口普查和1%人口抽样调查也不例外。但2005年全国1%人口抽样调查是个例外,它包括从业人员工资信息。工资信息的加入,使其他信息的使用价值大大加强。(4)有劳动时间(工作小时)的信息可以利用。衡量工资差距时,小时工资优于其他形式的工资指标(如月工资、年工资等),能够使工资差距的测量更准确。(5)有关于住户成员的基本信息,如性别、年龄、教育等。
(三)从业人员的定义
本文研究的对象是工资差距,因此,我们首先把样本限定在从业人员上,并对从业人员又作了进一步的限定。第一,只保留城镇从业人员,去掉第一产业的从业人员。(13)第二,在城镇从业人员中,我们仅仅考察就业身份为雇员的劳动者,就业身份为雇主、自营以及家庭帮工的,不在考察范围之内。把这些人排除在考察对象之外的一个重要理由是,在雇主和自营从业人员的收入中,有一部分是对其投资的报酬。如果收入中有资本所得,而解释收入差距时没有相应的变量,(14)收入方程式的估计系数以及工资差距中合理部分与不合理部分的估计值,都会出现偏差。第三,满足上述限定条件的从业人员包括城镇职工(具有城镇户口的从业人员)和农民工两部分。对于其中的农民工,除了具备拥有农业户口的条件之外,又增加了两个条件:(1)离开户口登记地超过半年;(2)离开户口登记地的目的为了务工经商。这些条件是定义农民工时最常见的。限定离开户口登记地必须在半年以上,是为了把农民工当中主要从事农业生产、偶尔外出打工的从业人员排除在外。
城镇就业人员总数中,农民工的比重很高,这是把农民工纳入考察对象的主要理由。但是,考虑到目前我国城镇劳动力市场中,有城镇户口的城镇职工和没有城镇户口的农民工在职业选择自由上仍然存在一定的差异,因此在下一节的实证分析中,除了对包括农民工在内的城镇全体从业人员进行考察之外,还就不包括农民工的城镇职工进行考察。剔除农民工后考察垄断行业和竞争行业之间的工资差距,可以排除刚刚提到的职业选择自由度差异造成的影响。
(四)收入指标的定义
讨论收入差距,离不开对收入指标的定义。相关文献多使用月工资或年工资等指标。但是很明显,与以月或年为单位计算的工资相比,按小时计算的工资(通常称为工资率)更能准确地反映工资差距。即使月工资或年工资完全相同的两个人,如果工作时间不同,以小时工资衡量的工资差距依然存在。如果月收入与工作时间之间存在负的相关关系(这正是我们后面所观察的),使用月收入指标会低估工资差距。2005年全国l%人口抽样调查提供了收入与劳动时间的数据,因此,本研究主要用小时工资来测算行业工资差。
三、实证结果与解释
这一节通过对垄断行业和竞争行业的工资差距分解,区分其中合理与不合理部分的比重。在进入分解之前,首先通过描述性统计观察两个行业之间的差异,表2给出了相关信息。
首先观察包括农民工在内的垄断行业与竞争行业之间的差异。垄断行业职工的月工资为1465元,竞争行业为1009元,前者是后者的1.45倍。从工资时间来看,竞争行业的周工作小时远远高出垄断行业,前者是后者的1.19倍。按小时工资衡量,垄断行业为竞争行业的1.65倍,明显大于按月工资衡量的工资差距。不包括农民工时,垄断行业和竞争行业的月工资均有所上升,但由于后者上升幅度更大,因此两类行业之间工资差距比包括农民工时小。不包括农民工时,竞争行业职工的周工作小时依然大于垄断行业,但是与包括农民工时相比,工作小时的差异有所缩小,竞争行业的周工作小时数为垄断行业的1.12倍。与包括农民工时相比,由于月工资与工作小时差异在垄断行业和竞争行业之间均有所缩小,因此,不包括农民工的两类行业小时工资差距明显降低,垄断行业小时工资为竞争行业的1.49倍,而包括农民工时为1.65倍。(15)
通过观察两类行业职工属性差异不难发现,在男性职工比重、平均受教育年限以及平均年龄方面,垄断行业均高出竞争行业。具体地说,垄断行业男性职工的比重为62%,高出竞争行业11个百分点;垄断行业职工平均受教育年限为12.4年,较竞争行业长2年以上;垄断行业职工的平均年龄较竞争行业大近4岁。职工收入差异至少部分来源于职工属性的差异。从下面收入方程估计结果可知,男性工资较女性高,职工工资随职工受教育年限和年龄的增加而上升。因此,从职工属性差异来看,垄断行业职工工资高于竞争行业是必然的(在其他情况一定的条件下)。关键是高出的部分在多大程度上是合理的,这正是本节实证的目的。
本文使用Oaxaca-Blinder分解法来测量垄断行业与竞争行业工资差异的合理与不合理部分。该分解方法的第一步是对两类行业分别估计收入方程,所使用的解释变量是相同的。表3给出了包括农民工和不包括农民工的估计结果。这里考虑的职工属性包括性别、受教育年限、年龄、(16)各省的城市生活费指数、(17)所在地区以及所从事的职业。(18)
从估计系数可知,相对于女性职工,男性职工的回报较高,而且高出程度在竞争行业较大。这在包括农民工和不包括农民工时都没有太大差异。包括农民工时,受教育年限的估计系数在垄断行业为10.86%,在竞争行业为8.87%,前者高于后者。收入方程中受教育年限的估计系数通常称为教育回报率。也就是说,在包括农民工时,垄断行业的教育回报率高于竞争行业。但是当不包括农民工而将样本局限于拥有城镇户口的职工时,垄断行业的教育回报率反而低于竞争行业,但是二者之间的差异不明显,可以视为相等。包括农民工与否,使教育回报率估计值出现明显的差异。具体地说,受教育年限每增加一年所带来的收入增长,具有城镇户口的城镇职工要高于农民工。从年龄及其平方的估计系数来看,工资收入首先随年龄的增加而增长,但是当达到一定年龄后转为下降。根据估计系数计算的这个关键年龄有所变化:垄断行业与是否包括农民工无关,大约在58岁左右,而竞争行业因是否包括农民工存在一定差距,包括时大约44岁,不包括时大约47岁。从估计系数大小来看,工资收入随年龄的增长幅度,垄断行业较竞争行业大。城市生活费指数的估计系数符合预期,生活指数越高的省份,收入也越高。
在得到收入方程的估计结果之后,即可对垄断行业和竞争行业工资差进行分解,分解结果显示在表4中。该表给出了包括农民工和不包括农民工两种情况的分解结果,并对每一种情况实施了标准分解和逆向分解两种分解。从表4可以看出,垄断行业和竞争行业之间的工资差距中不合理部分均超出了50%,与包括农民工相比,不包括农民工时不合理部分的估计值变大,达到60%。Cotton和Neumark分解结果显示,垄断行业高收入中不合理部分的比重也在50%以上。(19)由此可见,我们对垄断行业高收入不合理部分的估计值不受分解方法的影响。
垄断行业与竞争行业之间的工资差距及其不合理部分的比重可能因职业不同而不同,为此我们进行了分职业分析。表5分管理阶层、技术工人和一般工人给出了垄断行业和竞争行业的工资差距。表中的数字为小时工资的对数值,其含义是垄断行业小时工资高出竞争行业的百分比。从该表可以看出,包括农民工时,垄断行业管理阶层收入较竞争行业高19%,技术人员高出22%,而一般工人则高出48%。不包括农民工时,两类行业的工资差距在三种职业上均有所缩小,但是不变的是,与管理阶层和技术工人相比,一般工人的工资差距最大。
那么,垄断行业高收入中不合理部分的大小在不同职业之间又有怎样的差异呢?表6给出了分职业的分解结果。该表显示,无论是哪一种职业,工资差距中不合理部分的估计值因分解方法(标准分解和逆向分解),以及是否包括农民工而有所不同,但从四种分解结果的平均值来看,以技术工人最大(77.8%),一般工人次之(70.2%),管理阶层最低(62.7%)。另外,与包括农民工相比,不包括农民工时不合理部分的估计值变大。
以上有关分职业的分析结果显示,垄断行业和竞争行业之间工资差距及其不合理部分的比例以管理阶层为最低,但对于这一结论需予以特殊的注意。问题来自现行收入统计的缺陷。包括本文使用的2005年全国1%人口抽样调查在内,目前我国的收入统计都不能反映(至少不能完全反映)工资收入之外的其他货币和非货币收入,而收入的这种遗漏现象在垄断行业表现更为突出。垄断行业的管理阶层在福利住房占有、公车使用以及公款消费等方面,较竞争行业管理阶层更具有优势。如果把这些非货币收入考虑进去,管理阶层的收入差距在垄断行业和竞争行业之间会明显扩大,其中的不合理部分会因此增大。
以往研究发现,收入差距在地区之间存在显著的差异,东部地区最小,西部地区最大,中部地区居中,但在程度上更加接近西部地区。为了加深对收入差距的理解,我们分东、中、西三个地区考察垄断行业和竞争行业之间的收入差距,重点观察垄断行业高收入中不合理部分的比重是否存在地区差异。
表7分地区给出了垄断行业和竞争行业人均工资的对数值。从反映工资差异的数字可以看出,包括农民工时,垄断行业和竞争行业之间工资差异在中部地区最低,前者高出后者53%,其次为东部地区,差异最大的是西部,但是东部和西部十分接近。不包括农民工时,两类行业之间工资差异以东部最低,中部次之,西部最高。包括农民工与否,对东部地区两类行业工资差距变化的影响较大,其原因是东部地区吸纳了较多的农村流动人口,而流动人口在城市中是收入较低的群体,因此当包括农民工时,该地区垄断行业与竞争行业之间的工资差距明显上升。
表8分地区给出Oaxaca-Blinder分解结果。该表显示,垄断行业高收入中不合理部分的比重在东部最低,其估计值最大时也只有53%;中部和西部均高于东部,除个别情况外,均在60%以上,但两个地区十分接近。分地区分解结果的含义是,中部和西部两大地区垄断行业和竞争行业之间的工资差距,尤其是其中的不合理部分是导致这两个地区收入分配不平等程度高于东部的原因之一。
四、稳定性检验(robust test)
由于政府的保护,垄断行业高收入的一半以上是不合理的,这一实证结果是否可信,是否具有稳定性呢?本节讨论这一问题。
影响上一节实证结果的第一个因素是垄断行业和竞争行业的界定。鉴于上述行业集中率在统计上的缺失,垄断行业或者竞争行业界定范围某种程度的不确定性或变化,可能对垄断行业高收入中不合理部分的估计值产生影响。为了观察垄断行业高收入中不合理部分估计值对垄断行业和竞争行业范围的敏感程度,我们从表1的垄断行业和竞争行业中任意抽取部分行业部门进行了多次分解。结果显示,除了极个别的分解结果外,垄断行业高收入中不合理部分的比重均超过50%。另外,我们还从按大类划分的95个行业部门总数中,选取10%的人均工资最低的行业部门,与表1中的垄断行业进行分解,其结果与表4十分接近。这说明,上一节关于垄断行业高收入中不合理部分超出50%的分解结果,基本不受两类行业范围界定的影响。(20)
影响垄断行业高收入中不合理部分估计值的第二个可能因素是收入方程式中解释变量的变化。对此首先应当说明的是,从第二节Oaxaca-Blinder分解公式来看,收入方程式解释变量个数的多少与Oaxaca-Blinder分解结果没有直接关系。解释变量的多少可能直接影响收入方程式对个人收入差距的解释能力。一般地说,解释变量越多,R-squared的值越大,收入方程式的解释能力越强。但是Oaxaca-Blinder分解中被解释部分和未解释部分的大小与此没有直接的关系。观察解释变量对垄断行业高收入中不合理部分估计值的影响,只有通过实际改变解释变量后重新估计收入方程式。在收入方程式估计以及Oaxaca-Blinder分解时,上一节考虑了从业人员的性别、受教育年限、年龄、所在地区的生活费指数、所在地区和所从事职业等因素。由于2005年全国1%人口抽样调查搜集的个人与家庭信息有限,因此无法在表3的基础之上进一步增加解释变量,而只有通过减少说明变量的办法进行验证。上一节分职业和分地区的分解,实际上已经改变了收入方程式的解释变量。因为分职业分解时,解释变量中已经去除了职业虚拟变量,而分地区分解时,解释变量中则去除了地区虚拟变量。从分职业和分地区的分解结果来看,除了个别情况外,垄断行业高收入中不合理部分的估计值仍然停留在50%以上,与表4相比没有实质性变化。为了进一步检验解释变量变化对分解结果的影响,我们又进行了多次尝试。在表3的基础之上,首先去除职业虚拟变量,然后又去除地区虚拟变量,到最后只保留受教育年限及年龄两个因素,但是分解结果仍没有实质性变化,除极个别情况外,不合理部分的估计值均在50%以上。由此可见,解释变量的变化对分解结果并没有实质性影响。
作为可能影响垄断行业高收入中不合理部分估计值的第三个因素,我们考虑无法观测的从业人员能力因素。现实中个人能力的差异是一时难以观察到的,即使能观察到,在统计中也难以反映出来,这是长期困扰收入方程式估计的难题。无法观测的能力差异与受教育年限紧密联系在一起,一般地说,能力越强的人,在校期间成绩也越好,受教育年限也会越长,即个人受教育年限的长短可能与个人能力成正比。在估计收入方程式时,无法观测的个人能力会导致受教育年限系数的高估。如果垄断行业从业人员的个人能力普遍高于竞争行业,那么垄断行业受教育年限系数的高估程度要高于竞争行业,在其他情况一定的条件下,这会直接导致垄断行业与竞争行业工资差异中不合理部分的高估。把个人能力差异造成的收入差异视作不合理的做法,显然是不合理的。从平均水平看,垄断行业从业人员的个人能力可能在实际上高于竞争行业。由于其高收入,垄断行业在人员招聘过程中能够吸引更多能力较强的人应聘,因此有更多的机会选择能力最强或者较强的员工。垄断行业在劳动力市场上的这种优势,有可能导致垄断行业从业人员的个人能力普遍高于竞争行业。若此成立,以上关于垄断行业高收入不合理部分的估计有可能被夸大了。
把从业人员父母的受教育年限作为从业人员不可观测的个人能力的代理变量,引入收入方程式进行估计,是以往文献消除(至少缩小)不可观测的个人能力影响的办法之一。本文亦采取这种办法。从2005年全国1%人口抽样调查数据中,我们首先抽取与户主关系为子女的从业人员,然后建立其父母学历的变量。满足这一条件的家庭,是那些已经工作的子女并与父母居住在一起的家庭。这种家庭在城镇户口中不多,而对在城镇打工的农民工家庭来说就更少。由于满足条件的农民工家庭只有几户,因此我们最终把样本限于拥有城镇户口的家庭。即使如此,父母同在并且与已工作子女生活在一起的家庭也不多,而更多的是只有父母中一方的家庭。当我们把父母的受教育年限同时引入解释变量对收入方程式进行估计时,许多变量的估计系数虽然保持预期的符号,但均因观测值过少而不显著。为了增加观测值,我们仅仅把父亲或者母亲的受教育年限引入解释变量进行估计,由于二者的结果相差不大,这里仅报告基于父亲受教育年限的估计结果。
表9给出了收入方程式的估计结果。为了便于比较,表9除了给出包括父亲受教育年限的收入方程式估计结果之外,同时给出了使用相同样本,但没有包括父亲受教育年限的收入方程式估计结果,通过比较可知,引入父亲受教育年限后估计系数变化最大的变量为从业人员自身的受教育年限,该变量的估计值在引入父亲受教育年限后变小,在变动幅度上,竞争行业较垄断行业大,前者为-0.0144,而后者为-0.0089。
根据表9中收入方程式的估计结果,我们把垄断行业和竞争行业之间的工资差异分解为合理与不合理两部分,分解结果显示在表10中,表明收入方程式中是否包括父亲受教育年限(因而是否考虑无法观测的个人能力差异),对垄断行业高收入中不合理部分的估计值几乎没有影响。(21)由此可得出结论,如果父母受教育年限可以反映子女能力,那么,从业人员无法观测的个人能力差异对以上关于垄断行业高收入中不合理部分的估计值没有太大影响。
作为影响垄断行业高收入中不合理部分估计值的因素,最后需要考虑的是由收入统计缺陷带来的问题。本文使用的月收入指标,仅包括调查月份的收入总额,或者按年收入折算的月收入,包括现金和实物折合现金两个部分。(22)但是,这一收入指标没有包含福利住房、用人单位为职工支付的各种形式保险缴费(如企业年金)等福利收入。在垄断行业的各项福利较竞争行业普遍丰厚的条件下,本文使用的收入指标不仅低估了垄断行业与竞争行业之间的收入差距,同时也低估了垄断行业高收入中不合理部分的估计值。(23)我们试图测量低估的幅度。由于垄断行业福利收入的测量没有统计数据可以利用,我们采取的办法是,在保持竞争行业职工收入不变的同时,给垄断行业职工收入乘以一个大于1的系数,然后进行分解。应当说,收入指标对福利收入的低估,不仅限于垄断行业,竞争行业也存在。即使如此,只要垄断行业的低估程度大于竞争行业,这种做法得出的结论也是成立的。当我们给垄断行业职工收入乘以一个大于1的常数时,实际上假定垄断行业职工工资低估的百分比相同,但绝对数随统计工资(统计调查时登记的工资)增加而增加。由于统计工资和统计遗漏的福利收入受从业人员的职位、工龄、学历等相同因素影响,因此这一假定在一定程度上是合理的。
作为扩大垄断行业职工工资的系数,我们取1.2、1.5、2三个数值。1.2意味着实际收入(包括遗漏的福利收入)被低估了16.7%,(24)1.5和2意味着实际收入低估的百分比分别是33.3%和50.0%。表11显示分解结果。为了便于比较,我们把基于统计收入的分解结果显示在该表的最上面(和表4分解结果相同)。
从表11可以看出,垄断行业高收入中不合理部分的估计值随该行业收入低估程度的增大而增大。当假定实际收入为统计收入的1.2倍时,根据四种不同分解方法得到的不合理部分的估计值均超过60%。当假定实际收入为统计收入的1.5倍时,不合理部分的估计值均超过70%。当假定实际收入为统计收入的2倍时,不合理部分的估计值甚至超过80%。
由此可见,由于我国现行收入工资统计遗漏了职工收入中的福利收入,垄断行业与竞争行业之间的收入差距不仅被低估了,垄断行业高收入中不合理部分的比重也被低估了。上一节使用2005年全国1%人口抽样调查收入数据的分解结果,低估了垄断行业高收入中不合理部分的比重。
五、结论
本文应用Oaxaca-Blinder分解方法,通过把垄断行业高收入分解为合理和不合理两个部分,观察垄断行业高收入中不合理部分比重的大小。结果发现,垄断行业与竞争行业之间收入差距的50%以上是不合理的,是由该行业的垄断地位造成的。分职业看,垄断行业高收入中不合理部分的比重以技术人员最高,一般工人次之,管理阶层最低。但是与竞争行业管理阶层相比,垄断行业管理阶层在福利待遇和公款消费上更有优势,因此垄断行业管理阶层高收入中不合理部分的比重可能被低估。
与竞争行业相比,垄断行业的高福利不限于管理阶层,而是多少惠及垄断行业全体职工。由于目前收入统计未能反映垄断行业的高福利,因此整个垄断行业高收入中不合理部分的比重不可避免地被低估。为了纠正这一偏差,我们在假定垄断行业实际收入(包括福利等其他收入)为统计收入1.2倍的基础之上进行了Oaxaca-Blinder分解,结果显示,垄断行业高收入中不合理部分的比重超过60%;如果假定1.5倍的话,不合理部分比重则超过70%。
当分地区观察垄断行业高收入中不合理部分的比重时,东部地区最低,西部地区最高,中部地区居中,但十分接近西部。关于估计值稳定性检验的结果显示,垄断行业高收入中不合理部分比重的估计值,基本不受垄断行业和竞争行业界定范围以及解释变量变化的影响。把父母受教育年限作为从业人员个人能力代理变量的分解结果显示,无法观测的个人能力差异对垄断行业高收入中不合理部分的估计值没有影响。
注释:
①劳动和社会保障部副部长步正发在2006年5月14日召开的第三届薪酬管理高层论坛的发言,见步正发:《某些垄断行业工资过高》,《人民日报》2006年5月18日,第10版。
②泰尔指数是衡量收入不平等最常用的指标之一。通过泰尔指数分解测量行业垄断对收入分配的贡献度,是要把包括垄断行业和竞争行业在内的职工工资的泰尔指数分解为垄断行业内部收入差距、竞争行业内部收入差距以及垄断行业与竞争行业之间的差距等三项。其中第三项称为组间差距,它反映垄断行业和竞争行业之间的差距对职工整体收入差距的贡献,组间差距占整体泰尔指数的比重即为行业垄断对职工收入差距的贡献度。
③本文的分析对象仅限于城镇从业人员,不包括农村从业人员。农民工在城镇从业人员中占有较大的比重,也被纳入分析对象。我们界定的垄断行业和竞争行业没有包括所有的行业,因为很多行业很难界定为垄断行业还是竞争行业。如果把计算对象扩大为所有的行业,而且设定每个行业是垄断行业或竞争行业,组间差距占泰尔指数的比重将大大降低,从而会低估行业垄断对收入差距的贡献。
④在考虑两种以及两种以上因素对收入差距的贡献度时,最理想的分解方法是把所有因素都包括进去,然后同时进行分解,然后观察和比较各个要素的贡献度。目前能够满足这一要求的有基于回归分析的分解(regression-based decomposition)。但是,该方法对虚拟变量的处理存在一定局限性。具体地说,以虚拟变量表示的收入决定因素对不平等指数的贡献度随虚拟变量省略组(作为比较基准被省略的那组人群)的变化而变化。为此我们没有采用这种方法。关于基于回归分析的分解方法,参见Jonathan Morduch and Terry Sicular,"Rethinking Inequality Decomposition with Evidence from Rural China," The Economic Journal,vol.112,no.476 (January 2002),pp.93-106; Ximing Yue,Terry Sicular,Li Shi and Bjrn Gustafsson,"Explaining Incomes and Inequality in China," in B.Gustafsson,Li Shi and T.Sicular,eds.,Inequality and Public Policy in China,Cambridge:Cambridge University Press,2008,pp.88-117.
⑤按学历分解时,职工分为未上过学、小学、初中、高中、大学专科、大学本科、研究生及以上等7组,组间差距的贡献度为31.0%。按年龄分解时,职工从16岁到60岁,每5岁为一组,共分9组,组间差距的贡献度为3.4%。按性别分解时职工共分两组,组间差距的贡献度为2.1%。按是否为农民工分解时,职工分为农民工和具有城镇户口的城镇职工两组,组间差距的贡献度为6.1%。
⑥参见傅娟:《中国垄断行业的高收入及其原因:基于整个收入分布的经验研究》,《世界经济》2008年第7期。该作者使用DFL分解方法对垄断行业和竞争行业的工资差进行了分解,但是其研究使用的数据样本小、行业分类较粗(因此垄断行业和竞争行业的界定缺少准确性)。
⑦我国农业普查和经济普查的数据可以用来计算分行业的集中率。但是,有关方面既未利用该数据计算行业集中率,也未公布经济普查搜集到的企业层面数据。
⑧人们有时把医疗、教育也列举为垄断行业。但是,在“企业”个数上(医疗行业的医院及诊所等,教育行业的学校),这两个行业和上述我们界定的垄断行业明显不同,竞争者众多,出现患者或生源不足的现象。因此我们没有把这两个行业界定为垄断行业。
⑨有关国有工业企业利润率的实证研究表明,某些国有企业利润率高于同行业平均水平,主要原因是其技术创新投入超出行业平均水平。与此不同,烟草加工业、石油和天然气开采业以及电力、热力的生产和供应业等三大行业中的国有制企业,其利润总额每年超出其他行业国有企业利润总额的20%,其利润来源不是技术创新,而是行政垄断。参见严海宁、汪红梅:《国有企业利润来源解析:行政垄断抑或技术创新》,《改革》2009年第11期。这一研究结果与我们对工业中垄断行业的界定基本吻合。
⑩或许有人反驳说,垄断行业农民工从业比重低,是由于农民工不能胜任这些行业的岗位,而不是对农民工的歧视。我们承认,垄断行业中许多职位不是农民工可以胜任的,但并不是所有的岗位都是农民工不可胜任的,其中许多一般工人的岗位是农民工完全可以胜任的。我们的研究表明,在性别、年龄、教育程度等个人属性完全相同的条件下,农民工在国有企业(包括垄断行业)就业的概率远远低于具有城镇户口的城镇职工。如果我们承认教育程度等个人属性应当是一个人选择职业最重要的决定因素,那么农民工在国有企业就业比重较低的现状,表明存在着对农民工的歧视。关于农民工和城镇职工在就业上的差异,参见Sylvie Demurger,Marc Gurgand,Shi Li and Ximing Yue,"Migrants as Second-class Workers in Urban China? A Decomposition Analysis," Journal of Comparative Economics,vol.37,no.4,2009,pp.610-628.
(11)参见Ronald Oaxaca,"Male-Female Wage Differentials in Urban Labor Markets," International Economic Review,vol.14,no.3,1973,pp.693-709; Alan S.Blinder,"Wage Discrimination:Reduced Form and Structural Estimate," Journal of Human Resource,vol.8,no.4,1973,pp.436-455.
(12)关于Cotton与Neumark研究的原始文献,参见Jeremiah Cotton,"On the Decomposition of Wage Differentials," The Review of Economics and Statistics,vol.70,no.2,1988,pp.236-243; David Neumark,"Employers' Discriminatory Behavior and the Estimation of Wage Discrimination," The Journal of Human Resources,vol.23,no.3,1988,pp.279-295.有关Oaxaca-Blinder分解最新进展的综述,参见Ben Jann,"A Stata Implementation of the Blinder-Oaxaca Decomposition," ETH Zurich Sociology Working Paper,No.5,2008,forthcoming in The Stata Journal.该文献可从http://repec.ethz.ch/rsc/ets/wpaper/jann_oaxaca.pdf下载(2010年1月15日访问)。该文是其作者编写的Oaxaca-Blinder分解的Stata程序说明书,对分解公式以及分解程序等有非常详细的解释。对分解背后的劳动经济学含义感兴趣的读者,可直接阅读该文给出的原始文献。相关的中文文献可参见郭继强、陆利丽:《工资差异均值分解的一种新改进》,《经济学(季刊)》2009年第8卷第4期,尤其是其中的第一、二节。
(13)人们议论垄断行业高收入时,涉及的主要是城镇的职工,而不是农村中从事第一产业的劳动者。这是从分析对象中排除第一产业从业人员的主要原因。
(14)在我们使用的数据中,不存在解释个人资本收入的要素。
(15)需要说明,以上数据显示的垄断行业与竞争行业之间的收入差距,明显小于人们在谈论垄断行业高收入时出现的收入差距。这主要由于比较对象不同造成的。垄断行业高收入的讨论,通常把垄断行业中的高收入部门与收入最低部门的工资相比。与此不同,作为与垄断行业比较的部门,我们没有选择收入最低的行业,而是选择了市场竞争较为充分的行业部门。上文中步正发副部长在谈论垄断行业收入过高时,把收入最高行业的证券业与收入最低的林业进行了比较,前者的收入为后者的7.52倍。按本研究使用的数据计算,这两个行业的工资差距,按月工资计算为3.74倍(=2658.2/710.3),按小时工资计算为4.01倍(=14.95/3.73),其差距虽然不及步正发副部长援引的数据,但是明显大于正文中垄断行业和竞争行业之间的工资差距。
(16)Mincerian收入函数中的工作经历变量应当为职工工龄,而不是职工年龄。工龄较年龄更能准确地测量职工在岗技能积累以及由此产生的劳动生产率的提高。但是在现实中,由于数据资料通常有职工年龄的信息,而没有工龄的信息,因此年龄常常作为工龄的代理变量来使用,2005年全国1%人口抽样调查也是如此。以往研究曾经尝试用职工的年龄和受教育年限,间接估算职工工龄,计算公式通常如下:工龄=年龄-受教育年限-上学年龄(通常使用6岁)。这种计算方法会因职工上学年龄的差异以及失业经历而使工龄的估计值出现偏差。在这种情况下,年龄和工龄哪个指标更好,就难以判断。我们按照上述公式计算了职工工龄,用工龄取代年龄后重新估计了收入方程式并进行了Oaxaca-Blinder分解,结果变化不大。分解结果可以向作者索取。
(17)各省城市生活费指数来自Loren Brandt and Carsten A.Holz,“Spatial Price Differences in China:Estimates and Implications,”Economic Development and Cultural Change,vol.55,no.1,2006,pp.43-86.另外,关于变量的变化对分解结果的影响将在第四节进行讨论。
研究地区间生活费差异影响的另外一种方法是,从解释变量中去掉各省城市生活费指数,用其缩减被解释变量的收入,进行收入方程式估计和Oaxaca-Blinder分解。我们尝试了这样的估计和分解,结果发现,无论收入方程式中保留变量的估计系数,还是Oaxaca-Blinder分解中不合理部分的比重,都没有实质性的变化。估计结果可以向作者索取。
(18)以下分析中,一般工人被选择为其他两类职业从业的参照组,因此一般工人虚拟变量没有出现在收入方程式中。为了检验估计结果对参照组选择的敏感性,我们先后在省略了管理人员和技术人员虚拟变量的情况进行了重新估计,结果变化不大。估计结果可以向作者索取。
(19)包括农民工时,不合理部分的Cotton分解为56.3%,包括垄断行业虚拟变量时,Neumark分解为58.7%,不包括该虚拟变量时,Neumark分解为47.2%。不包括农民工时,相应的估计结果分别是61.3%、63.1%和54.6%。使用Neumark分解,收入方程估计不包括垄断行业虚拟变量会导致不合理部分的低估,参见前面引用的Jann一文。本文以下对所有Oaxaca-Blinder分解同时进行了Cotton和Neumark分解,其结果没有实质性的变化,故以下仅给出Oaxaca-Blinder分解结果。
(20)作者愿意按读者指定的垄断行业和与之比较的行业,提供Oaxaca-Blinder分解结果。
(21)把母亲受教育年限引入解释变量,或者把父母受教育年限同时引入解释变量(尽管一些变量的估计系数失去统计上的显著性)进行分解时,不合理部分的绝对水平及其变化与表10的结果基本相同。分解结果可向作者索取。
(22)详见2005年全国1%人口抽样调查方案中有关收入指标的解释。
(23)被解释变量扩大一定倍数后,解释变量的估计系数会扩大相同倍数。而解释变量估计系数的扩大,直接导致分解结果中不合理部分的扩大。这一点从正文的(2)式和(3)式方程中可以看出,在单变量回归时最明显。比如,当把y对x进行回归时,x的估计系数为;常数项估计系数为
。由此可见,估计系数会随被解释变量数值的增大而增大。假如被解释变量观测值都上升为原来的1.5倍,所有解释变量(包括常数项)的估计系数也会扩大1.5倍。解释估计系数和被解释变量扩大相同的倍数,这在多元回归时也是如此,只不过计算公式变得复杂而已。
(24)用w表示统计工资,包括福利收入在内的实际收入应当是1.2w,实际收入被低估的比例为:(1.2w-w)/1.2w×100≈16.7。