子女性别偏好对农户收入的影响分析,本文主要内容关键词为:农户论文,子女论文,性别论文,收入论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
改革开放以来,有两种现象同时出现在中国农村地区,分别是婴儿性别比的严重失衡以及农村家庭收入差距的逐渐扩大。以往对这两种现象的研究一直是相对分离的,直到近年来,随着农村地区计划生育国策贯彻过程中针对超生问题的实际措施逐步向以罚款(社会抚养费)为主转变,越来越多的人们将婴儿性别比严重失衡的主要原因归结为富人超生以及B超技术普及和低成本(Knight et al.,2008),并也引起了学者、政府和社会的广泛关注。那么,家庭收入与子女的个数及其性别之间到底有无系统性的关联呢?
国外许多实证研究揭示了子女出生和性别与父母亲工资收入和工作劳动供给之间的关系。Becker(1985)认为,母亲照料小孩和做家务的责任感使得她们相应花在工作上的时间要少于父亲,这使得父亲在工作上积累的人力资本要多于母亲,由于人力资本是报酬递增的,父母亲之间的专业化分工进一步使母亲减少工作时间而将其转移至家务劳动,所以,小孩的存在与母亲的劳动供给负相关。Korenman and Neumark(1992)通过实证研究发现,小孩的出生与母亲的工资存在着负相关关系,而且无论是混合多元回归模型还是一阶差分(FD)回归都低估了这种负向效应。Lundberg and Rose(2002)指出,小孩对父亲的工作有正向效应,因为有了小孩以后父亲要开始考虑为小孩准备大学学费,面临的资金约束趋紧,因而更加努力工作;他们还认为,男孩对父亲工作的促进效应要比女孩的大,这是由于男性在劳动力市场上的回报率高于女性,所以,小孩是男孩要比是女孩更能激发父亲努力工作赚钱以承担子女教育费用。
而在国内,相关的文献目前还比较缺乏,有关中国农村家庭收入和子女性别关系的研究最早是由Knight et al.(2008)做出的。他们首先使用横截面数据,描述了中国农村家庭收入与小孩是男孩之间存在正相关关系的统计性事实,并提出了内在的因果机制,即小孩是男孩对家庭收入有正向效应;最后他们构建一组假设检验,所得结果均支持这一机制。但是,受截面数据因果识别机制局限性的制约,该结果还有待动态回归分析的进一步支持。进行动态回归分析需要用到有一定时间跨度的面板数据(panel data),尤其是微观面板数据,而现有研究以截面数据回归分析为主,一些研究虽然使用了多期微观数据,但主要做的是统计性描述和假设检验(例如Knight et al.,2008),目前在这方面,还缺乏基于面板数据的动态回归分析。基于此,本文试图使用中国健康与营养调查(CHNS)面板数据进一步考察中国农村家庭收入和子女性别之间的关系,并通过面板模型对这种关系背后的因果机制进行检验,进而给出政策启示。
二、理论分析
关于家庭收入和子女性别之间的关系,现有的文献主要有两种观点。一种是“激励效应”。人们通常认为,小孩的出生会激励父亲增加劳动供给以提高工资收入,而且这种效应在小孩是男孩时要比是女孩时大一些,而母亲的劳动供给和工资与小孩的出生负相关,最终,家庭总收入受到小孩出生及其性别的影响(Lundberg and Rose,2002; Korenman and Neumark,1992; Waldfogel,1997; Browning,1992)。另一种是“选择效应”。这种观点认为,不存在所谓的“激励效应”,而是反过来,家庭的高收入影响家庭的生育决策,即生育率内生性(fertility endogeneity)。由于中国相对久远的“重男轻女”思想观念和现阶段特殊的生育政策,在生育行为受到约束的情况下,这种效应可能表现为:家庭收入高,父母亲更有能力支付罚款、B超及流产等方面的费用,因此,他们实施有选择的生育以得到意愿性别的子女(Handa,2000; Tabitha and Tisdell,2005; Knight et al.,2008)。基于统计性描述和假设检验得到的结果很多都支持“激励效应”假说(例如Lundberg and Rose,2002; Knight et al.,2008)。
通过借鉴国内外相关研究成果,结合中国农村居民文化观念和社会经济行为特征,本文对中国农村家庭收入和子女性别之间关系的内在机理提出了如下假说:在越晚的孩次上生出男孩的父母亲,面临的生育费用、罚款及抚养费用等方面的压力就越大,因而越有可能努力工作以增加家庭收入(假说一)。
父母亲在“重男轻女”思想观念形成的内在压力和外部压力下,通常有“不生出男孩就不会停止生育”的强烈心理和生育行为动机,在以限制超生为特征的计划生育政策背景下,父母亲会权衡超生以生出男孩得到的效用和引发的成本(巨额罚款、性别识别(B超)费用、流产费用、孕妇恢复费用以及抚养费用)的相对大小,因此,在理论上,每个农村家庭存在一个生育孩次的终止点,在这之前,只要没生出男孩,父母亲便不会停止生育。这就意味着,父母亲将承担越来越重的超生罚款、性别识别、流产和孕妇恢复等方面的费用以及抚养费用,从而越有可能努力工作以增加家庭收入。
在中国,通常男方要承担全部或大部分的结婚和购房等大项开支,加上男孩的平均受教育时间也要更长一些,而且这些通常并非由儿子自行承担而是由其父母亲筹备,因此,对那些子女个数相同并且其个数不会再增加的家庭来说,父母亲工作的努力程度和家庭收入又会因小孩的性别而异。由此本文提出如下假说:如果同为独生子女家庭,小孩是男孩的父母亲一般要比小孩是女孩的父母亲更加努力工作赚钱;如果第一胎性别相同,那么,第二胎是男孩的父母亲要比第二胎是女孩的父母亲更加努力工作赚钱(假说二)。
三、模型构建与数据来源
(一)计量模型
本文将使用混合多元回归模型和面板模型对子女出生及其性别与父母亲经济行为之间的关系进行估计。家庭年收入及工作劳动总时数是反映父母亲经济行为的常见指标。
本文基本的计量模型如下:
(二)数据来源
本文所用数据取自中国健康与营养调查(China Health and Nutrition Survey,简称“CHNS”),它由美国北卡罗莱纳大学人口研究中心和中国疾病预防控制中心营养与食品安全所联合实施。该调查迄今为止已进行并整理完成了7次②,共涉及东部、中部、西部9个省(区)③,由于采取的是追踪调查,所以,该数据为面板数据。该调查采用多段随机抽样的方法(multistage and random cluster sampling),在抽样时兼顾地理位置、经济发展水平和公共资源丰裕程度,除了选取每个省(区)的省会并随机抽取一个较低收入的城市外,还在每个省(区)依据收入分层和一定的权重随机抽取4个县,然后抽取每个县的城关镇和3个村(3个村按照在县里的收入分层来抽取),在城关镇和3个村各调查20户。
参照相关文献的通行做法,本文在样本选取上采用如下几点标准:取被调查时母亲的年龄在52岁以下的样本④,分开考察独生子女家庭(后简称“一孩家庭”)和有两个孩子的家庭(后简称“两孩家庭”)⑤。由于后两次调查的样本中子女的个体特征信息缺失严重,对这两个年份的数据予以剔除,最终样本主要变量的数据描述分别见表1和表2。
与Knight et al.(2008)的做法一致,本文定义一组虚拟变量以表示子女的出生和性别特征。在表1中,这组虚拟变量分别是小孩是否己出生和小孩性别;在表2中,这组虚拟变量包括:头孩是否已出生、二孩是否已出生、头孩性别、二孩性别、头孩是女孩二孩是男孩、头孩是女孩二孩是女孩、头孩是男孩二孩是男孩、头孩是男孩子二孩是女孩。其中,“是否已出生”表示的是小孩的出生时间是否早于调查时间。
表1和表2中的家庭年收入来自CHNS以下分项原始数据的加总:工资收入、奖金、补贴(包括副食补贴、保健补贴、洗理费、书报费、房屋补贴和其他补贴)、务农收入、家庭园艺收入、家禽畜牧收入、渔业收入以及商业收入。为使不同省(区)在不同年份的家庭收入具有可比性,本文参照CHNS文件中的做法,使用统计年鉴中的物价指数数据⑥ 重新推算,得到以1988年辽宁省平均物价水平为统一基准的各省(区)各年城镇物价指数,用它对家庭名义年收入进行平减就得到了对应的家庭实际年收入,具体可参见罗凯(2009)。
本文研究所涉及的其他一些主要变量还有:父母亲受教育年数、父母亲年龄及其平方项、小孩年龄、家庭生产性资产及家庭规模,其中,家庭生产性资产主要包括生产工具和交通工具。这些变量的数据描述见表1和表2。
从表3不难发现,一孩家庭中小孩是男孩的,家庭年收入的均值更高,收入均值无差异单侧t检验的p值为0.036,拒绝原假设,表明均值差异是显著的,即男孩家庭年收入均值更高。
对于两孩家庭,在小孩性别的四种组合下其家庭年收入的比较见表4。头孩是女孩的两类家庭中,二孩是男孩的要比二孩是女孩的家庭年收入平均高出13.88%,收入均值无差异单侧t检验的p值为0.040,拒绝原假设,说明均值差异是显著的,即二孩是男孩的家庭年收入均值更高。头孩是男孩的两类家庭的年收入,未表现出二孩是男孩的家庭年收入高于二孩是女孩的家庭年收入,反而二孩是女孩的家庭年收入略高,但仅相差0.75%,而且基于这两类家庭在各时期样本数据的差异性检验结果显示,这种差异并不显著(t检验的p值为0.935),这可能是父母“儿女双全”愿望所产生的次级反应造成的(陈彩霞、张纯元,2003)。将头孩是女孩的两类家庭以及头孩是男孩的两类家庭各归并为一组,对这两组做收入均值无差异单侧t检验,得到p值为0.001,拒绝原假设,均值差异显著,表明头孩是女孩的两孩家庭年收入均值更高。
四、计量结果与分析
这部分首先报告混合多元回归模型和面板模型的基本回归结果,得到子女出生及其性别对家庭收入的影响,然后通过探究子女出生及其性别与父亲工作劳动总时数之间的关系来考察这种影响得以产生的内在机制⑦。
(一)基本回归
表5为一孩家庭情况下的混合多元回归模型和面板随机效应模型的回归结果。结果表明,男孩的出生对一孩家庭的年收入有促进作用⑧,支持了本文前面的假说二,与Lundberg and Rose(2002)的结果也是一致的。在模型(1)中,男孩家庭的年收入要比女孩家庭高15.8%,即使在同时考虑性别和出生因素的模型(2)中,小孩是男孩对家庭年收入的激励效应也达到15.6%,这与Knight et al.(2008)使用截面数据分析得到的12.4%较接近。模型(3)的结果表明,子女性别与子女出生相乘所得指标“男孩的出生”对一孩家庭年收入的综合促进效应为22.7%,这一增幅相当于1760元(以1988年辽宁省平均物价水平为参照基准)。
表5中的模型(4)和(5)是面板随机效应模型的估计结果。子女出生的效应为正,但不显著⑨,男孩出生的估计系数达0.224,显著且为正。这表明,男孩的出生平均而言能够使一孩家庭的年收入增加22.4%,这与模型(3)混合多元回归模型的回归结果一致,说明对这一效应的估计是稳健的。
父母亲受教育年数对家庭年收入的作用始终为正,而且父亲受教育年数的系数接近母亲的两倍,说明在受教育年数相同时,父亲对家庭收入的贡献远大于母亲,这可能反映了中国农村劳动力市场存在着性别歧视;生产性资产价值对家庭年收入的作用也为正。这些结果与Knight et al.(2008)是互相支持的。此外,这里还控制了子女年龄、父母年龄及其平方项、家庭规模和年份虚拟变量等变量,但这些变量都不显著。
表6为两孩家庭的混合多元回归模型和面板模型的回归结果。从表6中的结果看,二孩出生对家庭年收入的作用不显著。与Knight et al.(2008)的做法一致,以头孩是男孩二孩是女孩的性别组合为参照组,模型(1)和(2)的估计结果均显示,头孩是女孩二孩是男孩的家庭年收入显著高出23.1%,头孩和二孩都是女孩的家庭年收入显著高出15%以上,头孩和二孩都是男孩的家庭年收入略微高一些但不显著。混合多元回归模型的估计结果支持了假说一和假说二,即男孩越晚出生的家庭收入越高(假说一),同时,头孩为女孩的两孩家庭中,二孩是男孩的家庭收入比二孩是女孩的家庭收入要高(假说二)。
依据头孩性别将四类两孩家庭分成两组(见表4),则上述结果更加清晰。在头孩是女孩的组内,二孩是男孩的家庭年收入要比二孩是女孩的家庭高一些,这支持了假说二,头孩是男孩的这组,二孩是男孩的家庭年收入要比是女孩高一些,未拒绝假说二,只是不显著;但在这两组之间,头孩是女孩的那组家庭的年收入要比头孩是男孩的那一组高一些,这支持了假说一。模型(4)和(5)的面板模型估计显示出相似的结果,虽然显著性有所降低,该结果不但克服了截面回归中存在的异质性问题,并部分削弱了生育率内生等截面回归无法处理的问题。
将这一结果与表5所列的一孩家庭估计结果结合起来看,相比而言,头孩性别对家庭收入的影响最大,这可能与中国农村“重男轻女”的思想观念和计划生育政策有关。“只能要一胎”的基本生育政策使父母亲对头孩的出生和性别都抱有很高的期望。两孩家庭中,对于二孩的出生绝大多数都需要支付罚款(头孩有病残除外),二孩的生育更可能是对生子愿望在第一孩次落空时的“补救”措施,这导致了两孩家庭中头孩是女孩的那部分家庭的父母亲更可能有生育二孩的动力,并因此对负担加重的预期更明确,也会更加努力以增加收入(Lin and Luoh,2008)。这些表明,本文假说一存在有力的证据支撑。
两孩家庭模型中生产性资产价值对家庭年收入的作用与一孩家庭模型的回归结果相似,始终为正且显著;但父母亲受教育年数的效应则变化较大,母亲受教育年数显著,而且其效应的大小与父亲受教育年数相当。如果将父母亲受教育年数的估计系数的比率作为父母亲教育回报率的近似度量指标(Li et al.,2005),则这一结果表明,在生完二孩后,父母亲教育回报率大致从2降至1。这可能是由于母亲为照料二孩而缩短工作时间,父亲则延长工作时间,从而父亲和母亲的教育回报率发生消长。此外,该模型还控制了两子女年龄、父母亲年龄及其平方项、家庭规模和年份虚拟变量等变量,其中,控制两子女年龄指标是由于出生间隔长度可能会影响子女性别与家庭年收入之间的关系,但这些变量都不显著。
(二)作用机制分析
在上面的回归中,本文分别考察了一孩家庭和两孩家庭中影响家庭年收入的各种因素,并对子女出生及其性别的效应进行了估计。但是,家庭年收入与子女出生及其性别之间这种关系的作用机制也可能不是假说一和假说二所设想的那样。为此,在前文的基础上,本文对父亲工作劳动总时数的变化做进一步的回归分析,以验证家庭年收入与子女出生及其性别之间关系的内在机制是否与假说符合。
这里使用个人年度加总的工作劳动时间数,以考察父亲的工作努力程度是否受到子女出生及其性别的影响。表7为一孩家庭模型的回归结果。从混合多元回归模型的结果看,一孩家庭中,小孩是男孩相对于小孩是女孩,其父亲的工作时间会显著延长28.5%,这与假说二相吻合。这表明,小孩是男孩相比是女孩,父亲工作的努力程度会增大。表7中面板模型(4)中的子女出生变量和模型(5)中男孩出生变量的效应均为正,虽不显著,但它们与年份效应的联合检验结果是显著的。
表8给出了两孩家庭父亲总工作时间的回归结果。以头孩是男孩二孩是女孩的性别组合为参照组,模型(1)和(2)的估计结果均显示,头孩是女孩二孩是男孩的父亲工作时间显著长出30%以上,头孩和二孩都是女孩的父亲工作时间显著长出17.5%,这与假说一和假说二是一致的;头孩和二孩都是男孩的父亲工作时间略微长一些,但不显著,与假说二相吻合。
与对表6中估计结果的分析思路相似,将四类两孩家庭按照头孩的性别分为两组。从表8中的结果不难看出,在每一组内,二孩是男孩对父亲工作的激励效应要强于二孩是女孩,这与假说二相一致;但在这两组之间,头孩是女孩对父亲工作的激励效应要强于头孩是男孩,假说一再次得到了验证。面板模型(4)和(5)的估计结果相似,虽然显著性有所降低,但克服了截面回归中存在的异质性问题,并部分削弱了生育率内生等截面回归无法处理的问题。
表7和表8中的结果与表5和表6中基本回归对家庭年收入所做的估计结果是一致的,家庭年收入高是由于父亲工作的努力程度增大所致,而父亲努力程度的大小又受到子女性别特征的影响。这为本文的两个假说提供了证据,并与Knight et al.(2008)使用截面数据验证得到的子女性别对家庭年收入存在促进作用的激励效应观点相呼应⑩。
由于按照头孩性别将两孩家庭分成两组后,子女性别激励效应在头孩为女孩的那组家庭上的表现要比头孩为男孩的那一组更大,而且在表4中,头孩是男孩的两类家庭中,二孩是女孩的要比二孩是男孩的家庭年收入略高(但检验结果显示该差异不显著),因此,有观点认为,这说明父母可能是为了满足“儿女双全”的愿望而生育二孩(陈彩霞、张纯元,2003),本文将这一观点简称为“花色需求”效应假说。本文不否认中国农村家庭可能存在“儿女双全”的愿望,这在表4中对头孩是男孩的两类家庭年收入的差异性检验与假说二似乎不一致有所体现。但大量数据描述和回归结果都表明,支撑子女性别与家庭年收入之间关系的内在机制并不是“花色需求”效应。首先,在表4中,头孩是女孩二孩是男孩的家庭年收入均值高于头孩是男孩二孩是女孩的家庭且显著,而这两类家庭的子女性别组合均满足父母可能存在的“花色需求”,“花色需求”效应假说无法对此做出解释。其次,对于表6两孩家庭年收入回归结果中,头孩是女孩二孩是男孩的家庭年收入显著比头孩是男孩二孩是女孩的家庭高出20%以上,“花色需求”效应也无法解释这一结果。相应地,父亲工作时间的回归结果与家庭年收入的回归结果相似,同样无法用“花色需求”效应来解释。可见,“花色需求”效应假说得不到数据结果的支持。而且,与这些拒绝“花色需求”效应假说的证据形成鲜明对比的是,基于各期样本统计描述所做的头孩是男孩的两类家庭年收入差异性检验结果不显著。
本文可能受到的另一个质疑是,回归结果可能受到现阶段中国女婴瞒报漏报现象引起的样本选择性偏差的影响,进而可能高估子女出生及其性别激励效应。由于流产、人为的性别选择以及逃避超生处罚的“黑户”二孩的数据不可得,本文无法对由此可能引起的估计偏误做定量测算,不过,仍然有统计证据证明该问题影响微弱。在本文数据中,两孩家庭中两个小孩的平均出生间隔为4.51(=13.93-9.42)年,对于头孩为女孩的家庭,两个小孩的平均出生间隔则为4.64(=13.53-8.89)年,两数之差小于鉴定、流产和再孕所必需的至少半年以上时间。这可以部分排除CHNS数据中存在由于流产、人为的性别选择引起的子女出生信息遗漏问题。由于农村计划生育政策的变迁,到2000年大部分农村地区都允许生两个小孩,而CHNS数据对每个家庭分别在:1993年、2000年和2004年确认其子女数,因此,基本可以认为,“黑户”二孩问题对本文所用数据几乎没有影响。
五、结论
本文使用CHNS面板数据,对子女出生及其性别与家庭年收入和父母亲劳动时间之间的经验关系和作用机制做了较深入的研究。研究发现,中国农村家庭中,男孩出生将使得家庭年收入增加近1760元,比女孩出生多近1160元。在两孩家庭中,子女的性别组合对家庭年收入的激励强度由高到低排序,依次为:头孩是女孩二孩是男孩>头孩是女孩二孩是女孩>头孩是男孩二孩是男孩>头孩是男孩二孩是女孩。头孩是女孩(无论二孩是男是女)的激励效应要比头孩是男孩(无论二孩是男是女)的大,头孩是女孩的家庭中,那些二孩是男孩的家庭年收入又比二孩是女孩的家庭年收入高一些,这可能是由计划生育政策与男孩偏好共同作用所导致的。这种年收入的增加主要来源于父亲努力程度的提高,随着时间的延长,子女性别的激励效应逐渐累积,可能会拉大农民家庭的收入差距。以一孩家庭为例,小孩是男孩的家庭由于父亲更努力地工作,其家庭年收入比小孩是女孩的家庭多出近1160元,是2000年农民纯收入的一半多,这是中国农村地区收入差距的一种可能的来源。
注释:
① 相对于使用截面数据所做的多元回归估计,使用面板数据进行估计能够部分削弱子女出生及其性别变量可能存在的内生性问题,事实上,通过将一孩家庭与二孩家庭样本合并做上述回归,考察父母对二孩的出生及其性别可能存在的选择行为,所得结果与两个假说都一致;进一步整理三孩家庭样本(很少),并将其与二孩家庭样本合并再做上述回归,考察父母对三孩的出生及其性别进行选择的可能性问题,结果仍与两个假说一致,但基本不显著。
② 依次为1989年、1991年、1993年、1997年、2000年、2004年、2006年。
③ 前四次调查覆盖广西、贵州、河南、湖北、湖南、江苏、辽宁和山东8个省(自治区),1997年加入黑龙江省,取代了辽宁;2000年辽宁重新纳入调查,这之后的调查包括上述全部9个省(自治区)。
④ 本调查共分Household survey、Nutrition Survey、Physical EXamination、Energy Record、Community Survey、Ever-Married Women Survey 6个部分,子女排行及其性别信息来自问卷Ever-Married Women Survey。与其他5个部分不同,该部分仅对52岁以下妇女做调查。
⑤ Knight et al.(2008)指出这样做便于控制家庭规模异质性及其效应差异。在他们的调查中,一孩家庭样本限定为子女在10岁以下,两孩家庭样本限定为子女在15岁以下。这样做可以避免子女已工作不再是抚养对象的情形。在本文中,符合该条件的两类家庭样本数占总数的81.91%。为避免可能存在的样本自选择带来的估计结果偏误问题,本文在回归中还替代使用了Heckman两阶段估计法,发现结果基本不变,只是解释变量的显著性略有下降。
⑥ 各省(区)各年的农村物价指数数据源自《中国统计年鉴》(1990~2006年,历年)的“各地区全社会零售物价总指数”,该指数一般以本省(区)上年值为基数。
⑦ 因篇幅所限,没有汇报对母亲工作劳动总时数所做的回归结果。而且因CHNS的照料子女时间为家庭层面数据,个人层面数据不可得,受此限制,也未能对母亲家庭劳动总时数做回归及更进一步的分析,这点是本文的不足之处。
⑧ 回归结果中,子女出生变量不显著与其跟年份虚拟变量之间存在多重共线性有关。在未控制年份效应时,子女出生对家庭年收入的促进作用为37.4%,且在5%的水平上显著;控制年份效应后,其促进作用仍达24%,虽然单独不显著,但与年份虚拟变量的联合检验显著(p值为0.0002)。
⑨ 子女出生变量在15%水平上显著。进一步对该变量结果与年份效应结果做联合检验,p值接近于零,说明该变量虽然单独不显著,但与年份虚拟变量的联合检验显著。
⑩ 由于父亲还可能选择不延长工作劳动时间但转而从事强度更高或更复杂的职业,来达到增加家庭收入的效果,为此,笔者还用“是否转换职业”指标对父亲的职业转换行为进行了考察,其结果与工作劳动总时数的回归结果基本一致。对母亲工作劳动总时数和“是否转换职业”的回归结果大都不显著,子女出生及其性别的符号为负,其绝对值均小于用父亲工作劳动总时数和“是否转换职业”所做回归的结果,而且相对稳健。这与Becket(1985)基本是一致的。
标签:回归模型论文;