基于半参数广义可加模型的居民个人收入影响因素分析论文

基于半参数广义可加模型的居民个人收入 影响因素分析

刁海涛

南京财经大学应用数学学院,江苏南京,210023

摘要: 将半参数回归与广义可加模型结合,应用于居民个人收入影响因素研究。结果表明,在影响个人收入的诸因素中,个人能力、受教育年限、潜在经验和是否居住在城市对居民个人收入的影响是参数效应,影响均表现为正效应;而父母受教育的年限对居民个人收入影响是非参数效应。对比参数模型和半参数广义可加模型,半参数广义可加模型的实证结果解释能力更强,更加符合实际。

关键词: 半参数;广义可加模型;居民个人收入

在传统统计分析的数据处理中,观测值表示为一组参数的线性函数,而线性回归模型只是观测值与参数关系的近似表达,不能很好地反映实际问题,且模型参数的精度受到测量方法的影响[1]。Engle等引入的半参数回归模型,包含参数部分和非参数部分[2],与Hastie等提出的广义可加模型结合[3],产生了半参数广义可加模型,解决了传统线性模型的问题。该模型的参数部分把握因变量的走向趋势,可以外延、适于预测;非参数部分可对因变量进行局部调整,使模型更加精确地拟合样本数据,误判风险降低,避免“维数灾难”[4]。这种模型既含参数分量,又含非参数分量,可以更加灵活地概括和描述更多实际问题,应用更加广泛。本文通过半参数可加模型,分析居民个人收入的影响因素。

1 模型理论基础

1.1 广义可加模型

经典的线性回归模型假定被解释变量Y 与解释变量X 1,X 2,…,X p 是线性形式,如:

E (Y |X 1,X 2,…,X p )=β 01X 12X 2+…+β p X p

(1)

其中,β 12,…,β p 通过最小二乘法获得。

本研究构建了丁香酚微乳,并采用海藻酸钠进行修饰,研究海藻酸钠修饰对丁香酚微乳粒子特性、包封率、pH、离子稳定性及释放特性的影响,旨在为提高丁香酚在食品工业中的应用提供一定参考价值。

根据最小二乘估计思想,利用R软件[5]对模型Ⅰ(式5)进行求解(结果见表1)。

E (Y |X 1,X 2,…,X p )=s 0+s 1(X 1)+s 2(X 2)+…+s p (X p )

(2)

广义可加模型是线性可加模型的扩展:

其中,s i (·),i =1,2,…,p 是光滑函数,Es i (X i )=0,s i (·)通过backfitting算法获得。

自然沉降法是依靠重力沉降达到净化油浆的目的,其方法具有设备简单、投入成本低、操作简便等特点。但因催化剂粉末的成分为硅酸铝晶体(Al2O3-SiO2),其在催化裂化装置中磨损或受热破裂,形成粒径多为20μm以下的细小粉末,高度分散在油浆中,仅靠重力沉降难度大、耗时、脱除率低,因此该法已被淘汰。

g (μ )=s 0+s 1(X 1)+s 2(X 2)+…+s p (X p )

(3)

其中,μ =E (Y |X 1,X 2,…,X p ),s i (·)是非参数光滑函数,它可以是光滑样条函数、核函数或者局部回归光滑函数,它的非参数部分提高了模型的灵活性,揭示出解释变量对被解释变量的非线性影响。

1.2 半参数广义可加模型

若对所有解释变量都进行非参数拟合,则会导致计算量加大和过度拟合等问题。有时可根据实际情况,将被解释变量与部分解释变量的关系简化成参数形式,会更便于解释,即半参数广义可加模型(Semi-parametric Generalized Additive Models):

(4)

为研究家庭和受教育环境对居民个人收入的影响,本文选取伍德里奇《计量经济学导论—现代观点》HTV.RAW数据。该数据包含1991年1 230个个人的家庭背景、收入及其他情况,包括wage (每小时收入)、abil (能力,不可观测)、educ (受教育年限)、exper (潜在经验)、urban (是否居住在城市)和lwage (收入的自然对数)等变量,相对全面地呈现了个人成长环境。为方便分析,选择abil 、educ 、exper 、urban 、fatheduc (父亲受教育年限)和motheduc (母亲受教育年限)6个变量作为自变量,取lwage 为因变量,研究收入的影响因素。分别做abil 、educ 、exper 、fatheduc 和motheduc 与lwage 的散点图(图1和图2)。

2 数据说明及描述性统计

其中,p ≥r +1,r ≥1,s 0是常数项,g (·)为连接函数,模型的线性部分为非参数部分为

图1abil 、educ 和exper 与因变量lwage 的散点图

图2fatheduc 和motheduc 与因变量lwage 的散点图

总之,冠心病的抗血小板治疗的发展趋势是指南与临床实际情况相结合,缺血与出血评估系统相结合,循证医学研究与临床经验相结合,最终治疗方案受益与风险相结合,以达到患者最大利益化。

urban 是0~1变量,也作为模型的参数部分。1 230人中有1 005人居住在城市。

本共识将从条件保障、人员培训、并发症防治和患者管理等方面,多角度推荐经尿道前列腺等离子电切的安全共识,希望能为该术式在中国前列腺增生患者中的安全应用提供参考。

由图1、图2可得:abil 与lwage 可能存在线性关系,可作为模型的参数部分,exper 、educ 、fatheduc 和motheduc 可作为模型的非参数部分的变量。

3 模型求解

3.1 参数模型

首先,对lwage 及其影响因素建立模型Ⅰ—多元线性参数模型,表达式如下:

社区是生活在同一地域范围内的人们组成的社会生活共同体[3]。我国社会学家费孝通先生认为,社区建设是建设一个守望相助、尊老护幼、知礼立德的高尚精神文明的过程,也是社区居民共同营造和睦家风、安居乐业、其乐融融的美好生活环境的过程。“社区教育是在一定地域范围内,充分利用各类教育资源,旨在提高社区全体成员整体素质和生活质量,促进区域经济建设和社会发展的教育活动。”[4]

lwage ~exper +urban +educ +abil +fatheduc +motheduc

将空间区域Ω内任一点均投影到圆柱面r=r0上,就得到空间区域 Ω在圆柱面 r=r0上的投影区域 D(θ,z)。

(5)

可加模型扩展了线性回归模型:

在显著性水平α =0.05下,父母受教育年限的回归系数不显著,说明其对个人收入对数的影响可能是非线性的,其他变量的回归系数均显著,且与收入对数成正相关。

表1 参数模型回归系数估计及检验

注:**表示极为显著,*表示显著。

3.2 半参数广义可加模型

由模型Ⅰ的结果可得,abil 、educ 、exper 和urban 对lwage 的影响是线性的,作为线性项。而fatheduc 和motheduc 对lwage 的线性影响不显著,作为非参数项,建立模型Ⅱ—半参数广义可加模型,表达式如下:

lwage ~abil +exper +educ +s (fatheduc )+s (motheduc )+urban

(6)

用R软件对模型Ⅱ式(6)参数项和非参数项进行估计[6],结果分别见表2和表3。

表2 模型Ⅱ参数部分估计结果

注:**表示极为显著,*表示显著。

由表3可得,在显著性水平α =0.05下,截距项和参数项都是显著的,说明模型参数部分拟合效果较好。截距和四个参数的系数都是正值,其中,educ 与urban 对lwage 的影响相对较大,而abil 和exper 的影响相对较弱。

表3 模型Ⅱ非参数部分估计结果

注:**表示极为显著。

对比表3和表1,父母的受教育年限对个人收入对数的非参数效应大于参数效应,对应的p 值表示平滑函数是否显著地减少了模型误差。fatheduc 的影响强于motheduc 的影响,motheduc 的非参数效应不是很显著。fatheduc 对lwage 的非线性影响具体见图3。

图3 半参数广义可加模型中父母受教育年限因素的非参数效应

图3表明,在该半参数广义可加模型中,fatheduc 对lwage 的影响不是单增或单减。当fatheduc 较低时,lwage 随着fatheduc 的增大而减小;当fatheduc 大于5且小于18时,lwage 随着fatheduc 的增大缓慢增长,当fatheduc 大于18时,lwage 有减小趋势。而motheduc 对lwage 的影响相对较单一,影响整体呈负向。当motheduc 低于8时,lwage 随着motheduc 的增大而快速减小;当motheduc 在8到15之间时,lwage 有很缓慢的增长趋势;当motheduc 大于15后,lwage 又出现下降趋势。

4 结 语

本文将半参数回归与广义可加模型结合,并应用到居民个人收入的研究中。结果表明,在影响个人收入的诸因素中,个人能力、受教育年限、潜在经验、居住在城市对居民个人收入的影响是参数效应,且均为正向效应。其中受教育年限和城乡因素对收入的影响相对较大,而个人能力和潜在经验影响相对较小。而父母受教育年限对收入影响是非参数效应,不同教育年限对收入影响趋势不同。父母受教育年限小于5年,对收入影响均呈现不同程度的负效应;当受教育年限为10~15年时,父亲受教育年限对收入的正向影响大于母亲。

这是一辆丝毫不会妥协的跑车,它的每一处细节都是对最终极运动性能的诠释,这其中最为典型的就是其所配备的空气动力学套件。除此之外,自然吸气V10发动机的嘶吼以及油门踏板的响应也令我陶醉其中,不能自拔。毋庸置疑,它是整个车队中最具魅力的,虽然并不好驾驭。

参考文献:

[1]郭兴翠.半参数回归模型的估计方法和模拟分析[D].长沙:中南大学,2007:1-2.

[2]ENGLE R,GRANGER C W J,JOHN R,et al.Semiparametric estimates of the relation between weather and electricity sales[J].J Am Stat Assoc,1986,81(394):310.

[3]HASTIE T,TIBSHIRANI R.Generalized Additive Models[J].Statistical Science,1986,1(3):297-310.

[4]李子奈,叶阿忠.高等计量经济学[M].北京:清华大学出版社,2000:122-129.

[5]刘强,裴艳波,张贝贝.R语言与现代统计方法[M].北京:清华大学出版社,2016:177-180.

[6]向伟,宁魏青,王建平,等.广义可加模型在出生缺陷影响因素分析中的应用及R语言实现过程[J].中国妇幼保健,2014,29(29):4711-4715.

Analysis of Influencing Factors of Residents ′Personal Income :Based on Semi -parametric Additive Model

DIAO Haitao

School of Applied Mathematics,Nanjing University of Finance & Economics,Nanjing 210023,China

Abstract : In this paper,semi-parametric regression and generalized additive models are combined to study the influencing factors of residents′ personal income.The results show that factors such as ability,education,potential experience and whether living in the urban areas have positive parametric effects on the influence of personal income and the years of education for the parents is a non-parameter effect.By comparing parameter models and semi-parametric generalized additive models,the empirical results show the latter is more competent and practical.

Key words :Semi-parameter;Generalized additive model;Residents′ personal income

中图分类号: O213.9

文献标识码: A

文章编号: 1673- 2006( 2019) 10- 0068- 04

doi :10.3969 /j.issn.1673-2006.2019.10.017

收稿日期: 2019-02-27

基金项目: 国家社会科学基金项目(16BTJ030) ;江苏省研究生科研创新计划项目(KYCX17_1206)。

作者简介: 刁海涛( 1994—),女,山西大同人,在读硕士研究生,研究方向:应用统计与经济建模。

(责任编辑:李耀红)

标签:;  ;  ;  ;  

基于半参数广义可加模型的居民个人收入影响因素分析论文
下载Doc文档

猜你喜欢