Gamma回归模型中岭估计的几种改进岭参数
左卫兵, 钱 莉
(华北水利水电大学 数学与统计学院, 河南 郑州 450046)
摘要: 针对Gamma回归模型的复共线性问题, 基于HOERL和KENNARD等人的工作, 提出了岭估计的几种新的岭参数. 在最小均方误差的准则下, 采用蒙特卡罗模拟法验证了岭估计和所提出的岭参数的优良性.
关键词: Gamma回归模型; 岭估计; 岭参数; 均方误差
0 引言
在汽车保险索赔、流行病学、经济和社会研究等实际数据分析问题中, 经常会遇到类型变量、计数变量等数据, 宜采用广义线性模型进行分析. 广义线性模型是一般线性模型的推广, 由NELDER J A等在文献[1]中提出. 在广义线性模型中, 当响应变量服从Gamma分布时, 称之为GRM (gamma regression model, Gamma回归模型)[2]. 在实际应用中, 解释变量往往存在复共线性; 文献[3]、文献[4]说明当存在复共线性时, 采用MLE(maximum likelihood estimation, 极大似然估计)估计广义线性模型的回归系数, 会使得估计不稳定且具有很大的方差.为了解决复共线性问题, 学者们提出了许多改进的方法. 在一般线性模型中, 文献[5]提出的岭估计法被认为是替代MLE最好的一种. 针对广义线性模型, 文献[1]提出了广义线性模型的MLE, 文献[6]将岭估计推广到广义线性模型上. 在岭估计中, 岭参数的取值决定着岭估计性能的优劣; 文献[7]表明在GRM中没有一致确定的最佳岭参数.文献[8-10]等提出了不同形式的岭参数, 并证明都明显优于MLE. 本文针对GRM中存在的复共线性问题, 在文献[5]的基础上研究岭参数的取值; 基于文献[8-10]所提出的岭参数, 提出了6种新的岭参数取值方法, 通过数值模拟,证明了所提出的6种新岭参数的优良性.
1 基本理论
1.1 Gamma回归模型
Gamma回归模型(GRM)[2]
综上所述,aEEG是一种简易可行且准确性高的神经监护方法,急性胆红素脑病的足月新生儿aEEG监测结果有异常表现。联合aEEG及BIND评分可为评估足月新生儿重度高胆红素血症脑损伤神经系统预后的评估提供参考价值,协助胆红素脑病分级,早期指导临床进行神经系统干预,并对其远期神经系统不良预后有较大的预测价值。
①
②连接函数:g (U )=Xβ ,U =E (Y ),
其中, (Y i ;X i1 ,X i2 ,…,X ip )(i =1,2,…,n )为响应变量Y 与解释变量X n×p 的第i 个样本的观测值;Y i 相互独立,β p×1 是未知的回归系数向量;U n×1 =(μ 1,μ 2,…,μ n )′是响应变量Y 的数学期望,φ 是离散参数. 本文采用对数连接函数g (μ i )=lnμ i .
在广义线性模型中, 通常采用极大似然估计(MLE)来估计模型的参数值, GRM中①式的对数似然函数可写作
其中与β j 无关. 对对数似然求极值可得MLE, 即
(1)
For impedance matching, the equivalent input impedance of port 2 also should be satisfied as follows,
(2)
信息时代是开放的时代,科研范式正在变革,学术期刊应做好准备,迎接新的机遇和挑战。为此,图书馆学情报学期刊联合发起倡议:
(3)
其中,
相应地,
每次迭代中和Z 均由确定[12]. 给定初值由(3)式可求得收敛时的极大似然估计进而得到GRM极大似然估计的均方误差
(4)
其中,λ 1,λ 2,…,λ p 是的特征值, 由特征值构成的标准正交阵记为D p×p =(d 1,d 2,…,d p ); 由特征值构成的对角阵记为Λ =diag(λ 1,λ 2,…,λ p );α j 为向量的第j 个元素.
1.2 GRM的岭估计
其均方误差为
(5)
GRM的岭估计定义为[7]
(6)
其中,
第一,以邓小平为核心的第二代党中央领导集体在和平与发展成为时代主题这一特定历史条件下,总结历史经验,结合中国实际,进一步创新和发展了中国共产党的群众史观。其重大创新在于明确提出了判断社会主义改革开放是非得失的标准——“三个有利于”标准。强调要不断改善人民的物质文化水平,就必须首先发展社会生产力,而发展社会生产力的根本目的是人民富裕和人民幸福;国家综合国力表现为国家利益的维护和实现,而国家利益又是人民最高利益的体现,要不断增强国家的综合国力,就必须首先最大限度地满足人民群众不断增长的物质文化的需要。可以看出,“三个有利于”的判断标准其根基和精神内核还是人民群众观。
2 Gamma回归模型的改进岭参数
HOERL和KENNARD在1970年提出岭估计,并建议取这里取φ ),故可取在此基础上,很多学者针对一般线性模型,提出了各种形式的岭参数.文献[7]证明了在GRM中,∃k *>0,∀k ∈(0,k *)时,使得当k 在附近时,可以达到最小值,其中,GRM中的几种岭参数(K 1~K 3)由以下形式给出:
由于(2)式为非线性方程组, 因此采用Fisher标分法[11]求解得到MLE第r +1次迭代的估计值,
奖惩机制不完善是企业全面预算管理工作在开展过程中遇到的主要问题。因此,企业要加强对奖惩机制建立工作的重视,结合全面预算管理工作涉及的各个领域,综合员工的工作状态和工作积极性等因素,建立科学的奖惩机制,使员工加强对预算工作的重视。同时企业在经营过程中还可以将预算执行状况和员工的经济效益以及部门效益结合起来,利用奖惩结合的手段,合理开展各项预算管理工作,提高员工参与预算管理工作的积极性,推动企业全面预算管理工作合理开展。企业还要加大对于新人才的重视,及时引入高素质人才,推动其不断完善全面预算管理模式,调动员工的工作积极性,将全面预算管理工作的各项要求落实到实处,提高企业的经济效益。
(7)
2)LAWLESS和WANG在1976年提出一种新的岭参数
(8)
3)DORUGADE在2014年提出的岭参数
(9)
在此基础上, 本文提出一种新的岭参数K 4, 并基于上述几种岭参数提出了岭参数的几种新的形式,
(10)
K 5=mean{K 1,K 2,K 3,K 4},
(11)
K 6=median{K 1,K 2,K 3,K 4},
(12)
K 7=max{K 1,K 2,K 3,K 4},
(13)
K 8=Geometric mean{K 1,K 2,K 3,K 4},
(14)
K 9=Harmonic mean{K 1,K 2,K 3,K 4}.
(15)
3 Monte Carlo模拟
为了证明由Fisher迭代法求得的岭估计优于MLE,所提出的岭参数优于其他岭参数, 本文在最小均方误差准则下, 采用Monte Carlo法进行数值模拟[13]. 计算N 次重复实验下的平均均方误差
(16)
其中为第t 次重复实验中β 的估计值;N 取1 000次.
1)HOERL和KENNARD在1975年提出广义线性模型的岭参数
3.1 实验设计
首先生成存在复共线性的解释变量x ij ∶x ij =(1-ρ 2)1/2ε ij +ρε ip ,i =1,2,…,n ;j =1,2,…,p ,其中,ε ip 代表独立的标准正态伪随机数;ρ 为解释变量间的相关系数, 分别取0.80, 0.90和0.99; p 为解释向量的维数, 分别取4和6; 产生服从Gamma分布的响应变量. μ i =E (y i )=exp(β 1x i1 +β 2x i2 +…+β p x ip ),i =1,2,…,n ;j =1,2,…,p ;β j 满足模拟中较为常见的限制条件这里令β j =p -1/2; 离散参数φ 分别取值为0.25, 0.50和0.75; 样本量n 分别取20, 50和80. 计算各岭参数下的均方误差, 借助R 软件探讨岭估计和所提出的6种岭参数均方误差的特征规律.
3.2 模拟结果
因为产生的标准正态伪随机数与n ,p 有关, 不同值下产生的随机数有差异, 因此分以下几种结果讨论,其中, 单位‰表示均方误差模拟值为表中结果的千分之一. 从表1至表6均方误差的模拟结果可以看出:
在旅游服务类,洪江古商城的实景表演、导游讲解及古装拍照增加旅游体验的趣味性与知识性。黔阳古城的风味小吃,如春卷、绿豆粉是其显著特色。高椅古村傩堂戏、黑米等特色民俗和物产为旅游者带来新鲜体验。荆坪古村的农家乐、棋牌娱乐活动丰富了旅游者旅游体验。
1)利用Fisher标分法, 迭代求解的岭估计RK 1~RK 9的均方误差均小于等于MLE ,岭估计优于极大似然估计,所提出的6种岭参数可以有效地克服复共线性.其中,RK 7具有最小的均方误差;相对于已知的3种岭参数K 1~K 3,所提出的新岭参数K 4总是具有最小的均方误差,明显优于已知的3种岭参数K 1~K 3.
2)固定离散参数φ 值不变,随着相关系数ρ 的增大,各估计的均方误差迅速增大,尤其当ρ =0.99时,所有估计产生较大的均方误差,而所提出的岭参数K 4可以有效地克服复共线性.
3)固定相关系数ρ 不变的情况下,随着离散参数φ 的增大,所有估计的均方误差成倍增大,因此研究离散参数φ 的估计和取值也十分有意义,且φ 值越大,所提出的参数优良性越明显.
4)随着样本量n 的增大,所有估计的均方误差整体大幅下降,尤其当n =80时,所有估计的均方误差变得很小,且各岭参数的差异不明显.
这一类型的求美者也是在整形机构中最常见最普遍的,并且其中大部人本身也具有较好的面容。所谓利益推动,是指此类型的女性求美者即将或已经处于服从于社会秩序安排下的人生新阶段,不同阶段的理性利益需求推动她们自然而然地加入整容实践。比如即将升学、工作、谈恋爱的年轻学生,以及从事某些对外表要求较高的职业的年轻女性。在她们看来,通过整容提升自己的外貌对自己的生活是极具价值与意义的。好看的外表能够增强自身的竞争力,为她们带来新的优势与资源,成为打开新世界大门的钥匙。
表1 9种岭参数的均方误差模拟结果( n =20, p =4)/‰
Tab.1 Mean square error simulation results of 9 kinds of ridge parameters ( n =20, p =4)/‰
表2 9种岭参数的均方误差模拟结果( n =20, p =6)/‰
Tab.2 Mean square error simulation results of 9 kinds of ridge parameters ( n =20, p =6)/‰
表3 9种岭参数的均方误差模拟结果( n =50, p =4)/‰
Tab.3 Mean square error simulation results of 9 kinds of ridge parameters ( n =50, p =4)/‰
表4 9种岭参数的均方误差模拟结果( n =50, p =6)/‰
Tab.4 Mean square error simulation results of 9 kinds of ridge parameters ( n =50, p =6)/‰
表5 9种岭参数的均方误差模拟结果( n =80, p =4)/‰
Tab.5 Mean square error simulation results of 9 kinds of ridge parameters ( n =80, p =4)/‰
表6 9种岭参数的均方误差模拟结果( n =80, p =6)/‰
Tab.6 Mean square error simulation results of 9 kinds of ridge parameters ( n =80, p =6)/‰
4 结论
为了解决Gamma回归模型中的复共线性问题, 本文针对岭估计, 提出了6种新的岭参数. 在最小均方误差的准则下, 通过数值模拟验证了岭估计优于极大似然估计, 所提出的岭参数K 4和K 7优于其他岭参数.
供应链金融蕴藏着巨大的潜力,有发展空间。预计在2020年市场达到15万亿元的规模。统一协调每一个企业之间的办公系统,让更多的企业信息系统完成统一配置,减少企业之间的信息不统一,减少信息摩擦,降低成本,加强企业之间的合作,尽量真实的展示贸易信息,真实的反馈经营情况,使企业之间建立好良好的关系。
参 考 文 献
[1] NELDER J A, WEDDERBURN T W M. Generalized linear models[J]. Journal of Royal Statistical Society(Series A), 1972, 135: 370-384.
[2] ALGAMAL Z Y. Shrinkage estimators for gamma regression model[J]. Electronic Journal of Applied Statistical Analysis, 2018, 11(1): 253-268.
[3] ASAR Y, GENC A. New shrinkage parameters for the Liu-type logistic estimators[J]. Communications in Statistics-Simulation and Computation, 2015, 45(3):1094-1103.
F, ÖZKALE M R. Liu estimation in generalized linear models: Application on gamma distributed response variable[J]. Statistical Papers, 2016, 57(4):911-928.
[5] HOERL A E, KENNARD R W. Ridge regression: Biased estimation for nonorthogonal problems[J]. Technometrics, 1970, 12(1):55-67.
[6] SEGERSTEDT B. On ordinary ridge regression in generalized linear models[J]. Commun Stat Theory Methods, 1992, 21(8):2227-2246.
[7] AMIN M, QASIM M, AMANULLAH M, et al. Performance of some ridge estimators for the gamma regression model[J/OL]. 2017-12-04[2018-12-04].Statistical Papers, https://doi.org/10.1007/s00362-017-0971-z.
[8] HOERL A E, KENNARD R W, BALDWIN K F. Ridge regression: Some simulation[J]. Commun Stat Theory Methods, 1975, 4:105-123.
[9] LAWLESS J F, WANG P. A simulation study of ridge and other regression estimators[J]. Commun Stat Theory Methods, 1976, 14:1589-1604.
[10] DORUGADE A V. New ridge parameters for ridge regression[J]. J Assoc Arab Univ Basic Appl Sci, 2014, 15:94-99.
[11] 梅长林, 王宁. 近代回归分析方法[M]. 北京: 科学出版社, 2011: 56-67.
[12] AMIN M, ULLAH M A, ASLAM M. Empirical evaluation of the inverse Gaussian regression residuals for the assessment of influential points[J]. Journal of Chemometrics, 2016, 30(7):394-404.
[13] MCDONALD G, GALARNEAU D. A Monte Carlo evaluation of some ridge-type estimators[J]. Journal of American Statistical Association, 1975, 70(350): 407-416.
Several Modified Ridge Parameters of Ridge Estimation in Gamma Regression Model
ZUO Weibing, QIAN Li
(College of Mathematics and Statistics ,North China University of Water Resources and Electric Power ,Zhengzhou 450046,China )
Abstract : On the problem of multicollinearity in gamma regression model, several new ridge parameters of ridge estimation are proposed based on the work of HOERL and KENNARD, et al. Under the criterion of minimum mean square error, Monte Carlo simulation is used to verify the superiority of ridge estimation and the proposed ridge parameters.
Key words : gamma regression model; ridge estimation; ridge parameter; mean square error
收稿日期: 2018-12-17
基金项目: 河南省基础与前沿技术研究计划(152300410112)
作者简介: 左卫兵(1976—),男,河南内黄人,华北水利水电大学数学与统计学院教授,硕士生导师,主要研究方向:数理统计;
通信作者: 钱 莉(1995—),女,河南新密人,华北水利水电大学数学与统计学院硕士研究生,主要研究方向:数理统计.
doi: 10.3969/j.issn.1007-0834.2019.02.001
中图分类号: O212.1
文献标志码: A
文章编号: 1007-0834(2019)02-0001-06
标签:Gamma回归模型论文; 岭估计论文; 岭参数论文; 均方误差论文; 华北水利水电大学数学与统计学院论文;