运用ARIMA模型预测江岸区恶性肿瘤死亡率的变化趋势论文_朱慈华1,丁彦培1,叶波2,冯仁杰2,马露2(通讯作

朱慈华1 丁彦培1 叶波2 冯仁杰2 马露2(通讯作者)

【摘 要】 目的 了解2003-2013年江岸区恶性肿瘤死亡现况及其变化趋势,预测江岸区2014年的恶性肿瘤死亡率,探讨ARIMA模型(自回归移动平均模型)在恶性肿瘤死亡预测中的应用。方法 运用时间序列分析法对江岸区2003-2013年恶性肿瘤死亡数据进行分析并建立预测模型,通过模型识别、参数估计与模型诊断选择最优预测模型。结果 2003-2013年江岸区恶性肿瘤年均死亡率为174.37/10万,且存在上升趋势。建立模型ARIMA(0,1,1)(0,1,1)12,其拟合度和预测效果较为理想。结论 ARIMA模型能较好的模拟江岸区恶性肿瘤的死亡趋势,可用于短期预测和分析。

【关键词】 ARIMA模型; 时间序列分析; 恶性肿瘤; 死亡率

Application of ARIMA model in predicting the cancer mortality in Jiang'an district, Wuhan

【Abstract】 Objective Applying ARIMA model to explore the cancer mortality trend in Jiang'an district from 2003 to 2013 and predict numbers of deaths from cancer up to 2014. Methods In this research, we used a time series analysis of cancer death rates from 2003 to 2013 in Jiang'an district and established ARIMA model based on model identification, estimation and verification of parameter, and analysis of the fitting of model. Results From 2003 to 2013 in Jiang'an district, there was an overall upward cancer morality trend and the annual average of cancer mortality was 174.37 per 100 000. Besides, ARIMA (0,1,1) (0,1,1)12 model can be used as the optimal model due to its high forecasting accuracy. Conclusion ARIMA (0,1,1) (0,1,1)12 model can be employed to simulate cancer mortality trend in Jiang'an district and it is a predicted model of high precision for short term forecast.

【Key words】 ARIMA model; Time series analysis; malignancy; mortality

世界癌症报告显示,恶性肿瘤是全球发病和死亡的主要原因,并且在今后二十年里其发病率将持续上升[1]。我国恶性肿瘤死亡率已居城市居民死因的一顺位[3],且以每年1%的速度递增[2]。江岸区为武汉市的中心城区,为了解该辖区近十年的恶性肿瘤死亡趋势,本文以2003~2013年死因监测数据为基础,运用求和自回归滑动平均模型法(auto aggressive integrated moving average, ARIMA)对居民恶性肿瘤死亡率进行拟合及预测,为开展恶性肿瘤综合防治工作提供依据。

资料来源

恶性肿瘤死亡数据来源于《中国疾病预防控制信息系统》中的《死因登记报告信息系统》, ICD-10编码C00-C96.1。人口资料来源于武汉市江岸区公安分局。

武汉市江岸区为国家疾病监测点,以户籍人口为监测对象,采用国际疾病分类ICD-10进行编码,由社区卫生服务中心死因监测员负责上报后再经区级、市级疾控专业人员进行审核,并于每年年底进行漏报调查。该区2003-2013年报告死亡率为627.84/10万-698.90/10万,编码准确率达98%以上,符合国家要求的标准,说明该区死因监测工作稳定、死亡数据可靠。

分析方法

采用SPSS17.0软件中ARIMA模型对江岸区2003年1月-2013年12月恶性肿瘤死亡率进行拟合并建模,再用模型对2014年的恶性肿瘤死亡情况进行预测。

1.ARIMA模型的基本原理:将预测对象随时间推移而变化的数据序列作为一个随机序列,以时间t综合代替各种影响因素,建立时序模型,达到预测未来的目的,过程简便,短期预测精度较高。

2.ARIMA建模的基本步骤:原始资料的平稳性判断、序列的平稳化处理、模型的定阶与参数估计和模型的检验及预测分析。

2.1 原始资料的平稳性判断。通过原始数据的时间序列图来判断序列的平稳性。对平稳时间序列,采用Box-Jenkins模型识别方法建立模型,若为白噪声序列则终止分析。

2.2 序列的平稳化处理。对非平稳的原始序列通过差分的方法将其转化为平稳序列。

2.3 模型定阶与参数估计。根据残差序列的自相关和偏自相关图,确定非季节差分阶数d和季节差分阶数D。并对识别阶段提出的粗模型参数估计并进行假设检验。

2.4 模型的检验。对所建的ARIMA模型是否合理需要检验残差序列是否为白噪声序列。若残差序列不是白噪声序列,则重复上述建模过程,直到残差序列是白噪声序列为止。

2.5 预测分析。用选定的模型对下一年的各月恶性肿瘤死亡率及可信区间进行预测。

结 果

1.恶性肿瘤死亡情况 2003-2013年江岸区居民恶性肿瘤年均死亡率为174.37/10万,男性(219.67/10万)高于女性(129.17/10万),差异有统计学意义(χ2=860.238,P<0.001)。从图1可以看出,2003-2006年恶性肿瘤死亡率略呈下降趋势,2008-2011年呈一定的上升趋势,2011年后又有所下降。

讨 论

时间序列分析重点考察变量在时间方面的发展变化规律,并为之建立数学模型,其实质上就是根据随机序列的样本取值,对未来某一个时刻的随机变量进行估计。其中ARIMA是目前最常用的时间序列分析预测方法,已被广泛应用于预防医学的各个领域[4,5 ,6]。恶性肿瘤的影响因素较为复杂,可能与不良生活习惯、空气污染、室内化学物理放射性污染、职业危害接触等有关[7,8 ,9 ,10],但是难以找到主要影响因素。运用ARIMA模型即可克服此困难,将多种因素的综合效应统一蕴涵于时间变量中进行分析,并预测短期内的发展趋势。

从本次研究结果可见,2003-2013年武汉市江岸区居民恶性肿瘤死亡率由165.44/10万上升至188.52/10万,并在2011年达到顶峰。男性恶性肿瘤死亡率明显高于女性,与全国报道一致,提示应重点加强对男性恶性肿瘤发病危险因素分析,并积极防控,增强其保健意识。江岸区2003~2013年恶性肿瘤的死亡率呈现出缓慢上升的趋势,预测短期内恶性肿瘤的死亡率仍将呈现缓慢的上升趋势。根据预测模型,2014年武汉市江岸区居民恶性肿瘤死亡率预测值与实际值拟合趋势基本一致,说明ARIMA模型预测效果较好。采用时间序列分析进行预测,样本量的大小及数据本身特点等因素都会影响预测的准确性。本研究包括2003~2013年武汉市江岸区11年的观测资料,样本量不足以用于长期预测,但从短期预测的结果来看,预测效果良好。恶性肿瘤的发病率并不具有时间平稳性,因此要得到更能反映实际情况的预测模型,需要不断的根据新的观测值来建立动态分析模型,以便更好的拟合预测恶性肿瘤的发展趋势。同时,譬如性别比例、年龄构成、不同病因等因素也会对恶性肿瘤的死亡率造成一定的影响,影响模型预测的稳定性。

综上所述,为降低该区恶性肿瘤的死亡率,应对相关资料进行深入分析,如运用此建模方式对性别、年龄别、病因别恶性肿瘤死亡率进行分析及预测,并加强恶性肿瘤危险因素的研究,有针对性地采取防控措施,从而降低恶性肿瘤的死亡率。

参考文献

[]2014年世界癌症报告http://www.who.int/mediacentre/factsheets/ fs297/zh/

[2]陈竺.全国第三次死因回顾抽样调查报告[M].北京:中国协和医科大学出版社,2008.

[3]曾红梅,郑荣寿,张思维,等.1989-2008 年中国恶性肿瘤死亡趋势分析[J].中国肿瘤,2012,34(7):525-531.

[4]陈莉.探讨ARMA模型在细菌性痢疾发病预测中的应用[J].中国卫生统计,2011,28(4):417-419.

[5]陈明惠,胡云,支洋英,等.应用ARIMA模型预测成都市新都区麻疹的发病趋势[J].现代预防医学,2012,39(2):267-269.

[6]刘刚,唐宋,孙文杰.时间序列分析法在香港结核病预测中的应用[J].中国卫生统计,2012,29(2):226-228.

[7]宫舒萍,林少倩,阮师漫,等.2012年山东省济南市居民恶性肿瘤死亡分析[J].疾病监测,2014,29(7):564-566.

[8]王国平,曾守群,何平,等.成都市温江区恶性肿瘤死亡分析[J].现代肿瘤医学,2013,21(12):2842-2843.

[9]崔策,黎明颖,胡广义.2008-2012年北京市宣武区居民恶性肿瘤死因分析[J].现代预防医学,2014,41(15):2844-2846.

[10]陈丽萍,徐奇.上海市某社区居民恶性肿瘤发病及生存率分析[J].中国慢性病预防与控制,2014,22(2):182-185.

论文作者:朱慈华1,丁彦培1,叶波2,冯仁杰2,马露2(通讯作

论文发表刊物:《中华临床医师杂志》(电子版)2016年4月第7期

论文发表时间:2016/7/18

标签:;  ;  ;  ;  ;  ;  ;  ;  

运用ARIMA模型预测江岸区恶性肿瘤死亡率的变化趋势论文_朱慈华1,丁彦培1,叶波2,冯仁杰2,马露2(通讯作
下载Doc文档

猜你喜欢