应用地理信息系统探测消化道癌症死亡率空间聚集性,本文主要内容关键词为:消化道论文,死亡率论文,癌症论文,地理信息系统论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
收稿日期:2009-03-20; 修订日期:2009-07-06 文章编号:1000-0585(2010)01-0181-07
1 引言
目前在绝大多数国家癌症均呈明显上升趋势,对人类的健康造成极大的危害[1]。我国自20世纪70年代以来,恶性肿瘤死亡也呈明显上升趋势,目前已成为威胁我国居民的主要死亡原因之一。影响癌症发生的危险因素是复杂的,主要表现为外界环境因素和人体内遗传因素相互作用的结果[2],不同个体由于基因差异会导致在相同外部环境下肿瘤发病几率的差别。但从总体上看,环境因素对某些肿瘤的发生更为重要。环境致癌学说认为,在人类恶性肿瘤病因中,约有80~90%是由环境因素引起的,尤其是消化道肿瘤多与饮食、生活习惯、环境因素有关[3]。这一学说已由一些地理流行病学和移民流行病学的研究所支持。其中主要环境因素包括空气、水、土壤、食物、职业接触、药物以及不良生活习惯等。既然大多数肿瘤是由于环境因素及不当社会行为所致,已有研究表明肿瘤是可以预防和控制的[4]。如何通过对癌症病例分布特征研究和环境危险因素监测,探索影响某种癌症发生的病因学关联是近年来一直备受关注的研究前沿。虽然个体的差异会使癌症的发生表现出一定的随机性,但各地外部因素的影响,导致癌症的发生存在某种规律性,呈现出一定程度的空间分布特性。以往癌症死亡率的分析多集中在不同年代死亡率变化趋势的研究上[5],以及通过环境中致癌物质的检测,对癌症的发病原因进行简单推断[6]。由于经典统计学模型是在观测结果相互独立的假设基础上建立的,但实际上地理现象之间大部分都不具有独立性,这种空间分布特征的复杂性使得传统的数理统计方法无法很好地解决空间数据关系问题,因此在肿瘤的空间分布研究中需要利用空间统计学分析方法[7],用以研究在空间范围中,某类肿瘤信息分布的规律性和聚集性,以及如何衡量这种聚集度等问题。本文采用空间统计学方法,利用地理信息系统空间分析工具,对研究区消化道癌症死亡病例进行空间分析,探索病例空间分布规律,为进一步开展环境影响因素研究提供科学依据。
2 资料和方法
2.1 研究区选择
根据全国第三次死因流行病学2004-2005年死因回顾性调查统计资料和在此期间开展的肿瘤死亡专题调查资料,选择某消化道癌症高发县作为研究区进行空间分析。该研究区地处平原,属温带季风型大陆气候,有主要河流及支流流经。河流上游历史上存在大量以造纸、皮革、化工、纺织、塑料等加工为主的工业企业。
图1 分村消化道癌症粗死亡率分布
Fig.1 Digestive tract cancer crude mortality rate distribution at village level
2.2 消化道癌症死亡数据
研究区包括572个行政村,本次研究共收集该县区549个村肝癌、胃癌、食管癌和肠癌四种消化道癌症年平均死亡人数,以及在此期间以村为单位的年平均人口数,其余23个行政村消化道癌症数据缺失,缺失率为4%。计算各村消化道癌症的粗死亡率,作为空间热点探测的基础。该研究区总体消化道癌症粗死亡率为127.82/10万,分村消化道癌症粗死亡率详见图1。
2.3 基础图层
选择1∶100万研究区面图层和村点图层。为保证图层能够进行准确叠加分析,图层全部采用相同的投影坐标系和地理坐标系,其中投影坐标系为World_Gall_Stereographic,单位为m;地理坐标系为GCS_WGS_1984,单位为°;大地基准为D_WGS_1984。
2.4 村边界空间定位
由于村边界在实际工作中很难获取,故本研究应用GIS软件的统计分析(Geostatistical Analyst)扩展模块Voronoi Map功能,通过Voronoi多边形方法[8]产生各个村落的范围。Voronoi图以诸多地理空间实体作为生长目标,按距离每一目标最近原则,将整个连续空间剖分为若干个Voronoi区,每一个Voronoi区只包含一个生长目标。对一个空间生长目标而言,凡落在其Voronoi多边形范围内的空间点均距其最近,即Voronoi多边形反映了其影响范围。本研究通过Voronoi方法,模拟村边界,体现出各村的临近关系,同时保证每个村面都包含一个村点。
2.5 GIS空间数据库建立
计算分村肝癌、胃癌、食管癌和肠癌死亡率以及合并4种癌症的消化道癌症死亡率。通过地理信息系统,将572个行政村进行地理定位和地理编码,编码规则与癌症病例监测数据所在村编码规则相同。将分村癌症死亡率与地理村边界通过村编码进行关联,共关联549个村,剔出缺失数据。
2.6 空间聚集性探测方法
2.6.1 空间自相关性分析法 所谓的空间自相关,是指在一个区域中,地理事物某一属性和其他所有事物的同种属性之间的关系。空间自相关的基本度量是空间自相关系数,用以测量和检验空间物体及其某一属性是否存在自相关性,即高高相邻分布或者高低间错分布。空间自相关方法按功能大致分为全局自相关和局部自相关。全局自相关描述某现象的整体分布状况,判断此现象在空间上某个尺度是否有聚集,但不能确切指出聚集在哪些地区[9]。局域自相关能检验聚集空间每个单元相对于整个研究范围而言,其空间自相关是否足够显著,从而指出研究属性在空间高高、高低、低低的分布[10]。本研究采用计算空间自相关的常用方法Moran's I法[11]。公式如下:
2.7 采用的分析工具
本研究采用Arcgis 9.2软件对图层进行处理和空间聚集性分析,详细分析流程见图2。
图2 数据分析流程图
Fig.2 Data flow chart
3 结果分析
图3 空间自相关系数图
Fig.3 Spatial autocorrelation index graph
在该研究区范围内,对4种消化道癌症进行空间自相关分析,选择有统计学显著性的结果,根据距离和在此距离内的全局自相关系数,绘制空间自相关系数图,如图3。由于癌症的死亡率是小概率事件,在人口较少的群体中,存在不稳定情况。所以根据以往癌症死亡率的监测资料,在进行热点探测中,还需考虑热点所覆盖的村人口总数要达到3万左右,才能保证死亡率的稳定[16]。所以本研究选择空间聚集尺度的原则是保证聚集区人口在3万人左右的前提下,选择空间自相关系数最大。根据上述空间探测标准,选择在2000m和4300m尺度进行空间热点探测,探测结果见图4、图5。其中红色代表对G*i进行Z-score检验得分大于2.0的区域,认为该区域存在空间高值聚集。综合上述因素,最终选择4300m作为该县消化道癌症空间聚集尺度,其中Moran's I=0.051,Z Score=5.12,P<0.01。在此尺度内,共发现3个聚集区,包括的村庄和人口数详见表1。
图4 2000m局域空间热点探测
Fig.4 Local spatial hotspot detection within 2000 m
图5 4300m局域空间热点探测
Fig.5 Local spatial hotspot detection within 4300 m
4 讨论
本研究采用空间自相关和空间热点探测方法,对研究区消化道肿瘤的死亡率进行空间分析,确定在4300m尺度存在3个聚集区。但该尺度下的空间相关系数虽然在统计学上存在显著性(Z Score=5.12),即消化道癌症存在空间上的正相关,但自相关系数却较小,仅为0.05。考虑到该县本身就是全国消化道肿瘤的高发县以及癌症发生的复杂性原因,使研究区内部的相关性表现得相对较弱,但结果仍可用于进一步开展相关研究,如环境采样、人群监测等提供参考[13]。同时,该方法也可用于其他研究区或者更大范围的空间聚集性探测。
在使用空间分析方法的同时,需要结合具体业务知识,对探测的参数进行调整,对结果进行合理解释。在一定空间范围,通过不同尺度的空间探测,可能会发现多个距离具有统计学的显著性意义,同时存在正的空间自相关。但如果只按照自相关性最高作为唯一判定标准,可能并不体现病例的空间分布规律。本研究中存在个别村人口不足1000人,死亡1例就会出现较高的死亡率,虽然在小尺度存在较高的空间自相关性,但却受随机因素影响较大,不易作为空间的聚集热点。
由于简单的死亡率空间分布往往由于数量范围的分类不同而对研究者产生一些不确切、无法度量的结果。空间热点分析采用空间统计学的方法可以定量地探测病例在不同地区的自相关性,从深层次揭示病例空间分布的规律。鉴于癌症的影响因素非常复杂,所以在了解癌症病例的空间分布规律后,可进一步对高发地区和低发地区进行相关的病例对照研究、队列研究和生态学研究,包括人群生活方式、环境污染状况、遗传等因素分别进行调查和比较。如果能排除部分因素造成的影响,则能发现引起病例空间聚集的主要原因。
本研究的不足之处在于仅通过空间各种尺度探测结果进行比较来确定热点的空间尺度,但没有考虑在进行空间探测前,对相邻村进行多维度的融合,形成癌症死亡率相对稳定的新行政区划,同时对该区划进行年龄别标化,再进行空间热点分析。这样能更准确地描述癌症死亡率的空间分布规律。
空间统计学是近20年才被逐渐认识的一个重要的分支,但它的作用和重要性正随着其广泛应用而日益受到重视[17]。公共卫生领域80%以上的数据都具有地理属性,很多疾病都与地理因素有关,存在空间的差异性分布。所以空间统计学与传统的医学统计学相结合,必将对公共卫生领域的各类研究提供更加丰富的方法学支撑。