地理计算——数量地理学的新发展,本文主要内容关键词为:地理学论文,新发展论文,地理论文,数量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:P91文献标识号:A文章编号:1001-8166(2000)06-0679-05
进入90年代以来,地理科学研究方法论的一个重要进展是数量地理学迅速向全新的地理计算学发展。对于这一发展,英国里兹大学著名地理学家Rees等[1]提供将其它定义为:应用计算技术求解地理问题的理论、方法和过程。Rees认为,地理计算的历史与计算机在科学研究中的引进和应用一样悠久,至少可以追溯到50年代末、60年代初(即地理学中的“计量革命”初期)标准主计算机(standard main-framecomputer)可被应用开始,就有了科学意义上的地理计算。只是由于受当时计算机的内存和中央处理器的运算速度的限制,面对现实地理世界的特殊规模和复杂性,当时的地理计算仅仅应用了统计的或是其他数学的方法,而这些方法早在计算机应用之前就已经存在。60年代以后,由于标量计算机(scalarcomputer)运算速度的不断提高、并行计算结构的应用,极大地提高了计算机求解地理问题的能力,推动了数量地理学向地理计算学的发展。
1 Geocomputation的词义解析
从构词来看,Geocomputation由前缀"Geo"和主词"Computation"组合而成,前者指地理计算要做什么,后者则指如何去做。但"Geo"是指“地理”、“地质”或是泛指“地学”,甚难作出定论,但可以数量地理学80年代以来发展的几个重要事件得到一些较为确切的启示。1983年,随着GIS技术在地理学中应用的不断扩展,Dobson[2]首次提出了“自动地理学”(Automated Geography),并将其定义为“描述空间性质,解释地理现象,求解地理问题的计算方法和计算技术的合理与成功应用”;90年代初,在著名理论与数量地理学家Wilson教授领衔的英国里兹大学地理学院成立了全球第一个地理计算中心(TheCenter of Computational Geography),正式启用了计算地学的词语[3.4];1994年,Openshwa[5]在应用人文地理学(Applied Human Geography)的基础上,综合提出了计算人文地理学(Computational Human Geography)的概念和研究议程;1996年,里兹大学召开了第一次国际地理计算大会,并正式定名为"Geocomputation96",或许这是“地理计算”全成新词语的第一次出现,会议组织者将会议的宗旨和新词语应用定义为“利用不断发展中的高性能计算机和计算方法,对各种求解地理问题的研究努力进行聚合”[1]1998年,在"Geocomputation98"的会议公告中,则作了进一步定义,“地理计算学代表了计算机科学、地理学、地信息学(Geomatics)、信息科学、数学和统计学的聚合和趋同”[6]。看来,Geo-computation的前缀"Geo"更多的是地理的意义而不一定是泛指意义上的“地学”概念。历次会议的组织者和与会者,如美国的Goodchild、O'Kelly,英国的Batty、Openshaw、Rees,奥地利的Fischer等都是当今最负盛名的理论和数量地理学家,他们把握了Geocomputation的发展主流地理计算的地理学色彩更加明显。
在科学意义上讲,"Comprtation"这个词可有两层意义,广义上泛指利用计算工具(计算机)。因此,任何类型的分析,无论其是定量化分析或其它形式的分析,如果以计算机为工具,都可以被描述为“计算的”(computational)。地理计算即是这种凭借计算机工具对地理学问题进行定量或非定量分析的抽象概括和综合研究。狭义上讲,计算指的是一组具体有序的“计数”(counting)、“计算”(calculating),“估算”(reckoning)或“估计”(estimating)等所有产生量化分析结果的操作运算,是一种自建设模至获取求解结果这一过程中模型运行的手段。因此,地理计算的内涵可定义为对地理学时间与空间问题所进行的基于计算机的定量化分析。
计算所描述的任何模型,无论其是广义或是狭义上的,都包含有特殊的运算对象(即运算域operand)和运算算子(operator)集合而成的某种数学表达式。对于以时空演变为特征的地理现象,其运算涉及到的运算域和算子都可以是空间的或是非空间的。空间与非空间的运算域,与运算算子所包容的空间态与非空间态相互配合与依存,构成整个地地理计算的对象与方法体系[7]。如空间运算域,可以是几何的影像地图、体积或形状;也可能是拓扑的图、单纯复形。而空间算子,可以是经典的几何变换(平移、旋转、反射、比例等),也可以是拓扑变换(伸缩、挠曲、卷迭等)。它们的组合,体现在地理模型的类型与结构上,地理计算的模型将涉及到细胞自动机、分形、形状语法(shape grammars),渗流(percolation)、L—系统,以及其它一些包含有递归模式生成的模型;而在技术方法上将体现在地理影像的几何变换、拓扑变换、地理主题的虚拟现实表现,以及包含了基本空间算子的所有基于GIS的方法。所有这些,正如Tur-ton 和 Openshaw所说,对大多数地理学家来说,很多还不太熟悉,但正是它们,构成了作为计算机科学、地理学、地信息学、信息科学、数学、统计学聚合与趋同而成的地理计算的根本。
2 高性能计算——地理计算的基础
高性能计算(High-Performance Computing)是利用基于向量或并行处理器为基础的超级计算机硬件对大容量资料,对需要进行实时分析与控制的系统,对那些复杂而又不能用其他手段来处理的现实世界(包括地理的时间、空间世界)所实施的计算。到20世纪末,超级计算机的容量与运算速度有可能是地理学60年代“计量革命”时期所用计算机的10[9]倍,是70年代初期“数学模型革命”时期的10[8]倍;比80年代中期“GIS革命”时期高10[6]倍,比基于Pentium处理器的工作站快10[3]倍,有可能比90年代初、中期以拥有521个并行处理器的Cray T3D为代表的第一代超级计算机快10[2]~10[3]倍[3]。正是以这种高性能为基础,地理环境中具有全球性或大区域性的、空演变特征的地理现象(数值天气预报、全球气候变化、GIS和RS图像解译等)模拟才有可能真正实现,原有的一些受计算机条件限制而难以模拟的模型得以完善、改进和运行,进而开始探索地理环境新的认知、新的概念。基于高性能计算的模拟成为创新、认知的工具;高性能计算成为理论、实验具有同样重要性的科学工具[3],在或是理论模型复杂,甚至尚未建立,或是因费用昂贵,而使实验无法进行的情况下,高性能计算成为求解问题的唯一有效手段。
高性能计算的实现(不仅仅在地理科学中),依赖于迅速发展的并行硬件及其相应的软件系统。前者,国外一些著名大学拥有以Cray T3D及其的新一代产品、并行虚拟计算机(Parallel Virtual Ma-chine)为代表的并行超级计算机;后者,除一些常规并行编程语言外,地理学家们实施地理计算,更多地可望借助信息通道界面(message passinginterface),利用Fortran 90编写的软件编码系统。其首要任务是要研究并实施将现存的向量和串行的地理代码,转换成能为像512个并行处理器组成的Cray T3D这样的超级计算机所接受的编码系统。为此需遵循一定的程度设计标准(MPI,Fortran 90),编制相应的运行软件,保证各种转换的顺利实现,实现利用相关编程软件系统完成那些原先因计算机性能限制而难以进行的地理模拟,拓展进行新的地理模型模拟。
高性能计算,以并行高速计算为特征,以多处理器、多计算机或分布式系统为并行计算机的互联形式。在系统的组成上,当今流行的主流并行计算机都是可扩放的并行机,包括共享存储的对称多处理器(Symmetric Multi-processors)、分布存储的大规模并行机(Massively Parallel Processors)和工作站机群(Cluster ofWorkstations)[9]。整个高性能并行运算,其应用分为计算密集型(compute-intensive)、数据密集型(data-intensive)和网络密集型(network-intensive)3大类。在地理现象研究中,像数值天气预报这样的大数据处理当属计算密集型的高性能计算应用,而像GIS的可视化计算应是数据密集型的高性能计算,至于现在正在研究发展中的GIS、GPS和RS的集成技术和应用中所涉及到的,将是计算数据和网络3种密集型高性能运算的综合,其真正意义上的实现还需作很大努力。
3 地理计算模型和方法的实践
地理计算包含了丰富的模型和方法体系,自90年代以来,原有的一些理论与数量地理学中的模型,在地理系统研究中继续广为应用并不断赋予新的内涵的同时,一些新的理论方法与模型,如神经网络模型(Neural Network)、遗传算法模型(Genetic Programming)、细胞自动机模型(Cellularautomata),模式参数随机抽样模型(Random Sampling of Model Parameters)、模糊逻辑模型(Fuzzy Logic)、改进了的地理加权回归模型(Geographically Weighted Regression)等不断被引入并成为地理计算的核心[10.12];而地理研究的实践,更多的是充分利用GIS技术,结合GPS和RS技术,以向量或并行计算器为基础的超级计算机为工具,对“整体性”、“大容量”资料所表征的地理学问题实施高性能计算,探索并构筑新的地理学理论与应用模型。这些整体性、大容量资料所表征的地理问题,在人文、经济、社会、城市地理学的相关研究中,有诸如城市中金融、交易所之间以电话为载体的信息流,在城市内核、边缘区通勤职工起讫点之间人流等的预测,有跨国大区域人口普查、人口预测、人口规划问题,有城市内部作为城市基础的生命单元的家庭、社区的类型、结构、功能、组织等的重构,有城市信息产业、信息经济发展规律、机制、扩散等的模拟,有城市不同时间、空间尺度上的形态演变动力学等,均可概略地纳入“空间互作用”、“人口与人群”、“城市动力学”三大研究主题。
3.1 空间互作用
空间互作用是地理学理论和应用研究的最重要命题,Wilson[13.14]将重力模型发展为最大熵模型,将具有双重约束(起始点和约束点)的最大熵空间互作用模型表示为:
式中T[,ij]为起始点i至终到点j的流量(人口流、信息流等),O[,i]、D[,j]分别为i和j两地的规模,C[,ij]是某种距离测度或是从i到j的运输成本,两个∑T[,ij]分别为起始点和终到点约束,利用最大似然率法或非线性最小二乘法求解β的最优化估算值。Turdon和Openshaw对英国行政区之间的通勤职工流(一个10764*10764阶的矩阵)在台式工作站上求解单约束模型[3],运算时间18小时,双约束模型运行264小时;而在转换成Cray所提供的内存共享模式(Shared Memory Model)下进行并行化处理,在工作站上需91小时才能完成的双约束模型赋值计算,在Cray T3D上缩短为171s。在对一个有2775个出发地和822个可能目的地所构成的大区域零售网络中,欲在这822个目的地中选择60个最佳区位,以使整个零售网络的效益最大化。如顾客的行为符合空间互作用模型的基本假设,那么模型可能的解将有822!/60!个,这在普通的计算机上几乎难以想象,而在Cray T3上成功实施了并行处理,有效地进行了求解。
3.2 人口与人群
作为人文地理学研究核心之一的区域人口的模型与模拟研究,在计算机技术发展的推动下,近年内集中于探索模型分辨力的提高。Rees[3.15]研究和设计的欧共体人口模型ECPOP(European CommunityPopulation),利用并行高性能计算,将模型的稳健性(robustness)和灵敏度作为一个整体进行研究、模型预测时,可同时获取预测结果和各种有关参数的置信区间。ECPOP是一个以女性出生率占优势为特征的两性别人口组群生存模型(Cohort-sur-vival),包容了欧共体成员国与欧共体外国家、成员国之间、各成员国国家内部几个层次上的人口迁移,设计了各种不同的生育率、死亡率和人口迁移率,其生育率考虑了低估算、高估算和平均水平三种方案,而迁移率则利用了零迁移、维持现今迁移率、估计经济增长条件下人口迁移率增长和逆城市化对人口迁移的可能影响等4种模型。该模型经并行处理,在256个处理器的计算机上运行约12.8万次,求解得到至2002年的欧共体人口预测及有关参数出生率、死亡率、迁移速率的上、下置信限和相应的估算标准误差,除欧共体外迁移率估算标准误差约为70%外,其它均在30%上下。该方法为研究资料不确定性在模型中的传播及相关预测结果的影响提供了基础,这在利用普通计算机或工作站的常规模型中是难以实现的。
3.3 城市动力学
城市形态生成演化的时间—空间动力学过程,即城市形态学的研究是城市地理学理论研究的新发展,与以城市景观、人居环境设计为主体的城市规划学中的城市形态学有重叠,但更多的是差异。城市地理学研究城市形态,突出人类活动、人口发展、土地利用变化、经济发展、社会进步、城市内部社会马赛克(社区)演变所导致的城市形态外延扩展的空间—时间过程的动力学机制,通过模拟,预测城市演变的未来形态。像城市形态分形特征的研究,从开始之初的研究城市体系等级规模所蕴涵的分形本质研究(即G.K.齐夫模型中的负幂指数q和帕雷托分布中的负幂指数b,极有可能就是城市体系形态分维数的表现[16.18],发展为对具体城市本身分形特征的研究。其基本的假设是:一个城市,由城市中心(CBD)向外,随径向距离增加,人口密度、土地利用、经济活动强度等亦呈负幂指数式衰减。这种衰减形式,Batty等[19]认为有可能是城市分维形态的某种表现。通过对美、英等国近10余个不同规模城市的研究,Batty[20]相信这些城市具有分形城市的共同特征,每个城市在不同历史时期分维数的差异,则有可能是城市演化内在机制演变的反映。这种分形城市的研究,其基础是作为城市内部人类活动基本单元的社区的结构、功能等演变的形式、强度及社区间的关联,是由城市宏观(体系)形态学向城市微观(本体)形态学的发展与延伸,而这只有基于GIS、RS、GPS技术,凭借高性能计算才能得以实现。
在城市形态学研究中,几乎与城市分形研究相同时,基于细胞自动机理论的城市生成、发展、演化模拟,在高性能计算的支撑下,其模拟、预测城市形态的能力,正在为越来越多的地理学家们所重视。城市细胞自动机模拟的基本假设是:城市是一个开放的自组织有机体,其生成、发展过程可类比于细胞组织的裂变与扩展。作为城市细胞基本单元的城市社区,是城市活动的高位势场所在,高位势场向外、向相邻细胞单元扩散,不断激发新的、次一级细胞单元的活动,从而推动城市核心向城市外缘的发展[22.23]。Batty、White应用细胞自动机模拟专用软件系统,利用GIS作支撑,成功地进行了城市细胞自动机形态生成模拟[21.24],国内亦有学者开始这一领域的研究工作[25]。相信,在高性能计算支撑下,城市演化动力学的研究有可能真正揭示城市演化的本质,进而预测城市的未来形态,通过模型参数调整、探索城市可持续发展的未来之路。
地理学正向整体地理学、元地理学发展,其研究的内容,无论其是自然地理的或是人文地理的,其研究的方法,无论其是定性的或是定量的,在高性能计算的时代,都将成为可能。Geocomputation理论、方法、模型等,对大多数地理学家来说,可能都还比较陌生,但正如Geomatics在经过相当长一段时间的地学领域研究的实践后才为广大地学工作者所接受那样,地理计算学也将最终为地理学家们所承认而成为地理科学殿堂中的重要一员。可以肯定,地理计算理论、方法、模型、算法的不断完善,高性能计算设备的发展和普及,地理学家们的广泛参与,终将把地理科学推向一个全新的水平。
收稿日期:1999-12-17;
修回日期:2000-05-08。