地理学理论研究和科学分析的一般方法探讨,本文主要内容关键词为:地理学论文,理论研究论文,科学论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:K90 文献标识码:A 文章编号:1000-0690(2009)03-0316-07
1 引言
近代科学方法有两个基本构成:一是世界图景的数学处理,二是经验和实验[1]。因此之故,传统科学形成两个互补的分支:理论试图建设各种数学模型;实验和经验观察工作则是测试理论,检验模型的解释能力和预言效果[2]。长期以来,在人们的心目中,标准科学研究主要就是两种方法:数学处理和系统受控实验。对这两种方法的应用水平决定一门学科的总体地位[3]。随着计算机模拟技术的发展,模拟实验在科学研究中的地位日渐突出。因此,有人指出,如今有三种科学研究方法,即数学理论、实验室实验和计算机建模——计算机建模包括模拟实验[4]。有些思想家认为计算机模拟的兴起造就了第三类科学事业。当然,并非所有的科学家都将计算机模拟视为全新的研究工具,有人认为计算机模拟只不过是实验室实验的一种技术延伸[5]。
长期以来,地理学研究在整个科学殿堂中显得有些例外。一方面,由于地理现象的非线性和非欧几何性质,传统的数学方法应用受到局限;另一方面,由于地理系统的复杂性和不可控性,系统实验方法很难有效利用[3]。地理学家应用较多的是观测、经验和常规的统计分析等等[6,7],基础理论建设迄未取得长足的进步。幸运地是,本世纪前后,地理学遇到了前所未有的发展契机:分形几何学、仿生数学(神经网络、遗传算法、元胞自动机等)以及有关的非线性数学为我们提高了全新的数学描述工具,计算机图形学、地理信息系统(GIS)和计算数学为我们开展计算机模拟实验提供了新的手段,从而弥补了地理系统特别是人文地理系统不可实验性的不足。可以想见,地理学的研究方法正处于一种变革的境地。
然而,在地理学研究手段逐步改进的同时,也出现了一些令人忧虑的问题。重要的一点就是数学处理和模拟实验分析方法缺乏有机联系,致使理论研究得不到相应模拟实验技术的支撑,而模拟实验分析又缺乏理论思想的规范。近年来,作者注意到,在地理学家研究某种地理现象的同时,物理学家也在开展相应的研究工作[8~11]。比较而言,物理学家的研究工作不像地理学家的研究那样重视经验,但在逻辑上却显得更加严谨。本文将以城市研究为例,综合地理研究和物理研究的有关文献资料,提出地理学理论研究的“三步分析法”,这一套方法在一定的条件下可以推广到地理应用的研究领域。
2 地理研究中的数学处理和模拟实验
2.1 地理数学方法和模拟实验
科学研究的一般思路乃是:首先描述事物是如何运转的,然后再设法理解这是为什么[12]。科学描述分为定性描述和定量描述。传统的地理学主要是一种区域描述性的科学——记录地球上某地有某物[13],就像历史记录某时发生某事一样。后来地理学家不满足于简单地方志式记录和例外的研究方法,掀起了地理学的“计量”运动,从此计数思想和定量分析深入人心[14]。计量运动不仅仅是一种地理学研究方法的革命,其初衷是要改变地理学有“地”无“理”的局面。然而,矫枉过正,走向另一个极端,计量地理学家的很多研究变为有“理”无“地”的地理学[13]。定性地理学与定量地理学的地理观念长期对立,直到上个世纪90年代才出现转机[14,15]。
今天,对于绝大多数地理学家而言,定性描述抑或定量分析已经不再成为一个问题——定性地理学家越来越重视定量手段的运用,定量地理学家也越来越重视研究成果中人文意义的挖掘和地图表现手段的展示[14]。问题是如何将定性分析和定量研究有效结合,集成一体,以及如何采用更为有效的数学描述方法和定量分析手段。有人指出,最近十多年来,计量地理学的发展具有三个明显的特征:局部化、可视化和计算化[16-18]。相对于上个世纪的地理计量分析,如今的地理学定量研究至少具有两大变化:一是因为计算机技术的发展而使得数据处理能力提高和精度加强,二是科学理论的发展而使得地理系统的性质变得更为明确,从而理论建设的困难程度相对降低。
当我们对地理事物进行适当描述——定性的或者定量的、文字的或者数学的、形象的或者抽象的——之后,就要设法理解其运行机理。简而言之,在刻画地理系统的行为特征之后,就应该进一步揭示其支配规则和因果关系。在不能开展系统受控实验的情况下,计算机模拟是寻找地理系统演化机制的分析手段之一。
计算机模拟实验在西方地理研究中的地位日益显得突出和重要。模拟实验过程,本质上是一种计算过程。一般的计算机模拟思路大致如下:(1)规划一个地理系统——例如一个城市所在的区域;(2)构建系统的行为规则,写出相应的数学表达即方程式;(3)将方程输入电脑,然后输入描述系统目前状况的所有数据;(4)通过相应的程序让电脑借助方程式计算出各个时段的系统状况——当我们将时段向前推移的时候,电脑模拟结果就可以作为所谓的预测分析依据了。
其实,模拟实验和数学分析都是从数学模型出发,最后的目标也完全一致,可谓是殊途同归。有人将科学的研究过程阐述如下:首先借助一个简单的数学模型描述自然界中的一类现象,然后分析这个模型——说明其“为什么”。分析的途径又有两种:一是借助纸和笔对模型开展数学分析,二是利用计算机对模型进行数值模拟实验。无论数学分析还是数值模拟,目的都是为了阐明这个简单模型的推论或者预言[5]。那么,这两种方法哪一种更为可取呢?一般认为二者各有优长:数值模拟简单、快速、直观,而数学分析则方便、简洁、优美。但是,作为一种方法,计算机模拟和数学分析并没有根本性的区别。因此,科学研究中的计算模式不能代表除了实验模式和理论模式之外的第三种模式[5]。
地理学家很少重视纯粹的数值模拟,由于长期的职业习惯形成的具象思维,他们更偏爱模拟过程的地理图像表达,因此一般以GIS如ArcInfo或者 MapInfo以及遥感(RS)分析软件为模拟实验平台。不过,无论是数值模拟,还是形象模拟,二者也不存在本质的区别。现以M.Batty的城市生长和形态演变模拟的电介质击穿模型(Dielectric Breakdown Model,DBM)为例进行说明,大致步骤如下[19]。①一步以2维栅格为基础,确定一个空间范围作为计算域;②以栅格上的粒子凝聚过程代表城市生长的格局,并采用Laplace方程描述城市形态的空间演变;③将非线性很强的偏微分方程离散化,转化为代数方程组;④借助适当的数值求解方法寻找答案,据此可以获得所界定的计算区域内场(field)分布的详细信息;⑤利用计算机图形学技术将求解过程和结果直观地展示出来;⑥参照现实中的城市演化过程,应用分形几何学的方法对模拟结果进行分维分析。
2.2 计算机模拟实验方法的局限
计算机模拟实验技术在地理学中的应用可以追溯到数十年前。以区域和城市系统的模拟实验为例,上个世纪80年代P.Allen借助耗散结构理论模拟中心地模型的对称破缺过程就是一例[20,21]。此后,Batty和Longley等基于分形思想,借助受限扩散凝聚(Diffusion-Limited Aggregation,DLA)模型和DBM模型模拟城市生长和形态,取得了一些很有意义的研究成果[22]。在城市演化模拟中,最重要的方向之一是元胞自动机(Cellular Automata,CA)模拟分析——CA被认为可能代表二十一世纪地理学的新范式[23]。实际上,分形模拟中的DLA和DBM模型本质上是最简单的CA模型[24]。分形模型和CA模拟如今已经有效地结合起来了[25]。目前看来,CA在地理学中不是一种简单的方法,而是一种模型家族和方法体系。在CA模型的基础上,人们不仅发展了地理自动机系统(Geographic Automata System,GAS),而且发展了广义的元胞空间(cellular space)模型和多重智能体系统(Multi-agent System,MAS)[26-30]。国外在有关领域的成果不断出现,国内学者也有非常突出的研究工作[29]。在应用研究如城市和区域规划研究中,CAS、MAS与地理计算(Geo-Computation,GC)逐步交融起来[30~32]。当然,上述研究工作通常需要GIS技术和遥感(RS)数据的支持。
世界上没有完美的事物,没有万能的工具。有特长则必有特短。计算机模拟可以弥补地理系统不可实验性的某些不足,但模拟实验有其自身难以克服的缺陷。这些缺点集中表现在如下方面。
第一是揭示概念的功能局限:“复杂系统的模拟具有很大的应用价值。……然而,模拟对我们在概念这一更高层次上理解系统行为规律并无助益。”[33]美国圣菲研究所(Santa Fe Institute,SFI)的科学家在计算机模拟方面大多是顶级高手,他们对各种自然现象和社会系统进行了广泛的模拟研究,其模拟能力之强令人惊叹。“然而,在那里,透过海量的数据和图像,洞悉所得的概念却相对贫乏……”[34]。城市模拟实验开展多年,有关学者也不得不承认一个现实:“城市CA模型的缺陷之一就是,在一些案例中,揭示的理论相对而言非常有限。”[35]
其二是可重复性较差。地理模拟主要是基于GIS平台,借助CA开展模拟分析。然而,自从CA规则在地理研究中逐步放松以后,整个研究失去了一定的规范,各家的模拟研究有各自的程序。这些程序所依据的规则究竟有几分可靠程度,别人很难重复操作和进行检验。科学的标准在于可重复性和可检验性[3],一项研究无法重复和接受检验,其学术意义就容易受到置疑。
其三是模拟规则的混乱。CA是一种计算能力极强的算法,其计算功能等价于图灵(Turing)机,因此模拟出各种地理图像不足为奇。当初von Neumann等人发展CA模型,原本是期望借助简单的规则揭示大千世界的复杂行为。但是,地理学家为了模拟出逼真的图像,逐渐放弃了von Neumann规则体系和邻位的定义[35],对CA的迁移转换规则有随意地放松的倾向;规则一旦乱套,模拟结果很难相互印证。因此,有人感叹,现在的地理元胞自动机模拟研究过程有时成为一种纯粹的技术设计。
无论如何,模拟实验虽然是重要的研究工具之一,但毕竟只是一种工具,这种工具必须与数学方法和理论分析有效结合、相辅相成才能真正发挥作用。当一种方法与另外一种方法协同的时候,不仅可以互补,同时也会形成一定的约束,避免个别方法的滥用。尤为重要的是,概念层次的问题有赖于理论方法。理论在科学研究中至关重要,没有理论任何经验观察和实验测定都没有可靠的保证。地理学的调研分析和模拟实验都应该在理论的指导下进行。发展模拟、实验和理论三位一体的研究模式是地理研究今后努力的方向之一[36]。
图1 地理研究的三步分析法:经验建模、理论推导和计算机模拟
Fig.1 A three-step method of geographic research:empirical modeling,theoretical derivation,and computer simulation
3 地理理论研究的一般模式
3.1 地理研究的三步分析法
在地理研究特别是人文地理学的理论过程中,数学模型与模拟实验是两个互补的方法。数学模型用于相对准确地表征复杂地理系统的逻辑关系,模拟实验则主要用于理论研究中对数学模型的检验和应用研究中的因果关系揭示与预测分析。对于不可实验的复杂系统,现代科学研究一般基于数学模型进行数值实验和模拟分析。最近10年来,西方物理学家[8~11]和理论地理学家[26~30]利用数学方法和模拟实验研究城市系统演化问题,给出了一系列成功的范例[8,10,24,26,29]。归纳起来,他们的工作大体上可以分为三步,不妨将其发展为地理理论研究的“三步分析法”。
第一步,借助地理观测数据建立数学模型并且估计参数,这种模型是一种经验模型。这是整个研究的现实基础。
第二步,构造假设,建立方程并求解。如果求解的结果给出前述经验模型,并且参数的理论预期与第一步经验模型的估计结果吻合,则完成了逻辑检验过程。否则,重新构造假设并再次建模、求解,直到得到满意结果为止。
第三步,基于第二步的假设,借助计算机编程技术开展模拟实验分析。如果模拟实验的结果与第一步的观测现象一致,则完成了“经验”的检验工作。
上述三个阶段不是各自独立的,构造假设—建模求解的过程要依据对现实观察的理解,经验建模本身就蕴涵着这种理解;模拟实验要基于建模的假设和模型表达本身,否则模拟分析失去检测意义(图1)。以城市人口的空间分布为例,观测数据表明,单中心城市人口密度一般呈现负指数分布[37];负指数分布总是与最大熵趋势有关,借助信息熵最大化构造假设,建立模型并求解,解的结果也刚好是负指数方程[38,39];最后,如果能够基于熵最大化思想对城市人口的集散规律进行模拟,且模拟的人口分布表现出负指数规律,则整个研究就完备了。当然,现实中的人口分布会有许多例外,这种例外正是地理系统复杂性的表现之一。
3.2 对上述方法的几点说明
在地理理论研究的三步分析法中,第一步是经验建模的过程,在逻辑上属于归纳分析过程,是从特殊到一般的过程;第二步是模型的理论解析过程,在逻辑上属于演绎分析过程,是从一般到特殊的过程;第三步是模型的检测过程,不属于逻辑过程,而是属于实验过程,但该过程与逻辑分析过程存在密切的联系。在一项地理研究工作中,如果上述三个步骤同时完成,将会取得令人满意的分析结果。但是,通常情况下,很难同时完成三大步骤。有时候,完成上述步骤,需要几代地理工作者的不懈努力。城市人口密度分布的负指数规律就是典型的一例。
经验建模的困难在于基础数据的提取。当年Clark提出城市人口密度分布的负指数模型即所谓Clark定律的时候,统计了欧美的20多个城市[19,37]。在当时的技术条件下,这项研究工作是颇为来之不易的。即便在遥感和GIS技术非常发达的今天,城市人口密度数据也不是唾手可得,因为一般的国家人口普查10年一次,要想利用普查资料研究一个国家的城市人口密度变化,至少要“十年等一回”。确定数据之后,模型的选择也是非常繁琐的,有时需要对数据进行技术性的处理,如细节归并、平均转换,如此等等[39~41]。
理论解析过程通常是一个漫长的分析过程。当我们从经验上选定一个数学模型之后,这个模型是否具有普适意义?如果是普适的,模型刻画的系统演化本质又是什么?所有这些,都需要开展适当的理论分析。仍以关于城市人口密度的Clark模型为例,绝大多数单中心的城市人口分布服从这种规律,但也存在例外的情况。以中国城市为例,杭州市的人口密度多年来表现出明确的负指数分布[40],但北京市的人口密度分布就复杂多了,很难采用Clark模型进行有效的描述[41]。为了明确模型的适用范围以及支配模型的物理机制,构造假设、发展理论是必要的。在Clark模型提出之后20年,西方学者借助最大熵方法导出了负指数分布[38]。但是,这还不是一个严格意义的城市人口密度模型的推导,而是从Wilson的空间相互作用模型出发,间接演绎出来的结果[33]。时间过了30年之后,严格意义的城市人口密度模型的推导过程才真正完成[39]。可是在此基础上的模拟实验研究至今仍告阙如。
如前所述,模拟实验可以分为数值模拟实验和形象模拟实验。这只是一个概略的区分,在表达上不甚严格。实际上,无论是数值模拟实验,还是形象模型实验,其最终结果都需要借助图像表现出来。对于地理研究而言,数值模拟实验的图形不必是地图,可以是坐标图、示意图等等,而形象模拟实验则是以地理图像的形式给出结果。在地理研究中,目前最为流行的是第二类模拟实验方法。但是,对于地理理论研究而言,第一类模拟实验,即所谓纯粹的数值仿真过程,也是非常重要的检测途径。
4 结束语
多年来,由于缺乏系统、有效的研究方法,地理学的理论研究落后于应用研究,学术研究落后于实践工作的需要。现在,由于数学理论、计算软件和模拟实验技术的发展,以及相关学科研究成果的启示,我们有可能形成一整套的地理理论探讨和科学分析的研究模式。这套方法虽然目前处于草创阶段,有待于今后进一步的发展和完善,但毕竟形成了初步的、具有启发意义的思路。
在上述研究过程的三个步骤分析之中,第一步涉及地理学的计量化,第二步涉及地理学的理论化,第三步涉及地理学的技术化、实验化。基于观测数据建立经验模型的技术已经比较成熟。由于数值计算方法和基于CA的地理建模技术的发展,地理学的模拟实验方法正在快速地成长起来。可是,第二个步骤,即构造假设、建立方程并求解方程,至今发展十分缓慢。任何一个经验模型,如果不经过理论推导,其普适程度和应用范围都难以明确。地理学的理论建设迟迟没有形成体系,与地理学理论建模的发展滞后不无关系。由于相关领域的推动,今后情况会有好转。问题在于,如何将经验建模、理论解析和模拟实验有机结合,完整匹配,形成综合集成的研究模式。本文建议的研究方法主要针对地理学的理论研究工作,但可以向应用研究领域适当延伸。
收稿日期:2008-06-19;修订日期:2008-10-14
标签:地理学论文; 地理论文; 计算机模拟论文; 建模软件论文; 计算科学论文; 科学论文; 工作描述论文; 数学论文; 自然科学论文;